作者:Rambus研究員與杰出發(fā)明家Steven Woo
根據(jù)IDC預測,中國在人工智能領域的投資預計到2027年將達到381億美元,占全球總投資的近9%。作為全球人工智能的重要參與者,中國正加速在汽車、通信、醫(yī)療、金融等多個行業(yè)應用和發(fā)展生成式AI技術,全面邁入“AI 2.0”時代。
人工智能這一概念是由約翰·麥卡錫(John McCarthy)在1956年提出。此后數(shù)十年間,科學家們投入了巨大努力,讓AI不斷變得更智能,但其能力仍主要局限于在特定輸入輸出范圍內進行分析與預測(例如:從文本生成網(wǎng)頁結果)。而新一代人工智能則帶來了重大范式轉變——它能夠基于數(shù)據(jù)生成全新的內容。
和上一代不同,AI 2.0 依托多模態(tài)輸入與輸出,在文本、語音、代碼、圖像、視頻,甚至三維模型等多種媒介之間實現(xiàn)無縫交互。大型語言模型(LLMs)的出現(xiàn),也是這一時代的重要標志。LLMs能夠處理和生成海量數(shù)據(jù),正在不斷突破以往的技術邊界,讓更復雜、更先進的AI應用在各行各業(yè)成為可能。
訓練大型語言模型(LLMs)是一個復雜的多步驟過程,首先需要收集用于訓練的數(shù)據(jù)。數(shù)據(jù)收集完成后,還需經(jīng)過分析、處理和清理,才能進入訓練階段。如何實現(xiàn)海量數(shù)據(jù)的高速傳輸與存儲,已經(jīng)成為整個行業(yè)面臨的重大挑戰(zhàn),更不用說訓練所需的數(shù)據(jù)規(guī)模還在持續(xù)增長。以ChatGPT為例,GPT-3的參數(shù)量為1750億,而GPT-4則高達1.76萬億,幾乎所有AI公司都在不斷擴大模型的訓練參數(shù)。
在完成訓練過程后,AI模型便會生成,并可用于執(zhí)行推理。相比訓練,推理對內存的要求相對較低。然而,隨著AI逐漸普及,越來越多的應用正從數(shù)據(jù)中心向邊緣和終端延伸,這對現(xiàn)有的內存系統(tǒng)在帶寬、延遲和容量等方面提出了更高的要求。
為應對這些重大挑戰(zhàn)并解決 AI 2.0 的內存瓶頸,業(yè)界已提出了許多創(chuàng)新性技術方案,包括多路復用內存、串行連接內存、新型編碼方案以及全新的模塊形態(tài)。這些創(chuàng)新有望應用于現(xiàn)有內存解決方案,為先進的 AI 工作負載帶來更高的性能表現(xiàn)。
其中一個前景廣闊的解決方案是多路復用內存。正在進入市場的 DDR5 MRDIMMs 采用復用技術,在沿用現(xiàn)有 DRAM 的同時,有效地將數(shù)據(jù)傳輸速率提升一倍,從而突破了傳統(tǒng) DRAM 在擴展上的限制。另一種提升路徑是串行連接內存。在 CXL 技術的支持下,這一方式能夠實現(xiàn)緩存一致性的內存共享,并通過采用串行而非并行的數(shù)據(jù)傳輸,大幅提升容量與帶寬。
此外,新型編碼方案也可應用于部分內存模塊。例如,GDDR7 采用三階脈沖幅度調制(PAM3)編碼,數(shù)據(jù)傳輸速率最高可達 48Gbps,能夠支持高性能的邊緣與終端 AI 應用。模塊形態(tài)的創(chuàng)新同樣在內存容量擴展中發(fā)揮關鍵作用。低功耗壓縮附加內存模塊(LPCAMM)便是其中的典型代表,其專為在空間受限的設備(如筆記本電腦)中擴展 LPDDR 內存的性能與應用而設計。
除了性能和容量的提升之外,RAS(可靠性、可用性和可維護性)在內存領域也變得愈發(fā)重要。隨著內存芯片的數(shù)據(jù)傳輸速率不斷提高,單元尺寸持續(xù)縮小,以便在一顆芯片中容納更多比特。但單元縮小也帶來了新的挑戰(zhàn),例如芯片內錯誤(on-die errors),這就需要更強大的糾錯機制。此外,像 RowHammer 和 RowPress 這樣的現(xiàn)象——即訪問特定單元時可能干擾相鄰區(qū)域的單元——也亟需進一步的緩解策略。
還需要關注一些相關的發(fā)展。量子計算時代即將到來,現(xiàn)有的非對稱加密將面臨被破解的風險,因此無論是 AI 數(shù)據(jù)還是硬件,都需要通過新一代的抗量子加密技術(Quantum Safe Cryptography)來保護。
同時,訓練和推理AI所需的能耗問題也正日益受到關注。對此,業(yè)內各方正積極采取行動來應對這一挑戰(zhàn)。從內存角度來看,行業(yè)正持續(xù)通過降低工作電壓和優(yōu)化設計架構來提升能效。電源管理IC(PMIC)將成為在既定功耗范圍內實現(xiàn)更高性能的關鍵一環(huán)。
隨著 AI 模型日益復雜,對內存的需求也將更加嚴苛。AI 2.0將重塑各行各業(yè),從個性化體驗到行業(yè)專屬解決方案,在整個計算領域(云端、邊緣、終端)全面掀起浪潮,進而推動對更高性能內存解決方案的強勁需求。
作為業(yè)內領先的芯片與半導體IP供應商,Rambus 致力于推動數(shù)據(jù)中心互聯(lián),解決內存與處理器之間的瓶頸問題,從而支持大型語言模型(LLMs)及先進AI應用的發(fā)展。Rambus 的全方位產品組合——包括 DDR5 DIMM 芯片組、HBM3/3E 控制器 IP、GDDR7、PCIe 6.1、CXL 3.1,以及 LPDDR5T/5X/5 等——為這些高負載的 AI 工作提供所需的速度、容量與連接能力。
在 AI 2.0 的演進過程中,Rambus 在內存接口芯片、內存接口 IP 以及安全 IP 解決方案方面的專長,將成為不斷突破技術邊界的重要推動力。展望未來,Rambus 將持續(xù)攜手產業(yè)伙伴,共同開發(fā)前沿的內存解決方案,釋放 AI 技術的全部潛能。
-
內存
+關注
關注
9文章
3211瀏覽量
76377 -
Rambus
+關注
關注
0文章
67瀏覽量
19309 -
AI
+關注
關注
91文章
39810瀏覽量
301479
發(fā)布評論請先 登錄
Altair CFD 以技術賦能工程創(chuàng)新?
使用NORDIC AI的好處
AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代
BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊
愛立信展示AI賦能5G的創(chuàng)新成果
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)
睿海光電領航AI光模塊:超快交付與全場景兼容賦能智算時代——以創(chuàng)新實力助力全球客戶構建高效算力底座
【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》
SAP與亞馬遜云科技推出AI聯(lián)合創(chuàng)新計劃,打造生成式AI解決方案,助力客戶應對市場波動與供應鏈復雜性
SAP與亞馬遜云科技推出AI聯(lián)合創(chuàng)新計劃,打造生成式AI解決方案, 助力客戶應對市場波動與供應鏈復雜性
賦能AI系統(tǒng):內存創(chuàng)新助力釋放AI 2.0的強大潛力
評論