91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

內(nèi)存要取代GPU?HBM之父警告:以英偉達(dá)GPU為核心的架構(gòu)要被顛覆

Hobby觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:梁浩斌 ? 2026-04-03 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)“主板插顯卡上”,是PC DIY玩家對(duì)高性能顯卡體積越來越大的調(diào)侃,隨著顯卡功率越來越高,碩大的散熱模組讓顯卡投影面積甚至已經(jīng)大于ITX規(guī)格的主板,在PC里顯卡取代了主板和CPU成為了主角。

而最近“HBM之父”金正浩教授也語出驚人,提出未來內(nèi)存將成為主角:“GPU和CPU將會(huì)被集成到內(nèi)存(HBM和HBF)里,淪為內(nèi)存中的一個(gè)組件”。

倒反天罡,在內(nèi)存里裝GPU?

目前AI計(jì)算的架構(gòu)以GPU為主導(dǎo),核心計(jì)算單元是配備HBM的GPU,比如英偉達(dá)的Blackwell架構(gòu)GPU,配備HBM3e內(nèi)存,通過NVLink、NVSwitch等實(shí)現(xiàn)GPU間高速通信,形成比如NVL72等的機(jī)架級(jí)計(jì)算系統(tǒng)。

不過英偉達(dá)在Vera Rubin平臺(tái)中,也展現(xiàn)出強(qiáng)烈的異構(gòu)計(jì)算趨勢(shì),AI計(jì)算不再單純依賴GPU,而是通過多芯片協(xié)同工作實(shí)現(xiàn)更高效的計(jì)算。Vera Rubin平臺(tái)中,除了Rubin GPU之外,還有Vera CPU、Groq 3 LPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU等多種處理單元協(xié)同工作。

但異構(gòu)計(jì)算或許也不是未來?金正浩預(yù)言,AI時(shí)代的最終贏家不是GPU,而是內(nèi)存,目前以英偉達(dá)GPU為中心的AI計(jì)算架構(gòu),將會(huì)完全轉(zhuǎn)向以內(nèi)存為中心的架構(gòu)。

“現(xiàn)在GPU或CPU是計(jì)算的中心。但今后,擁有龐大容量的HBM和HBF將成為中心,反而是GPU被裝進(jìn)其中的‘內(nèi)存中心計(jì)算(Memory-Centric Computing)’時(shí)代將會(huì)到來。GPU和CPU淪為零部件的那個(gè)時(shí)刻,要想引領(lǐng)這一范式,HBF必須成為其基礎(chǔ)?!彼忉尫Q,當(dāng)前AI面臨的幻覺問題,本質(zhì)上是硬件瓶頸造成的。

當(dāng)前業(yè)界正在從生成式AI轉(zhuǎn)向代理式AI(Agentic AI),這個(gè)過程中內(nèi)存瓶頸正在成為最大的難題。海量上下文需要同樣大規(guī)模的內(nèi)存,要真正實(shí)現(xiàn)快速、準(zhǔn)確處理代理式AI的超長(zhǎng)上下文數(shù)據(jù),內(nèi)存帶寬和容量都需要比現(xiàn)在增加1000倍以上。同時(shí),金正浩認(rèn)為大模型的幻覺本質(zhì)上也是內(nèi)存問題,因?yàn)閮?nèi)存不足,只能根據(jù)已知內(nèi)容回答,才會(huì)產(chǎn)生幻覺。

HBM在最近幾年AI芯片熱潮中已經(jīng)成為了焦點(diǎn),這是為了解決內(nèi)存帶寬瓶頸而誕生的一種DRAM技術(shù),核心原理是將多個(gè)DRAM芯片進(jìn)行垂直堆疊,通過TSV技術(shù)進(jìn)行互連,帶寬可以是傳統(tǒng)內(nèi)存的數(shù)十倍。

而HBF就較為陌生了,金正浩認(rèn)為,僅靠HBM難以滿足代理式AI的需求,HBM是為了快速回答而堆放在書桌旁的淺薄參考書,即短期記憶。而下一代的替代方案則是HBF高帶寬閃存,HBF是用NAND閃存代替DRAM進(jìn)行堆疊,大幅提升容量的巨大書架,即長(zhǎng)期記憶。
wKgZPGnPHiKAN9fYAAHlyT9EmYE957.jpg
GPU-HBM-HBF架構(gòu) 圖源:KAIST Terra Lab

具體來說,HBF核心思路是用HBM的封裝技術(shù)來對(duì)NAND FLASH進(jìn)行改造,包括3D堆疊、TSV、高并行接口等。根據(jù)目前業(yè)界多家廠商給出的技術(shù)指標(biāo),HBF的帶寬可高達(dá)1.6TB/s,是傳統(tǒng)PCIe4.0 SSD的200倍以上,基本達(dá)到了HBM3的帶寬水平,但低于HBM4。

在容量上,HBF單堆棧能達(dá)到512GB,8 堆??芍?TB,可支撐萬億參數(shù)模型本地加載,相比不HBM有顯著的優(yōu)勢(shì)。當(dāng)然,缺點(diǎn)是寫入和耐久性都不如HBM,因此HBF主要適用于讀取密集型AI推理任務(wù);另外延遲也相比HBM更高,HBF的延遲約5μs,而HBM僅為100ns。

所以綜合來看,HBF的定位可以看做是解決HBM容量不足和SSD速度太慢的存儲(chǔ)產(chǎn)品,適用于儲(chǔ)存模型權(quán)重、長(zhǎng)文本、特征庫(kù)等“溫/冷數(shù)據(jù)”,而HBM則專注于頻繁讀寫的“熱數(shù)據(jù)”。

金正浩是是韓國(guó)科學(xué)技術(shù)院(KAIST)電氣及電子工程系教授,同時(shí)是TERALAB負(fù)責(zé)人,被業(yè)界廣泛譽(yù)為“HBM之父”。研究領(lǐng)域?qū)W⒂趯W⒂?a target="_blank">信號(hào)完整性、電源完整性、電磁兼容、3D/2.5D集成電路封裝、TSV、硅中介層等先進(jìn)封裝技術(shù),以及AI半導(dǎo)體內(nèi)存架構(gòu)。

其負(fù)責(zé)的TERALAB在HBM設(shè)計(jì)技術(shù)領(lǐng)域全球領(lǐng)先超過20年,自2010年起直接參與HBM的商業(yè)化設(shè)計(jì),與三星電子、SK海力士、Google、NVIDIA、Apple、Tesla等全球巨頭有深度合作。他主導(dǎo)了HBM從概念到實(shí)際產(chǎn)品的關(guān)鍵技術(shù)突破,包括TSV、互連優(yōu)化、信號(hào)/電源設(shè)計(jì)等。

SK海力士、閃迪推動(dòng)HBF標(biāo)準(zhǔn)化,2026推首批樣品

得益于AI算力需求的爆發(fā)增長(zhǎng),HBF的產(chǎn)業(yè)化進(jìn)程非常快,從學(xué)術(shù)提出到標(biāo)準(zhǔn)化啟動(dòng),僅用了不到兩年時(shí)間。在2025年6月,KAIST TERALab在HBM路線圖Ver 1.7研討會(huì)上首次系統(tǒng)介紹HBF架構(gòu),提出“HBM-HBF-存儲(chǔ)網(wǎng)絡(luò)”分層設(shè)計(jì)。

2025年底至2026年初,金教授多次在媒體和研討會(huì)上發(fā)布HBF路線圖和工作負(fù)載分析,強(qiáng)調(diào)HBF可將AI推理性能/瓦特提升至純HBM配置的2.69倍,并在Llama 3.1 405B等模型上僅損失2.2%性能。

在2025年8月,閃迪和SK海力士簽署諒解備忘錄,正式啟動(dòng)HBF規(guī)格制定、技術(shù)要求定義和生態(tài)構(gòu)建。閃迪也明確目標(biāo),在2026下半年交付首批HBF內(nèi)存樣品,2027年初首批搭載HBF的AI推理設(shè)備進(jìn)入采樣階段。

今年2月25日,雙方在美國(guó)加州米爾皮塔斯的閃迪總部聯(lián)合舉辦“HBF規(guī)格標(biāo)準(zhǔn)化聯(lián)盟啟動(dòng)會(huì)”。宣布在Open Compute Project (OCP) 框架下成立專用工作組,推動(dòng)HBF全球開放標(biāo)準(zhǔn)化,這是HBF從雙邊合作轉(zhuǎn)向行業(yè)生態(tài)的關(guān)鍵一步。

三星盡管未有直接參與標(biāo)準(zhǔn)化聯(lián)盟,但已經(jīng)獨(dú)立切入HBF的賽道中,據(jù)披露,三星在去年10月開始啟動(dòng)概念設(shè)計(jì)與早期研發(fā),積累多項(xiàng)HBF相關(guān)專利。憑借NAND市場(chǎng)份額領(lǐng)先和代工/邏輯工藝優(yōu)勢(shì),三星正探索獨(dú)特架構(gòu)路徑,其目標(biāo)是2027年實(shí)現(xiàn)商用產(chǎn)品的推出。

根據(jù)金教授預(yù)測(cè),HBF將在2027年開始小規(guī)模商用部署,導(dǎo)入到谷歌、英偉達(dá)、AMD等AI芯片中;2030年HBF將大規(guī)模普及,預(yù)計(jì)到2038年HBF市場(chǎng)可能超越HBM,成為AI存儲(chǔ)的主力。

小結(jié):

HBF的產(chǎn)業(yè)化,不僅是填補(bǔ)了HBM和NAND FLASH之間的存儲(chǔ)空缺,更是標(biāo)志著AI算力硬件從算力芯片為中心,從GPU到異構(gòu)架構(gòu)之后,逐步向內(nèi)存為中心加速轉(zhuǎn)型,重塑AI服務(wù)器架構(gòu)。不過,GPU是不是真的會(huì)淪為內(nèi)存的“配件”,還不太好說,但至少在未來AI Agent的時(shí)代,存儲(chǔ)芯片的地位將更加重要。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5244

    瀏覽量

    135963
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3223

    瀏覽量

    76461
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    2

    文章

    432

    瀏覽量

    15875
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    HBM之父”金正浩:內(nèi)存取代GPU

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2026年04月01日 16:22:38

    GPU不是AI的唯一解:英偉達(dá)用Groq LPU證明,推理賽道需要“另一條腿”

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)過去十年,人工智能的爆發(fā)式增長(zhǎng)與GPU需求緊密相連。憑借其卓越的并行計(jì)算能力,GPU成為AI算力的絕對(duì)代名詞。 ? 然而,英偉達(dá)給出
    的頭像 發(fā)表于 03-24 11:27 ?5642次閱讀
    <b class='flag-5'>GPU</b>不是AI的唯一解:<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>用Groq LPU證明,推理賽道需要“另一條腿”

    面向下一代GPU VPD架構(gòu)的供電系統(tǒng)超低壓大電流測(cè)試方案 —— 費(fèi)思N系列電子負(fù)載技術(shù)解析與應(yīng)用實(shí)踐

    LPD(橫向供電)架構(gòu)電流路徑長(zhǎng)、寄生參數(shù)大、動(dòng)態(tài)響應(yīng)慢等原因,已無法滿足下一代GPU的供電需求。 今年CES上,英偉達(dá)NVIDIA確定Rubin會(huì)用 VPD(垂直供電) 方案。根據(jù)
    的頭像 發(fā)表于 03-13 17:26 ?788次閱讀
    面向下一代<b class='flag-5'>GPU</b> VPD<b class='flag-5'>架構(gòu)</b>的供電系統(tǒng)超低壓大電流測(cè)試方案 —— 費(fèi)思N系列電子負(fù)載技術(shù)解析與應(yīng)用實(shí)踐

    每塊GPU對(duì)應(yīng)16TB SSD,英偉達(dá)KV緩存虹吸高性能TLC SSD

    作者:黃晶晶 ? 不久前,英偉達(dá)宣布其Vera Rubin平臺(tái)將采用搭載BlueField-4芯片的ICMS架構(gòu),通過卸載KV Cache突破內(nèi)存瓶頸、提升AI推理性能。該
    的頭像 發(fā)表于 02-10 11:12 ?1.4w次閱讀

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標(biāo)

    GPU架構(gòu)參數(shù)如CUDA核心數(shù)、顯存帶寬、TensorTFLOPS、互聯(lián)方式等,并非“冰冷的數(shù)字”,而是直接關(guān)系設(shè)備能否滿足需求、如何發(fā)揮最大價(jià)值、是否避免資源浪費(fèi)等問題的核心要素。本
    的頭像 發(fā)表于 10-09 09:28 ?1422次閱讀
    如何看懂<b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)指標(biāo)

    英偉達(dá)自研HBM基礎(chǔ)裸片

    "后的下一代AI GPU "Feynman"。 ? 有分析指出,英偉達(dá)此舉或是將部分GPU功能集成到基礎(chǔ)裸片中,旨在提高HBM
    的頭像 發(fā)表于 08-21 08:16 ?2973次閱讀

    性能優(yōu)于HBM,超高帶寬內(nèi)存 (X-HBM) 架構(gòu)來了!

    和單芯片高達(dá)512 Gbit的容量,帶寬提升16倍,密度提升10倍,顯著突破了傳統(tǒng)HBM的局限性。 ? ? 關(guān)鍵特性和優(yōu)勢(shì)包括,可擴(kuò)展性,使GPU內(nèi)存之間的數(shù)據(jù)傳輸更快,從而實(shí)現(xiàn)更高效的AI擴(kuò)展;高性能,解鎖未開發(fā)的
    的頭像 發(fā)表于 08-16 07:51 ?5070次閱讀
    性能優(yōu)于<b class='flag-5'>HBM</b>,超高帶寬<b class='flag-5'>內(nèi)存</b> (X-<b class='flag-5'>HBM</b>) <b class='flag-5'>架構(gòu)</b>來了!

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    別讓 GPU 故障拖后腿,捷智算GPU維修室來救場(chǎng)!

    ,GPU也常面臨各類故障挑戰(zhàn),令使用者頭疼不已。常見GPU故障大盤點(diǎn)一、內(nèi)存故障引發(fā)性能“滑坡”英偉達(dá)
    的頭像 發(fā)表于 07-17 18:56 ?1265次閱讀
    別讓 <b class='flag-5'>GPU</b> 故障拖后腿,捷智算<b class='flag-5'>GPU</b>維修室來救場(chǎng)!

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識(shí)是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了芯片架構(gòu)的基礎(chǔ)知識(shí),但該部分知識(shí)比較晦澀難懂,或許是由于我一直從事的事芯片
    發(fā)表于 06-18 19:31

    GPU架構(gòu)深度解析

    、游戲娛樂等領(lǐng)域。本文將深入探討GPU架構(gòu)的演變歷程、核心組件以及其在不同應(yīng)用場(chǎng)景中的優(yōu)勢(shì)。1、GPU架構(gòu)的演變?cè)缙诘?/div>
    的頭像 發(fā)表于 05-30 10:36 ?1990次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>深度解析

    英偉達(dá)擬再推中國(guó)特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近年來,美國(guó)政府對(duì)華半導(dǎo)體出口管制政策不斷收緊,英偉達(dá)等半導(dǎo)體企業(yè)面臨嚴(yán)峻挑戰(zhàn)。保持在中國(guó)市場(chǎng)的競(jìng)爭(zhēng)力,英偉達(dá)推出了
    發(fā)表于 05-27 00:03 ?4863次閱讀

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB內(nèi)存,32GBEMMC。 四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。 內(nèi)置NPU RK3588S
    發(fā)表于 05-15 10:36

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見故障有哪些?

    上漲,英偉達(dá)H100GPU憑借其強(qiáng)大的算力,成為AI訓(xùn)練、高性能計(jì)算領(lǐng)域的核心硬件。然而,隨著使用場(chǎng)景的復(fù)雜化,H100服務(wù)器故障率也逐漸攀升,輕則影響業(yè)務(wù)進(jìn)度,重
    的頭像 發(fā)表于 05-05 09:03 ?3251次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> <b class='flag-5'>GPU</b> H100 常見故障有哪些?