91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達重磅出手!AI 推理存儲全面覺醒

晶芯觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2025-12-26 08:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉達將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉達迄今為止規(guī)模最大的一筆收購。但英偉達回應(yīng)表示,并未計劃收購Groq,僅達成技術(shù)許可合作,將采用Groq的推理技術(shù)。

隨后,Groq公司宣布已與英偉達就其推理技術(shù)達成非獨家許可協(xié)議。根據(jù)協(xié)議條款,Groq創(chuàng)始人喬納森·羅斯(Jonathan Ross)、總裁桑尼·馬達拉(Sunny Madra)及其他核心團隊成員將加入英偉達,共同推進授權(quán)技術(shù)的升級與規(guī)?;瘧?yīng)用。此外,Groq將繼續(xù)作為獨立公司運營,西蒙·愛德華茲(Simon Edwards)將接任首席執(zhí)行官職務(wù);Groq云服務(wù)將保持正常運行,不受此次合作影響。

Groq成立于2016年,總部位于美國加利福尼亞州山景城,是一家AI推理芯片廠商。該公司核心團隊源自谷歌最初的張量處理單元(TPU)工程團隊,創(chuàng)始人兼前CEO喬納森·羅斯(Jonathan Ross)是谷歌TPU項目的核心研發(fā)人員。

2024年8月,Groq在最新一輪融資中籌集6.4億美元,由貝萊德集團(BlackRock Inc.)基金領(lǐng)投,并獲得思科和三星投資部門的支持。2024年12月,Groq在沙特阿拉伯達曼建成中東地區(qū)最大的推理集群,該集群包含19000個Groq LPU,僅用8天便完成上線。

2025年2月,Groq從沙特阿拉伯成功籌集15億美元融資,用于擴建其在當(dāng)?shù)氐腁I基礎(chǔ)設(shè)施;9月,完成7.5億美元融資,投后估值達69億美元,累計融資額超30億美元。

Groq LPU近存計算芯片

AI推理的廣泛應(yīng)用是AI普惠大眾的關(guān)鍵,業(yè)內(nèi)巨頭與初創(chuàng)公司均洞察到其發(fā)展前景并提前布局,Groq便是其中的佼佼者。其AI推理芯片采用SRAM替代DRAM,從而實現(xiàn)更快的訪問速度、更低的刷新延遲等優(yōu)勢。

Groq公司研發(fā)的語言處理單元(Language Processing Unit,簡稱LPU),憑借獨特架構(gòu)展現(xiàn)出極高的推理性能,是一款典型的近存計算芯片。

該芯片采用14nm制程,搭載230MB SRAM以保障內(nèi)存帶寬,片上內(nèi)存帶寬達80TB/s。SRAM的訪問速度遠快于DRAM,使其在計算密集型應(yīng)用中表現(xiàn)突出;而大容量SRAM的配置,有助于提升機器學(xué)習(xí)、人工智能等計算密集型工作負載的處理效率。

靜態(tài)隨機存取存儲器(Static Random-Access Memory,簡稱SRAM)是隨機存取存儲器的一種,只要保持通電,存儲的數(shù)據(jù)就能持續(xù)保留;相比之下,動態(tài)隨機存取存儲器(DRAM)存儲的數(shù)據(jù)需周期性刷新。但需注意,SRAM仍屬于易失性存儲器,斷電后數(shù)據(jù)會丟失,這與斷電后仍能保存數(shù)據(jù)的ROM(只讀存儲器)或閃存存在本質(zhì)區(qū)別。

SRAM雖性能優(yōu)越,但也存在明顯短板:集成度較低、功耗高于DRAM,且單位容量占用硅片面積更大。同等面積的硅片可制造更大容量的DRAM,因此SRAM成本更高。基于其高速響應(yīng)的特性,SRAM常被用作CPU與主存之間的高速緩存,無需定期刷新,可適配CPU一級緩存、二級緩存等場景。

當(dāng)前,全球AI產(chǎn)業(yè)隨著模型訓(xùn)練逐步收斂,正邁向大規(guī)模推理應(yīng)用落地階段。英偉達通過“技術(shù)授權(quán)+核心人才引進”的模式,可快速補強AI推理領(lǐng)域的布局,鞏固其全棧AI優(yōu)勢。這一合作有望帶動AI產(chǎn)業(yè)進入下一發(fā)展階段,掀起AI推理熱潮。

國內(nèi)外AI推理存儲布局

結(jié)合AI推理應(yīng)用場景的特性,基于多種存儲類型的AI推理芯片、存算一體芯片在存儲與計算產(chǎn)業(yè)界備受關(guān)注、活躍度極高。筆者在先前撰寫的《AI推理的存儲,看好SRAM?》一文中曾提及,除Groq LPU近存計算芯片外,國內(nèi)外多家企業(yè)也推出了同類相關(guān)產(chǎn)品。

Axelera的AIPU芯片采用創(chuàng)新的內(nèi)存計算技術(shù)。與傳統(tǒng)磁盤存儲相比,內(nèi)存計算將數(shù)據(jù)直接存儲在主內(nèi)存(RAM)中,大幅提升數(shù)據(jù)處理速度。該芯片融合SRAM(靜態(tài)隨機訪問存儲器)與數(shù)字計算技術(shù),使每個存儲單元可直接作為計算單元,從根本上增加了每個計算機周期的操作數(shù)(每個存儲單元每周期可完成一次乘法和一次累加),且不受噪聲干擾或精度降低等問題影響。

這一技術(shù)讓Axelera芯片在提供高計算性能的同時,能夠以更低成本、更低能耗完成邊緣AI計算任務(wù)。此外,該芯片采用開源的RISC-V指令集架構(gòu)(ISA),其低成本、高效能、高靈活性的特性,可支持根據(jù)特定應(yīng)用需求進行定制化設(shè)計,為Axelera帶來極大的設(shè)計自由度與創(chuàng)新空間。

2024年,Axelera獲得三星電子風(fēng)險投資部門三星催化劑基金(Samsung Catalyst)的大力支持,成功籌集6800萬美元融資,至此總?cè)谫Y額達到1.2億美元。

AI芯片初創(chuàng)公司EnCharge AI研發(fā)出一種新型內(nèi)存計算架構(gòu),專為AI推理場景設(shè)計。其核心技術(shù)是基于模擬存內(nèi)計算的AI芯片,該創(chuàng)新設(shè)計采用“基于電荷的存儲器”,通過讀取存儲平面上的電流而非單個比特單元處理數(shù)據(jù),并使用更精確的電容器替代傳統(tǒng)半導(dǎo)體器件。

此外,d-Matrix采用數(shù)字內(nèi)存計算(DIMC)引擎架構(gòu),將計算單元遷移至RAM(內(nèi)存)附近;該數(shù)字存算一體技術(shù)通過合并存儲器與計算單元中的乘法累加器(MAC),顯著提升計算帶寬與效率,同時降低延遲、減少能耗。
在國內(nèi),知存科技、昕原半導(dǎo)體、九天睿芯、恒爍股份等企業(yè)均在積極布局存儲與計算融合的AI存算一體芯片領(lǐng)域。

昕原半導(dǎo)體的ATOM(AI Thruster Optimized Memory)產(chǎn)品系列,利用ReRAM(阻變存儲器)兼容先進工藝的特性,將存儲單元與計算單元融為一體,相比傳統(tǒng)方案實現(xiàn)數(shù)十倍的帶寬、性能及能效比提升。ATOM的存儲容量與算力均支持靈活配置,是端側(cè)、邊緣側(cè)及云端大模型加速的理想解決方案。

知存科技作為全球最早布局存算一體技術(shù)的企業(yè)之一,已實現(xiàn)技術(shù)量產(chǎn)商用,并積累了豐富的客戶服務(wù)經(jīng)驗。知存科技CEO王紹迪表示,AI技術(shù)從云端向端邊側(cè)滲透是明確趨勢,但帶寬、成本等痛點亟待解決,這推動半導(dǎo)體行業(yè)向“高帶寬、低成本、高能效”的技術(shù)方向創(chuàng)新,而存算一體技術(shù)正是契合這一需求的關(guān)鍵路徑。

知存科技早早就洞察到存算一體技術(shù)在端側(cè)AI場景的優(yōu)勢,2024年啟動“天才博士計劃”吸納全球頂尖人才,并與北京大學(xué)、清華大學(xué)等高校共建聯(lián)合實驗室,持續(xù)深耕技術(shù)突破。近兩年來,知存科技營收平均增速超50%,2025年市場表現(xiàn)亮眼,預(yù)計2026年將實現(xiàn)更高增長;累計服務(wù)客戶超30家,存算一體芯片的市場應(yīng)用規(guī)模持續(xù)擴大,成功響應(yīng)AI眼鏡、AI相機等細分領(lǐng)域的高能效計算需求,技術(shù)認可度與商業(yè)落地能力得到行業(yè)進一步驗證。

九天睿芯專注于多層級存算融合的技術(shù)路徑,通過整合存算一體與近存計算技術(shù),實現(xiàn)前沿技術(shù)研發(fā)與商業(yè)化落地,為AI計算提供超高性能、更大容量、更低功耗的新一代硬件解決方案。目前,其芯片產(chǎn)品已在多家客戶實現(xiàn)量產(chǎn),并獲得多個國際一線智能眼鏡、智能耳機及助聽器品牌的訂單。2025年9月,九天睿芯宣布完成超億元B輪融資。

九天睿芯創(chuàng)始人、董事長兼CEO劉洪杰表示,公司計劃未來3年內(nèi)加速后續(xù)兩代大容量大算力存算一體芯片的研發(fā)進程:第二代芯片期間版本將支持1~3B級別的輕量化大模型,目前已流片成功;第三代芯片將支持100B(千億)級別參數(shù)量大模型的推理部署,成本僅為當(dāng)前方案的十分之一,相當(dāng)于現(xiàn)有支持5~10B(百億)級別參數(shù)量模型推理芯片的成本水平。

恒爍股份表示,公司研發(fā)的低功耗存算一體推理技術(shù),可高效完成AI核心計算任務(wù)——向量矩陣乘法。借助存算一體技術(shù),芯片能夠規(guī)避計算過程中模型數(shù)據(jù)訪存帶來的“存儲墻”問題,提升計算能效與計算面效,進而降低計算功耗與芯片面積。目前,公司已具備基于Nor Flash和SRAM兩種介質(zhì)的存算一體技術(shù),覆蓋模擬存內(nèi)計算和數(shù)字存內(nèi)計算兩種技術(shù)路徑,可根據(jù)應(yīng)用場景需求選擇適配的計算介質(zhì)與路徑。

此外,恒爍股份在音頻應(yīng)用領(lǐng)域研發(fā)了與存算技術(shù)配套的低功耗預(yù)處理技術(shù),包括低功耗ADC模數(shù)轉(zhuǎn)換器)設(shè)計、低功耗人聲活動檢測(VAD)及低功耗FFT(快速傅里葉變換)等。該預(yù)處理技術(shù)與存算一體計算核心搭配,可從系統(tǒng)層面優(yōu)化智能語音芯片的實際功耗,推動存算一體技術(shù)從單一模塊的技術(shù)優(yōu)勢,轉(zhuǎn)化為可落地、具備性價比與競爭力的芯片產(chǎn)品。

小結(jié)

綜上可見,存算一體方案能夠有效提升推理效率、降低推理成本,推動AI推理進入規(guī)?;涞仉A段。更低成本的推理方案將讓更多企業(yè)具備接入大模型的能力,進一步加速AI在內(nèi)容生成、數(shù)據(jù)分析、端側(cè)智能等領(lǐng)域的普及應(yīng)用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39844

    瀏覽量

    301505
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4089

    瀏覽量

    99230
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    高通挑戰(zhàn)英偉,發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    億美元的數(shù)據(jù)中心市場中搶占一席之地。 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI 推理
    的頭像 發(fā)表于 10-29 10:36 ?3652次閱讀
    高通挑戰(zhàn)<b class='flag-5'>英偉</b><b class='flag-5'>達</b>,發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    高通挑戰(zhàn)英偉!發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    億美元的數(shù)據(jù)中心市場中搶占一席之地。 ? 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI
    的頭像 發(fā)表于 10-29 09:14 ?6470次閱讀
    高通挑戰(zhàn)<b class='flag-5'>英偉</b><b class='flag-5'>達</b>!發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    堪稱史上最強推理芯片!英偉發(fā)布 Rubin CPX,實現(xiàn)50倍ROI

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近日,英偉AI infra峰會上發(fā)布了專為大規(guī)模上下文推理設(shè)計的全新GPU系列Rubin CPX,性能堪稱炸裂! ?
    的頭像 發(fā)表于 09-11 08:25 ?1.1w次閱讀
    堪稱史上最強<b class='flag-5'>推理</b>芯片!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>發(fā)布 Rubin CPX,實現(xiàn)50倍ROI

    AI推理需求井噴!英偉Q1營收大漲,H20禁售難擋增長步伐

    電子發(fā)燒友原創(chuàng) 章鷹 在中美科技企業(yè)爭奪人工智能高地的競爭中,處于第一方陣的美國AI芯片公司英偉公司最新交出了讓市場滿意的答卷。 5月28日,英偉
    的頭像 發(fā)表于 05-31 01:13 ?8224次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>需求井噴!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>Q1營收大漲,H20禁售難擋增長步伐

    英偉電話會看Agentic AI推理與FPGA價值

    2026年2月,英偉發(fā)布2026財年Q4財報:營收681億美元,同比增長73%,數(shù)據(jù)中心業(yè)務(wù)增長75%——預(yù)期中的超預(yù)期。更值得關(guān)注的,是電話會中反復(fù)出現(xiàn)的幾個關(guān)鍵詞:Agentic AI、
    的頭像 發(fā)表于 03-04 17:07 ?1069次閱讀
    從<b class='flag-5'>英偉</b><b class='flag-5'>達</b>電話會看Agentic <b class='flag-5'>AI</b><b class='flag-5'>推理</b>與FPGA價值

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    電子發(fā)燒友網(wǎng)綜合報道,在人工智能迅猛發(fā)展的當(dāng)下,AI推理芯片需求正呈爆發(fā)式增長。 ? AI推理,即支撐如ChatGPT這類AI模型響應(yīng)用戶問
    的頭像 發(fā)表于 02-03 17:15 ?2022次閱讀

    第四次工業(yè)革命AI將實現(xiàn)十億倍增長 | 中國AI芯片與英偉的角色

    內(nèi)容提要:黃仁勛BG2專訪:英偉、OpenAI、算力未來與美國夢AI規(guī)模定律與推理的革命:在傳統(tǒng)的AI規(guī)模定律(預(yù)訓(xùn)練、后訓(xùn)練)之上,引入
    的頭像 發(fā)表于 09-29 07:20 ?1157次閱讀
    第四次工業(yè)革命<b class='flag-5'>AI</b>將實現(xiàn)十億倍增長 | 中國<b class='flag-5'>AI</b>芯片與<b class='flag-5'>英偉</b><b class='flag-5'>達</b>的角色

    英偉AI人才,去了華為

    電子發(fā)燒友網(wǎng)綜合報道 近日,英偉首席科學(xué)家比爾·戴利(Bill Dally)表示,美國對中國實施的人工智能出口管制禁令,讓中國獲得很大的發(fā)展空間,過去替英偉撰寫程序的中國人工智能研
    的頭像 發(fā)表于 06-06 00:05 ?7339次閱讀

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓(xùn)練、AI
    的頭像 發(fā)表于 03-31 11:27 ?1349次閱讀

    英偉Cosmos-Reason1 模型深度解讀

    英偉近期發(fā)布的 Cosmos-Reason1 模型在物理常識推理領(lǐng)域引發(fā)廣泛關(guān)注。作為專為物理世界交互設(shè)計的多模態(tài)大語言模型,它通過融合視覺感知與復(fù)雜邏輯推理,重新定義了
    的頭像 發(fā)表于 03-29 23:29 ?3018次閱讀

    IBM攜手英偉AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉 AI 數(shù)據(jù)平臺參考架構(gòu)(re
    發(fā)表于 03-24 19:20 ?519次閱讀

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?1573次閱讀

    英偉GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理模型。 作
    的頭像 發(fā)表于 03-20 15:03 ?1251次閱讀

    新思科技攜手英偉加速芯片設(shè)計,提升芯片電子設(shè)計自動化效率

    B200 Blackwell架構(gòu),新思科技 Proteus預(yù)計將計算光刻仿真的速度提升20倍 英偉NIM推理微服務(wù)集成將生成式AI驅(qū)動的
    發(fā)表于 03-19 17:59 ?499次閱讀