新聞?wù)?/span>
全新 NVIDIA STX 參考架構(gòu)可提升高達(dá) 5 倍的 Token 吞吐量,能效提升高達(dá) 4 倍,數(shù)據(jù)攝取速度提升 2 倍。
率先將 STX 用于上下文記憶存儲(chǔ)的廠商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure(OCI)和 Vultr。
多家存儲(chǔ)廠商與制造合作伙伴正在基于 NVIDIA 模塊化參考設(shè)計(jì)來構(gòu)建基礎(chǔ)設(shè)施,以推進(jìn)代理式 AI 的發(fā)展,包括 AIC、Cloudian、DDN、戴爾科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、Supermicro、Quanta Cloud Technology(QCT)、VAST Data 和 WEKA。
加利福尼亞州圣何塞 —— GTC —— 太平洋時(shí)間 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA BlueField-4? STX 模塊化參考架構(gòu),該架構(gòu)可助力企業(yè)、云計(jì)算及 AI 服務(wù)商輕松部署加速存儲(chǔ)基礎(chǔ)設(shè)施,以滿足代理式 AI 所需的長(zhǎng)上下文推理能力。
傳統(tǒng)數(shù)據(jù)中心提供大容量通用存儲(chǔ),但難以滿足與跨多步驟、多工具和多輪會(huì)話的 AI 智能體無縫交互所需的響應(yīng)速度。代理式 AI 需要實(shí)時(shí)訪問數(shù)據(jù)和上下文工作記憶,以確保對(duì)話和多任務(wù)的快捷性和連貫性。隨著上下文規(guī)模的不斷擴(kuò)大,傳統(tǒng)存儲(chǔ)和數(shù)據(jù)路徑可能會(huì)降低 AI 推理的速度,并降低 GPU 利用率。
NVIDIA STX助力存儲(chǔ)廠商構(gòu)建數(shù)據(jù)就近并可大規(guī)模訪問的基礎(chǔ)設(shè)施,從而使代理式 AI 工廠能夠在推理、訓(xùn)練和分析方面提供更高的吞吐量和響應(yīng)速度。
首個(gè)機(jī)架級(jí)部署方案集成了全新的NVIDIA CMX? 上下文記憶存儲(chǔ)平臺(tái)。通過引入高性能的上下文層來擴(kuò)展 GPU 內(nèi)存,從而實(shí)現(xiàn)可擴(kuò)展的推理和代理式系統(tǒng)。與傳統(tǒng)存儲(chǔ)相比,每秒可處理的 Token 提升高達(dá) 5 倍。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“代理式 AI 正在重新定義軟件的能力,必須重塑其背后的計(jì)算基礎(chǔ)設(shè)施才能跟上這一步伐。能夠基于海量上下文進(jìn)行推理并持續(xù)學(xué)習(xí)的 AI 系統(tǒng),需要新的存儲(chǔ)方案。NVIDIA STX 重新定義了存儲(chǔ)堆棧,為 AI 原生基礎(chǔ)設(shè)施提供了模塊化基礎(chǔ),確保 AI 工廠始終保持峰值性能高效運(yùn)行?!?/p>
STX 由 NVIDIA Vera Rubin 平臺(tái)提供加速,集成了針對(duì)存儲(chǔ)進(jìn)行優(yōu)化的全新NVIDIA BlueField-4 處理器。該處理器將NVIDIA Vera CPU、NVIDIA ConnectX? -9 SuperNIC相結(jié)合,并配合NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)、NVIDIA DOCA?以及NVIDIA AI Enterprise軟件共同運(yùn)行。
與傳統(tǒng) CPU 架構(gòu)相比,STX 架構(gòu)的能效提升高達(dá) 4 倍,從而實(shí)現(xiàn)高性能存儲(chǔ),并且在處理企業(yè)級(jí) AI 數(shù)據(jù)時(shí),每秒可處理的內(nèi)存頁數(shù)提升 2 倍。
眾多存儲(chǔ)廠商合作伙伴正在基于 NVIDIA STX 共同設(shè)計(jì)新一代 AI 基礎(chǔ)架構(gòu),包括 Cloudian、DDN、戴爾科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、VAST Data 和 WEKA。
正在構(gòu)建基于 STX 系統(tǒng)的制造合作伙伴包括 AIC、Supermicro 和 Quanta Cloud Technology (QCT)。
計(jì)劃采用 STX 進(jìn)行上下文記憶存儲(chǔ)的主要 AI 實(shí)驗(yàn)室和云服務(wù)提供商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、OCI 和 Vultr。
基于 STX 的平臺(tái)將于今年下半年由合作伙伴推出。
-
處理器
+關(guān)注
關(guān)注
68文章
20275瀏覽量
252950 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5627瀏覽量
109875 -
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4811瀏覽量
90124
原文標(biāo)題:GTC2026 | NVIDIA 推出 BlueField-4 STX 存儲(chǔ)架構(gòu),獲業(yè)界廣泛采用
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
梅賽德斯奔馳推出基于NVIDIA DRIVE AV軟件的全新S級(jí)車型
NVIDIA BlueField-4為推理上下文記憶存儲(chǔ)平臺(tái)提供強(qiáng)大支持
NVIDIA BlueField-4數(shù)據(jù)處理器重塑新型AI原生存儲(chǔ)基礎(chǔ)設(shè)施
NVIDIA在CES 2026發(fā)布新一代Rubin AI平臺(tái)
NVIDIA在ISC 2025分享最新超級(jí)計(jì)算進(jìn)展
NVIDIA推出NVQLink高速互連架構(gòu)
NVIDIA推出全新BlueField-4 DPU
基于NVIDIA BlueField DPU的5G UPF數(shù)據(jù)面加速方案
NVIDIA DOCA 3.0版本的亮點(diǎn)解析
第三屆NVIDIA DPU黑客松開啟報(bào)名
NVIDIA推出NVLink Fusion技術(shù)
英偉達(dá)GTC2025亮點(diǎn):NVIDIA認(rèn)證計(jì)劃擴(kuò)展至企業(yè)存儲(chǔ)領(lǐng)域,加速AI工廠部署
英偉達(dá)GTC2025亮點(diǎn):NVIDIA與行業(yè)領(lǐng)先存儲(chǔ)企業(yè)共同推出面向AI時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施
NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析
NVIDIA 與行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)共同推出面向 AI 時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施
NVIDIA推出BlueField-4 STX存儲(chǔ)架構(gòu)
評(píng)論