英偉達GTC25亮點：NVIDIA Dynamo開源庫加速并擴展AI推理模型

NVIDIA Dynamo 提高了推理性能，同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本；在 NVIDIA Blackwell 上的推理優(yōu)化將 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理模型。

作為 NVIDIA Triton 推理服務(wù)器的后續(xù)產(chǎn)品，NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件，旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個 GPU 之間的推理通信，并使用分離服務(wù)將大語言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開來。這使得每個階段的特定需求可以進行單獨優(yōu)化，并確保更大程度地利用 GPU 資源。

NVIDIA Dynamo 完全開源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM，使企業(yè)、初創(chuàng)公司和研究人員能夠開發(fā)和優(yōu)化在分離推理時部署 AI 模型的方法。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進行思考和學習，從而使模型復(fù)雜度持續(xù)升級?！?NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示，“為了實現(xiàn)自定義推理 AI 的未來，NVIDIA Dynamo 可以在這些模型上進行規(guī)模化部署，從而為 AI 工廠實現(xiàn)降本增效”。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5596

瀏覽量
109782
AI

AI

+關(guān)注

關(guān)注
91

文章
39816

瀏覽量
301481

原文標題：GTC25 | NVIDIA Dynamo 開源庫加速并擴展 AI 推理模型

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

NVIDIA英偉達
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New Meta與NVIDIA達成多年戰(zhàn)略合作伙伴關(guān)系
New NVIDIA與達索系統(tǒng)合作共繪工業(yè)AI藍圖

精選推薦
更多

文章

資料

帖子

一種船用逆變電源電磁兼容試驗

電源聯(lián)盟
20分鐘前

60 閱讀

PI GaN產(chǎn)品InnoSwitch3-EP助力簡化工業(yè)輔助電源設(shè)計

安富利
1小時前

120 閱讀

ADC ADS52J90的LVDS/16通道/10bit/100MSPS數(shù)據(jù)采集模式開發(fā)筆記

FPGA設(shè)計論壇
2小時前

119 閱讀

基于瑞薩RA MCU自制貓咪智能飲水機方案

瑞薩嵌入式小百科
2小時前

104 閱讀

極海Cortex-M52內(nèi)核MCU G32R501在CoreMark的表現(xiàn)如何

Geehy極海半導(dǎo)體
2小時前

127 閱讀

汽車電子系統(tǒng)電路設(shè)計全集TOP5

Duke
984KB

1積分

160下載

基于開源項目行話記錄器進行適用OHOS的移植教程

姚小熊27
0.92 MB

免費

2下載

JBoss Overlord分布式系統(tǒng)治理

郭中
0.01 MB

免費

0下載

OIM基于JavaFX開發(fā)的聊天客戶端

klysa
32.01 MB

免費

0下載

8V19N850 評估套件數(shù)據(jù)手冊

3.15 MB

免費

0下載

【瑞薩AI挑戰(zhàn)賽】階段一：基于RA8P1的人臉識別模型轉(zhuǎn)換和部署

Zerolinr
16小時前

225 閱讀

【飛凌嵌入式RV1126B開發(fā)板】+基本功能測試篇（1）

jennyzhaojie
4天前

1615 閱讀

【飛凌嵌入式RV1126B開發(fā)板】+初識篇

jennyzhaojie
5天前

1666 閱讀

樹莓派5還是香橙派5 Pro？兩款熱門開發(fā)板的詳細對比

行走的小派
5天前

1989 閱讀

OrangePi RV2 深度技術(shù)評測：RISC-V AI融合架構(gòu)的先行者

行走的小派
6天前

2299 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

英偉達GTC25亮點：NVIDIA Dynamo開源庫加速并擴展AI推理模型

評論