91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探索AI工廠的創(chuàng)收潛力

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-05-29 14:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“首次價(jià)值實(shí)現(xiàn)時(shí)間”是 AI 開發(fā)領(lǐng)域最重要的指標(biāo)之一。

AI 正在為所有人創(chuàng)造價(jià)值,從藥物發(fā)現(xiàn)領(lǐng)域的研究人員到應(yīng)對(duì)金融市場(chǎng)變化的量化分析師均受益匪淺。

AI 系統(tǒng)生成“token”(用于串聯(lián)輸出結(jié)果的數(shù)據(jù)單元)的速度越快,其影響力就越大。這正是 AI 工廠的關(guān)鍵所在,它提供了從“首 token 時(shí)延”到“首次價(jià)值實(shí)現(xiàn)時(shí)間”的最高效路徑。

AI 工廠正在重新定義現(xiàn)代基礎(chǔ)設(shè)施的經(jīng)濟(jì)學(xué)。它們通過大規(guī)模地將數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的輸出內(nèi)容(無論是 token、預(yù)測(cè)、圖像、蛋白質(zhì)還是其他形式的內(nèi)容)來生產(chǎn)智能。

AI 工廠有助于提升 AI 應(yīng)用流程中的三個(gè)關(guān)鍵環(huán)節(jié):數(shù)據(jù)攝取、模型訓(xùn)練和高吞吐量推理。通過三大核心技術(shù)棧(AI 模型、加速計(jì)算基礎(chǔ)設(shè)施和企業(yè)級(jí)軟件),AI 工廠能夠更快、更精準(zhǔn)地生成 token。

下面將介紹 AI 工廠是如何幫助全球各地的企業(yè)把最寶貴的數(shù)字商品——數(shù)據(jù)轉(zhuǎn)化為創(chuàng)收潛力的。

從推理經(jīng)濟(jì)學(xué)到價(jià)值創(chuàng)造

在構(gòu)建 AI 工廠之前,理解推理經(jīng)濟(jì)學(xué)至關(guān)重要,推理經(jīng)濟(jì)學(xué)意味著如何平衡成本、能效和日益增長(zhǎng)的 AI 需求。

吞吐量指模型可生成的 token 總量。延遲是模型在特定時(shí)間內(nèi)輸出的 token 數(shù)量,通常以首 token 時(shí)延(用戶輸入提示后,模型生成第一個(gè)輸出 token 所需的時(shí)間)和“首 token 后,每個(gè)輸出 token 的時(shí)延”(生成每個(gè)額外 token 所需的時(shí)間)來衡量。有效吞吐量(Goodput)是一個(gè)較新的指標(biāo),用于衡量一個(gè)系統(tǒng)在滿足延遲目標(biāo)的同時(shí)可交付的有用輸出量。

用戶體驗(yàn)是所有軟件應(yīng)用的關(guān)鍵所在,AI 工廠也不例外。高吞吐量意味著更智能的 AI,低延遲則確保了及時(shí)的響應(yīng)。當(dāng)這兩項(xiàng)指標(biāo)實(shí)現(xiàn)合理平衡時(shí),AI 工廠就可通過快速提供有用的輸出,帶來卓越的用戶體驗(yàn)。

例如,響應(yīng)時(shí)間為 0.5 秒的 AI 客服比 5 秒響應(yīng)的 AI 客服更具吸引力和價(jià)值,即使兩者最終生成的 token 數(shù)量相同。

企業(yè)可借此機(jī)會(huì)為其推理輸出設(shè)定具有競(jìng)爭(zhēng)力的價(jià)格,從而提升每個(gè) token 的創(chuàng)收潛力。

衡量和可視化這種平衡頗具挑戰(zhàn),而這正是“帕累托”前沿概念的用武之地。

AI 工廠輸出:高效 Token 的價(jià)值

在規(guī)?;渴?AI 時(shí),帕累托前沿有助于直觀地表明如何在沖突的目標(biāo)(如快速響應(yīng)與同時(shí)服務(wù)更多用戶)之間達(dá)到最優(yōu)的平衡。

縱軸代表給定能耗下的吞吐效率(單位為 TPS,也就是每秒 token 數(shù))。該數(shù)值越高,AI 工廠可同時(shí)處理的請(qǐng)求就越多。

橫軸表示單個(gè)用戶的 TPS,代表模型響應(yīng)用戶給出首個(gè)提示的用時(shí)。該數(shù)值越高,預(yù)期的用戶體驗(yàn)就越好。對(duì)于聊天機(jī)器人和實(shí)時(shí)分析工具等交互式應(yīng)用,更低的延遲和快速的響應(yīng)尤為重要。

帕累托前沿的最大值(顯示為曲線頂點(diǎn))代表了特定運(yùn)行配置下的最佳輸出。目標(biāo)是為不同的 AI 工作負(fù)載和應(yīng)用找到吞吐量與用戶體驗(yàn)之間的最優(yōu)平衡。

頂尖的 AI 工廠通過加速計(jì)算來提升“每瓦 token 數(shù)”,即在優(yōu)化 AI 性能的同時(shí)大幅提高 AI 工廠和應(yīng)用的能效。

以上展示的動(dòng)畫對(duì)比了在NVIDIA Hopper GPU(配置為每用戶每秒 32 個(gè) token)與NVIDIA Blackwell Ultra GPU(配置為每用戶每秒 344 個(gè) token)上運(yùn)行時(shí)的用戶體驗(yàn)。在上述用戶體驗(yàn)設(shè)置下,Blackwell Ultra 實(shí)現(xiàn)了 10 倍以上的體驗(yàn)提升和近 5 倍的更高吞吐量,實(shí)現(xiàn)了最高達(dá) 50 倍的創(chuàng)收潛力。

AI 工廠的實(shí)際運(yùn)行

AI 工廠是一個(gè)系統(tǒng),它包含了一套將數(shù)據(jù)轉(zhuǎn)化為智能的組件。它不一定是高端的本地?cái)?shù)據(jù)中心,也可能是在加速計(jì)算基礎(chǔ)設(shè)施上運(yùn)行的 AI 專用云或混合模型,甚至可能是同時(shí)優(yōu)化網(wǎng)絡(luò)并執(zhí)行邊緣推理的電信基礎(chǔ)設(shè)施。

任何配備了軟件的加速計(jì)算基礎(chǔ)設(shè)施,只要能通過 AI 將數(shù)據(jù)轉(zhuǎn)化為智能,本質(zhì)上均可視為 AI 工廠。

AI 工廠的組件包括了加速計(jì)算、網(wǎng)絡(luò)、軟件、存儲(chǔ)、系統(tǒng)以及工具和服務(wù)。

當(dāng)用戶向 AI 系統(tǒng)輸入提示時(shí),AI 工廠的全棧系統(tǒng)就開始工作。它將提示 token 化,也就是將數(shù)據(jù)轉(zhuǎn)化為圖像、聲音、文字片段等語義單元。

每個(gè) token 被輸入到 GPU 驅(qū)動(dòng)的 AI 模型中,隨之在模型上進(jìn)行計(jì)算密集型推理,以生成最佳響應(yīng)。每個(gè) GPU 通過高速網(wǎng)絡(luò)和互連技術(shù)執(zhí)行并行處理,從而同時(shí)處理海量數(shù)據(jù)。

對(duì)于來自全球用戶的各種提示,AI 工廠都會(huì)運(yùn)行上述流程。這種實(shí)時(shí)推理能夠以工業(yè)級(jí)規(guī)模來生產(chǎn)智能。

由于 AI 工廠整合了整個(gè) AI 生命周期,該系統(tǒng)能夠持續(xù)改進(jìn):記錄推理過程,標(biāo)記邊緣案例以進(jìn)行再訓(xùn)練,優(yōu)化循環(huán)隨時(shí)間逐漸收斂。這一切均無需人工干預(yù),這就是“有效吞吐量”的實(shí)際體現(xiàn)。

面向 AI 工廠的 NVIDIA 全棧技術(shù)

AI 工廠將 AI 從一系列零散的實(shí)驗(yàn)轉(zhuǎn)化為可擴(kuò)展、可重復(fù)且可靠的創(chuàng)新與商業(yè)價(jià)值生成引擎。

NVIDIA 提供構(gòu)建 AI 工廠所需的所有組件,包括加速計(jì)算、高性能 GPU、高帶寬網(wǎng)絡(luò)和優(yōu)化的軟件。

例如,NVIDIA Blackwell GPU可以通過網(wǎng)絡(luò)連接,采用液冷技術(shù)提升能效,并由 AI 軟件統(tǒng)一編排。

開源推理平臺(tái)NVIDIA Dynamo為 AI 工廠提供了一種操作系統(tǒng),該系統(tǒng)旨在以最高的效率和最低的成本加速并擴(kuò)展 AI。通過智能地路由、調(diào)度和優(yōu)化推理請(qǐng)求,Dynamo 確保每個(gè) GPU 周期都能得到充分利用,從而以峰值性能生產(chǎn) token。

NVIDIA Blackwell GB200 NVL72系統(tǒng)和NVIDIA InfiniBand網(wǎng)絡(luò)專為最大化“每瓦 token 吞吐量”而設(shè)計(jì),使 AI 工廠在總吞吐量和低延遲方面均實(shí)現(xiàn)高效運(yùn)行。

通過驗(yàn)證優(yōu)化后的全棧解決方案,企業(yè)可以高效地構(gòu)建和維護(hù)前沿 AI 系統(tǒng)。全棧 AI 工廠助力企業(yè)實(shí)現(xiàn)卓越運(yùn)營(yíng),使他們能更快、更自信地駕馭 AI 的潛力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5597

    瀏覽量

    109785
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5654

    瀏覽量

    75037
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39820

    瀏覽量

    301487

原文標(biāo)題:探索 AI 工廠的創(chuàng)收潛力

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智芯科榮膺2025中國(guó)AI好眼鏡最具發(fā)展潛力芯片廠家

    今日,由潮電智庫(kù)主辦的AI眼鏡中國(guó)行“期末考試”峰會(huì)暨“AI好眼鏡”頒獎(jiǎng)盛典于深圳盛大啟幕。在這場(chǎng)聚焦AI眼鏡產(chǎn)業(yè)發(fā)展的行業(yè)盛會(huì)中,智芯科憑借在AI眼鏡芯片領(lǐng)域的硬核技術(shù)實(shí)力與亮眼發(fā)展
    的頭像 發(fā)表于 12-25 11:12 ?595次閱讀

    探索RISC-V在機(jī)器人領(lǐng)域的潛力

    探索RISC-V在機(jī)器人領(lǐng)域的潛力 測(cè)評(píng)人:洄溯 測(cè)評(píng)時(shí)間: 2025年11月 測(cè)評(píng)對(duì)象: MUSE Pi Pro開發(fā)板(基于進(jìn)迭時(shí)空K1系列高性能RISC-V CPU) 一、 開篇引言
    發(fā)表于 12-03 14:40

    炬芯科技榮膺2025全球電子成就獎(jiǎng)之年度潛力AI技術(shù)公司獎(jiǎng)

    高能效比的AI算力,并且成功完成了技術(shù)商業(yè)化落地,榮膺“全球電子成就獎(jiǎng)--2025年度潛力AI技術(shù)公司獎(jiǎng)”,充分彰顯了公司在低功耗端側(cè)AI芯片賽道的技術(shù)實(shí)力與商業(yè)落地
    的頭像 發(fā)表于 11-27 18:04 ?1282次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    探索;人類級(jí)別的理解能力;常識(shí)推理;現(xiàn)實(shí)世界的知識(shí)整合。 3、測(cè)試時(shí)計(jì)算 測(cè)試時(shí)計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源來提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對(duì)AGI的意義
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    是一種快速反應(yīng)能力,是直接的感知;靈感是一種通過思考和探索獲得的創(chuàng)造性想法,是一種創(chuàng)意。 AI怎么模擬直覺與靈感呢?四、AI代替人類的假說 這可能嗎? 用機(jī)器來生成假說: 1、直接生成 生成式
    發(fā)表于 09-17 11:45

    AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南

    AI芯片:科技探索與AGI愿景》一書如同一張?jiān)敱M的“藏寶圖”,為讀者指明了通往下一代人工智能的硬件之路。作者沒有停留在空洞的概念層面,而是直擊核心,從馮·諾依曼架構(gòu)的“內(nèi)存墻”瓶頸切入,清晰闡述了
    發(fā)表于 09-17 09:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+化學(xué)或生物方法實(shí)現(xiàn)AI

    21世紀(jì)是生命科學(xué)的世紀(jì),生物技術(shù)的潛力將比電子技術(shù)更深遠(yuǎn)----- 里卡多-戈蒂爾 半導(dǎo)體實(shí)現(xiàn)AI應(yīng)該沒什么疑問了吧?化學(xué)、生物怎么實(shí)現(xiàn)AI呢? 生物大腦是一個(gè)由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜
    發(fā)表于 09-15 17:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會(huì),AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成式AI開創(chuàng)了新的時(shí)代,經(jīng)歷了三次熱潮和兩次低谷
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺(tái)濕潤(rùn)的軟組織
    發(fā)表于 09-06 19:12

    使用OpenUSD和SimReady資產(chǎn)構(gòu)建AI工廠

    適用于 AI 工廠數(shù)字孿生的 NVIDIA Omniverse Blueprint 已發(fā)布,現(xiàn)已支持 OpenUSD 模式。該藍(lán)圖采用新工具,可在電力、冷卻和網(wǎng)絡(luò)基礎(chǔ)設(shè)施等更多方面模擬數(shù)據(jù)中心
    的頭像 發(fā)表于 09-06 15:23 ?1467次閱讀
    使用OpenUSD和SimReady資產(chǎn)構(gòu)建<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來》一書是姊妹篇,由此可見作者在AI芯片領(lǐng)域的功力和造詣。 作者畢業(yè)于上海交
    發(fā)表于 09-05 15:10

    【書籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請(qǐng)于9月3日前,前往【書籍評(píng)測(cè)活動(dòng)NO.64】《AI芯片:科技探索與AGI愿景》完成書籍兌換。 如有疑問請(qǐng) 添加小助手微信
    發(fā)表于 07-28 13:54

    摩爾線程“AI工廠”:五大核心技術(shù)支撐,打造大模型訓(xùn)練超級(jí)工廠

    2025年7月25日,上?!谑澜缛斯ぶ悄艽髸?huì)(WAIC 2025)開幕前夕,摩爾線程以“算力進(jìn)化,精度革命”為主題舉辦技術(shù)分享會(huì),并創(chuàng)新性提出“AI工廠”理念。摩爾線程創(chuàng)始人兼CEO張建中在主題
    的頭像 發(fā)表于 07-28 11:28 ?4554次閱讀
    摩爾線程“<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>”:五大核心技術(shù)支撐,打造大模型訓(xùn)練超級(jí)<b class='flag-5'>工廠</b>

    摩爾線程“AI工廠”:以系統(tǒng)級(jí)創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施

    2025年7月25日,上?!谑澜缛斯ぶ悄艽髸?huì)(WAIC 2025)開幕前夕,摩爾線程以“算力進(jìn)化,精度革命”為主題舉辦技術(shù)分享會(huì),并創(chuàng)新性提出“AI工廠”理念。摩爾線程創(chuàng)始人兼CEO張建中在主題
    發(fā)表于 07-28 10:34 ?2806次閱讀
    摩爾線程“<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>”:以系統(tǒng)級(jí)創(chuàng)新定義新一代<b class='flag-5'>AI</b>基礎(chǔ)設(shè)施

    工廠園區(qū)AI行為識(shí)別系統(tǒng)作用

    工廠園區(qū)AI行為識(shí)別系統(tǒng)作用 工廠園區(qū)AI行為識(shí)別系統(tǒng)是什么? 工廠園區(qū)AI行為識(shí)別系統(tǒng)是基于人
    的頭像 發(fā)表于 05-06 17:49 ?805次閱讀