91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百億Token一分錢!云天勵(lì)飛喊出“推理成本萬倍降”,公布三年三芯路線圖

Monika觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:莫婷婷 ? 2026-02-09 14:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)當(dāng)前,全球人工智能邁入具身智能(Agentic AI)時(shí)代,云天勵(lì)飛董事長(zhǎng)兼CEO陳寧博士在“大算力芯片戰(zhàn)略前瞻會(huì)”上強(qiáng)調(diào):公司將聚焦大模型推理芯片。在大會(huì)上,云天勵(lì)飛闡述了GPNPU架構(gòu)的技術(shù)內(nèi)涵,并公開了未來三年大算力芯片路線圖,致力于成為“最懂AI的推理芯片領(lǐng)軍企業(yè)”。



GPNPU:打造中國(guó)版TPU的最優(yōu)解

自2025年起,AI推理芯片將迎來未來5至10年的高光時(shí)刻,核心驅(qū)動(dòng)力在于大模型推理需求的爆發(fā)式增長(zhǎng)——尤其是Token數(shù)量的指數(shù)級(jí)攀升。

以字節(jié)跳動(dòng)的豆包為例:2024年5日均Token量?jī)H為0.12萬億;到2025年9月,已飆升至30萬億;僅三個(gè)月后(2025年12月)便突破50萬億。按此每季度近翻倍的增速推算,當(dāng)前日均Token量很可能已達(dá)70–80萬億。



大模型訓(xùn)練與推理在計(jì)算范式上的根本差異:訓(xùn)練追求算力絕對(duì)值、高精度和大規(guī)模集群互聯(lián),而推理則聚焦成本敏感、能效比與極致性價(jià)比。訓(xùn)練芯片需要百萬卡級(jí)的高性能互聯(lián),依賴FP64/32/16等高精度計(jì)算,對(duì)成本不敏感;而推理場(chǎng)景——如手機(jī)上的豆包、耳機(jī)中的同聲傳譯、眼鏡里的智能助手——更關(guān)注每個(gè)Token背后的真實(shí)成本。

陳寧博士表示,云天勵(lì)飛將持續(xù)推進(jìn)“百萬Token推理成本每年兩位數(shù)下降”的目標(biāo),力爭(zhēng)到2030年實(shí)現(xiàn)“百億Token僅需一分錢人民幣”,最終達(dá)成“推理算力平權(quán)”。

面對(duì)全球AI算力重心從訓(xùn)練向推理遷移的歷史性拐點(diǎn),云天勵(lì)飛指出“訓(xùn)練追趕、推理超車”是公司未來五年的核心策略。2025年,云天勵(lì)飛提出其第五代芯片架構(gòu)——GPNPU。
陳寧博士表示,GPNPU架構(gòu)是大模型推理的最佳載體。

GPNPU是一套覆蓋硬件微架構(gòu)、系統(tǒng)集成和軟件生態(tài)的綜合解決方案,其本質(zhì)是“GPGPU + NPU + 3DM + 算力積木”四維融合,具備了通用性、高效性、大帶寬、低延時(shí)等特點(diǎn),且采用了算力積木架構(gòu)。

云天勵(lì)飛CTO李愛軍進(jìn)一步介紹,GPNPU實(shí)現(xiàn)對(duì)CUDA兼容,支持“一行代碼遷移”;采用NPU級(jí)SIMD矩陣計(jì)算單元,實(shí)現(xiàn)單位面積更高的計(jì)算密度;該架構(gòu)引入自研3D Memory堆疊架構(gòu),帶寬達(dá)HBM的10倍,有效破解“內(nèi)存墻”瓶頸;通過3DM高效訪存架構(gòu)實(shí)現(xiàn)10納秒級(jí)延遲,滿足實(shí)時(shí)交互類應(yīng)用需求。

值得一提的是,云天勵(lì)飛在過去五年深耕國(guó)產(chǎn)工藝,率先探索了 Chiplet算力積木架構(gòu),而這一架構(gòu)與當(dāng)前大模型推理所需的超節(jié)點(diǎn)設(shè)計(jì)理念異曲同工。為此,公司定義下一代芯片的Scale-Up超節(jié)點(diǎn)架構(gòu),從而高效支撐萬億級(jí)乃至十萬億級(jí)MoE大模型的推理需求。云天勵(lì)飛也是國(guó)內(nèi)少數(shù)掌握D2D Chiplet和C2C Mesh互連技術(shù)的企業(yè)之一。


李愛軍提到,GPNPU系統(tǒng)級(jí)芯片,相比當(dāng)前主流以訓(xùn)練為主的GPGPU架構(gòu),在推理效率、性能表現(xiàn)和成本控制方面均實(shí)現(xiàn)了顯著領(lǐng)先。更進(jìn)一步的在Agent 時(shí)代,多模型、多智能體的自主多模型的推理時(shí)代,對(duì)于推理的時(shí)延到了毫秒級(jí),這個(gè)時(shí)候我們的領(lǐng)先優(yōu)勢(shì)將會(huì)實(shí)現(xiàn)跨代的領(lǐng)先。

公布三年三芯路線圖

在發(fā)布會(huì)上,云天勵(lì)飛公布了未來三年大算力芯片規(guī)劃,以“PD分離 + AFN細(xì)粒度優(yōu)化 + 超節(jié)點(diǎn)集群”為核心設(shè)計(jì)理念,精準(zhǔn)應(yīng)對(duì)大模型推理中prefill(計(jì)算密集)與decode(訪存密集)階段的不同需求。

2025年:推出第一代超節(jié)點(diǎn)P芯片(DeepVerse 100),專注百萬長(zhǎng)上下文場(chǎng)景的prefill推理,算力對(duì)標(biāo)英偉達(dá)Hopper架構(gòu)的H100;

2026年:發(fā)布第一代超節(jié)點(diǎn)D芯片(DeepVerse 200),聚焦超低延遲decode推理,性能看齊Blackwell架構(gòu)的B200;

2027年:迭代至第二代超節(jié)點(diǎn)P芯片(DeepVerse 300),實(shí)現(xiàn)毫秒級(jí)端到端推理時(shí)延,算力目標(biāo)直指英偉達(dá)下一代Rubin架構(gòu)。



云天勵(lì)飛以大模型推理為核心應(yīng)用場(chǎng)景,覆蓋大模型云推理、多模態(tài)理解等當(dāng)前主流。云天勵(lì)飛透露,公司的產(chǎn)業(yè)也可以應(yīng)用到深空探測(cè)領(lǐng)域,推進(jìn)“算力進(jìn)太空”,開啟AI航天新篇章。

目前,云天勵(lì)飛已構(gòu)建多元化的生態(tài)布局,其客戶群體包括AI大模型企業(yè)、涵蓋互聯(lián)網(wǎng)大廠、科技領(lǐng)軍企業(yè)等行業(yè)頭部客戶,以及政企與基礎(chǔ)設(shè)施客戶。

可以看到,云天勵(lì)飛不僅擁有領(lǐng)先的技術(shù),還具備強(qiáng)大的供應(yīng)鏈韌性與交付能力。尤為值得關(guān)注的是,云天勵(lì)飛已成功實(shí)現(xiàn)全國(guó)產(chǎn)化工藝閉環(huán)。僅用五年時(shí)間,公司完成了從芯片設(shè)計(jì)、先進(jìn)制造工藝到先進(jìn)封裝的全鏈條自主可控,并推動(dòng)全國(guó)產(chǎn)推理算力芯片持續(xù)迭代。

至今,云天勵(lì)飛已構(gòu)建“1+4”組織架構(gòu),包括:

政企事業(yè)部:作為公司基石,聚焦智慧城市、交通、安防等領(lǐng)域,正在規(guī)劃建設(shè)區(qū)域級(jí)千卡智算集群,賦能城市級(jí)AI滲透;
嚕咔(Luka)事業(yè)部:打造面向兒童的AI原生硬件智能體,被內(nèi)部稱為“Token吞金獸”,有望成為消費(fèi)級(jí)爆品;
岍丞(Qiancheng)事業(yè)部:藍(lán)牙耳機(jī)模組年出貨超3200萬顆,占中國(guó)手機(jī)品牌35%以上份額,2026年將啟動(dòng)自有AI C端品牌探索;
智算事業(yè)部:服務(wù)互聯(lián)網(wǎng)大廠與運(yùn)營(yíng)商,已斬獲16億大單,正與多家頭部客戶推進(jìn)深度合作。

這四大事業(yè)部,讓云天勵(lì)飛形成從技術(shù)研發(fā)到市場(chǎng)落地的完整閉環(huán)。


小結(jié)

站在第四次工業(yè)革命的門檻上,云天勵(lì)飛正以GPNPU為支點(diǎn),撬動(dòng)中國(guó)在全球AI基礎(chǔ)設(shè)施格局中的新地位。在發(fā)布會(huì)上,云天勵(lì)飛強(qiáng)調(diào),“到2030年,通過GPNPU推理架構(gòu)的持續(xù)創(chuàng)新,堅(jiān)定推進(jìn)百萬Tokens推理成本萬倍降低,最終實(shí)現(xiàn)推理算力平權(quán)!”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39820

    瀏覽量

    301497
  • 云天勵(lì)飛
    +關(guān)注

    關(guān)注

    0

    文章

    182

    瀏覽量

    12660
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球唯?IBM更新量子計(jì)算路線圖:2029交付!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近年來,量子計(jì)算似乎正在取得越來越多突破,國(guó)內(nèi)外都涌現(xiàn)出不少的技術(shù)以及產(chǎn)品突破。作為量子計(jì)算領(lǐng)域的先驅(qū)之,IBM近日公布了其量子計(jì)算路線圖,宣布將在2029
    的頭像 發(fā)表于 06-15 00:01 ?9112次閱讀
    全球唯<b class='flag-5'>一</b>?IBM更新量子計(jì)算<b class='flag-5'>路線圖</b>:2029<b class='flag-5'>年</b>交付!

    云天勵(lì)正式舉辦大算力芯片戰(zhàn)略前瞻會(huì)

    2月3日,云天勵(lì)正式舉辦“大算力芯片戰(zhàn)略前瞻會(huì)”,首次對(duì)外公布未來三年的大算力 AI 推理芯片
    的頭像 發(fā)表于 02-06 17:23 ?3682次閱讀

    力爭(zhēng)百萬 Tokens 推理成本降低百云天勵(lì)發(fā)布未來三年大算力芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    2月3日,云天勵(lì)正式舉辦“大算力芯片戰(zhàn)略前瞻會(huì)”,首次對(duì)外公布未來三年的大算力 AI 推理芯片
    的頭像 發(fā)表于 02-03 20:25 ?1981次閱讀
    力爭(zhēng)百萬 Tokens <b class='flag-5'>推理成本</b>降低百<b class='flag-5'>倍</b>:<b class='flag-5'>云天</b><b class='flag-5'>勵(lì)</b><b class='flag-5'>飛</b>發(fā)布未來<b class='flag-5'>三年</b>大算力芯片戰(zhàn)略,首曝 DeepVerse <b class='flag-5'>路線圖</b>

    曦望發(fā)布新推理GPU芯片,單位Token推理成本降低90%

    已突破片。 ? 啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場(chǎng)景下,它的整體性價(jià)比較上代提升超10。在算力與存儲(chǔ)設(shè)計(jì)
    的頭像 發(fā)表于 01-28 17:38 ?8690次閱讀

    天數(shù)智重磅公布四代架構(gòu)路線圖,對(duì)標(biāo)英偉達(dá)

    電子發(fā)燒友綜合報(bào)道 1月26日,天數(shù)智“智啟程”合作伙伴大會(huì)盛大啟幕。會(huì)上,天數(shù)智不僅公布了四代架構(gòu)路線圖,還發(fā)布了“彤央”邊端產(chǎn)品,
    的頭像 發(fā)表于 01-27 16:24 ?7845次閱讀
    天數(shù)智<b class='flag-5'>芯</b>重磅<b class='flag-5'>公布</b>四代架構(gòu)<b class='flag-5'>路線圖</b>,對(duì)標(biāo)英偉達(dá)

    云天勵(lì)與360集團(tuán)簽署戰(zhàn)略合作協(xié)議

    12月22日,云天勵(lì)與360集團(tuán)簽署戰(zhàn)略合作協(xié)議。雙方將圍繞“納米AI”算力底座建設(shè)、大模型安全能力提升以及智慧生活產(chǎn)品打造等方向,充分發(fā)揮各自在資源、場(chǎng)景與技術(shù)方面的優(yōu)勢(shì),聯(lián)合打造國(guó)產(chǎn)生態(tài)下的AI
    的頭像 發(fā)表于 12-25 17:09 ?522次閱讀

    云天勵(lì):AI推理需求狂飆,國(guó)產(chǎn)算力芯片機(jī)遇期加速到來

    今年來自國(guó)內(nèi)外的半導(dǎo)體創(chuàng)新領(lǐng)袖企業(yè)高管們又帶來哪些前瞻觀點(diǎn)?此次,電子發(fā)燒友網(wǎng)特別采訪了云天勵(lì),以下是這家公司對(duì)2026半導(dǎo)體產(chǎn)業(yè)的分析與展望。
    的頭像 發(fā)表于 12-23 10:13 ?1.1w次閱讀
    <b class='flag-5'>云天</b><b class='flag-5'>勵(lì)</b><b class='flag-5'>飛</b>:AI<b class='flag-5'>推理</b>需求狂飆,國(guó)產(chǎn)算力芯片機(jī)遇期加速到來

    云天勵(lì)中標(biāo)AI龍崗期1.22億元項(xiàng)目

    日前,云天勵(lì)中標(biāo)AI龍崗期1.22億元項(xiàng)目,將為龍崗區(qū)打造AI與機(jī)器人示范場(chǎng)景提供技術(shù)支撐,助力城市治理智能化水平持續(xù)提升。
    的頭像 發(fā)表于 12-22 09:34 ?423次閱讀

    云天勵(lì)AI推理芯片如何賦能千行百業(yè)

    11月26日,云天會(huì)客廳第二期生態(tài)沙龍暨深商聯(lián)高科技高成長(zhǎng)創(chuàng)新營(yíng)走進(jìn)上市公司活動(dòng)圓滿舉辦。來自深圳科技領(lǐng)域的多位企業(yè)負(fù)責(zé)人齊聚云天勵(lì),共同探討AI
    的頭像 發(fā)表于 12-03 13:58 ?634次閱讀

    云天勵(lì)亮相2025中國(guó)具身智能機(jī)器人大會(huì)

    近日,在 2025 中國(guó)具身智能機(jī)器人大會(huì)上,云天勵(lì)副總裁羅憶從芯片廠商的視角出發(fā),對(duì)具身智能產(chǎn)業(yè)的未來進(jìn)行了深入剖析,并分享了公司在 AI 推理芯片與機(jī)器人應(yīng)用場(chǎng)景方面的整體布局。
    的頭像 發(fā)表于 11-25 11:26 ?862次閱讀

    云天勵(lì)與金蝶達(dá)成戰(zhàn)略合作

    11月4日,在2025金蝶全球創(chuàng)見者大會(huì)上,云天勵(lì)與金蝶簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 11-05 18:09 ?1690次閱讀

    云天勵(lì)亮相2025灣區(qū)半導(dǎo)體產(chǎn)業(yè)生態(tài)博覽會(huì)

    在2025灣區(qū)半導(dǎo)體產(chǎn)業(yè)生態(tài)博覽會(huì)(灣展)上,云天勵(lì)以“算力積木”為核心理念,攜全棧AI推理產(chǎn)品體系重磅亮相,集中展示了從芯片到模組再到
    的頭像 發(fā)表于 10-16 17:45 ?1021次閱讀

    云天勵(lì)正式加入OISA生態(tài)

    近日,云天勵(lì)正式加入 OISA 生態(tài),攜手產(chǎn)業(yè)伙伴共同推動(dòng)國(guó)產(chǎn) AI 芯片互聯(lián)體系建設(shè),為中國(guó)算力生態(tài)注入新的動(dòng)力。
    的頭像 發(fā)表于 10-11 13:59 ?664次閱讀

    華為首次公布昇騰芯片新路線圖

    9月18日在上海世博中心舉辦的 2025 華為全聯(lián)接大會(huì)上,華為副董事長(zhǎng)、輪值董事長(zhǎng)徐直軍登臺(tái)發(fā)表演講,首次對(duì)外公布了昇騰 AI 芯片未來三年的產(chǎn)品迭代路線圖。這消息無疑為國(guó)內(nèi) AI
    的頭像 發(fā)表于 09-19 16:49 ?1737次閱讀
    華為首次<b class='flag-5'>公布</b>昇騰芯片新<b class='flag-5'>路線圖</b>

    云天勵(lì)亮相2025全球AI芯片峰會(huì)

    9 月 17 日,全球 AI 芯片峰會(huì)在上海舉行,云天勵(lì)董事長(zhǎng)兼 CEO 陳寧出席并發(fā)表演講。
    的頭像 發(fā)表于 09-17 17:56 ?1379次閱讀