91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

力爭(zhēng)百萬(wàn) Tokens 推理成本降低百倍:云天勵(lì)飛發(fā)布未來(lái)三年大算力芯片戰(zhàn)略,首曝 DeepVerse 路線(xiàn)圖

Monika觀(guān)察 ? 來(lái)源:云天勵(lì)飛 ? 作者:云天勵(lì)飛 ? 2026-02-03 20:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2月3日,云天勵(lì)飛正式舉辦“大算力芯片戰(zhàn)略前瞻會(huì)”,首次對(duì)外公布未來(lái)三年的大算力 AI 推理芯片戰(zhàn)略布局。面對(duì)人工智能從“基礎(chǔ)模型構(gòu)建”邁向“規(guī)?;瘧?yīng)用落地”的重要轉(zhuǎn)折點(diǎn),公司宣布將核心研發(fā)資源集中于攻克大模型落地的“成本壁壘”,致力于通過(guò)底層架構(gòu)創(chuàng)新,力爭(zhēng)實(shí)現(xiàn)百萬(wàn) Tokens 推理成本降低 100 倍以上的目標(biāo),推動(dòng) AI 從技術(shù)嘗鮮走向普惠生產(chǎn)力。



產(chǎn)業(yè)變局:推理競(jìng)速,從“參數(shù)內(nèi)卷”轉(zhuǎn)向“效能為王”

過(guò)去一年,全球算力產(chǎn)業(yè)的風(fēng)向標(biāo)已發(fā)生顯著偏轉(zhuǎn),重心正加速向推理側(cè)傾斜。谷歌在 2025 年 4 月發(fā)布第七代 TPU “Ironwood”時(shí),明確將其定位為“面向推理時(shí)代”的基石,強(qiáng)調(diào)在大規(guī)模推理與能效上的系統(tǒng)化優(yōu)化。

與此同時(shí),圍繞“更低時(shí)延、更低成本”的推理芯片與系統(tǒng)能力,產(chǎn)業(yè)整合動(dòng)作也在加速。2025 年 12 月,英偉達(dá)與 Groq 達(dá)成非獨(dú)占許可安排,并吸納其核心工程人才團(tuán)隊(duì)加入,此舉被視為強(qiáng)化推理與實(shí)時(shí)工作負(fù)載能力的關(guān)鍵布局。

這些行業(yè)信號(hào)共同指向一個(gè)趨勢(shì):推理側(cè)競(jìng)爭(zhēng)已不再單純是“把模型做得更強(qiáng)”的參數(shù)競(jìng)賽,而是“讓?xiě)?yīng)用跑得更久、更穩(wěn)、更便宜”的效能競(jìng)賽,單位推理成本與交付效率已成為規(guī)?;涞氐淖畲箝T(mén)檻。

架構(gòu)破局:GPNPU 路線(xiàn)重新定義“通用生態(tài)”與“極致能效”

推理時(shí)代的勝負(fù)手不在單點(diǎn)指標(biāo),而在系統(tǒng)級(jí)協(xié)同:既要承接主流軟件生態(tài),又要在推理負(fù)載下實(shí)現(xiàn)更優(yōu)能效與更低時(shí)延。

云天勵(lì)飛確立了 GPNPU 技術(shù)路線(xiàn),并提出了“GPNPU = GPGPU + NPU + 3D 堆疊存儲(chǔ)”的核心公式,旨在兼顧通用計(jì)算的“通用性”與 NPU 的“高效性”,在工程層面同時(shí)解決可遷移、可部署、可持續(xù)降本三大難題。
在通用生態(tài)層面,鑒于 CUDA 仍是全球最成熟、覆蓋最廣的加速計(jì)算平臺(tái)之一,云天勵(lì)飛的 GPNPU 架構(gòu)致力于正視主流生態(tài)的遷移成本問(wèn)題,能夠?qū)崿F(xiàn)一行代碼完成 CUDA 程序兼容,極大降低了進(jìn)入生產(chǎn)系統(tǒng)的門(mén)檻。


在推理能效層面,NPU 能夠?qū)崿F(xiàn)更高的計(jì)算效率和能效比,面對(duì)大模型推理這種高度結(jié)構(gòu)化、可被體系化優(yōu)化的負(fù)載,專(zhuān)用化設(shè)計(jì)帶來(lái)的能效優(yōu)勢(shì)更容易轉(zhuǎn)化為真實(shí)成本優(yōu)勢(shì),這也是國(guó)際廠(chǎng)商持續(xù)加碼專(zhuān)用路線(xiàn)的重要原因。

同時(shí),針對(duì)行業(yè)公認(rèn)的“內(nèi)存墻”瓶頸,云天勵(lì)飛正深度研發(fā) 3D 堆疊存儲(chǔ)及更前沿的互連技術(shù),以提升帶寬與能效,降低推理時(shí)延。

在架構(gòu)工程與產(chǎn)品化路徑上,云天勵(lì)飛進(jìn)一步強(qiáng)調(diào)了兩項(xiàng)可落地的優(yōu)勢(shì)。首先是“算力積木”架構(gòu),即通過(guò) Chiplet 擴(kuò)展與互連思路,將標(biāo)準(zhǔn)計(jì)算單元進(jìn)行模塊化封裝與組合,讓算力像搭積木一樣按需擴(kuò)展,形成從邊緣到更大規(guī)模推理的彈性產(chǎn)品形態(tài)。

其次是面向推理的系統(tǒng)級(jí)優(yōu)化能力,公司拒絕單純的“芯片參數(shù)競(jìng)賽”,而是主張把“模型怎么跑得更省”沉淀到架構(gòu)里,圍繞真實(shí)業(yè)務(wù)負(fù)載持續(xù)迭代,逐項(xiàng)擊穿推理鏈路中的成本與時(shí)延瓶頸,最終形成可復(fù)制交付的綜合最優(yōu)解。

五大核心要素構(gòu)筑堅(jiān)實(shí)護(hù)城河,將打造千卡集群

云天勵(lì)飛董事長(zhǎng)兼 CEO 陳寧在演講中指出,支撐公司跨越周期的,是長(zhǎng)期積累構(gòu)筑的商業(yè)護(hù)城河。他將核心競(jìng)爭(zhēng)力總結(jié)為技術(shù)、產(chǎn)能、生態(tài)、市場(chǎng)、資本五大關(guān)鍵要素。這五大維度的協(xié)同共振,不僅是云天勵(lì)飛應(yīng)對(duì)行業(yè)激烈競(jìng)爭(zhēng)的底氣,更為未來(lái)三年戰(zhàn)略的穩(wěn)步落地提供了堅(jiān)實(shí)的體系化保障。

針對(duì)行業(yè)普遍關(guān)注的供應(yīng)鏈安全問(wèn)題,云天勵(lì)飛高級(jí)副總裁、CFO 兼董秘鄧浩然特別強(qiáng)調(diào),公司目前是國(guó)內(nèi)屈指可數(shù)手握充足國(guó)產(chǎn)產(chǎn)能保障的企業(yè)之一,這一戰(zhàn)略?xún)?chǔ)備為后續(xù)芯片的大規(guī)模量產(chǎn)與交付提供了極高的確定性。

陳寧還詳細(xì)解讀了云天勵(lì)飛的“1+4”架構(gòu):“1”指聚焦于A(yíng)I大算力推理芯片,“4”則是四大事業(yè)部。作為生態(tài)構(gòu)建者,四大事業(yè)部旨在解決芯片從“研發(fā)生產(chǎn)、優(yōu)化打磨到市場(chǎng)推廣”的核心難題。其中,政企事業(yè)部作為基石,將憑借深厚的行業(yè)經(jīng)驗(yàn),將戰(zhàn)略重點(diǎn)轉(zhuǎn)向推理設(shè)備和智算中心的建設(shè)。此外,云天勵(lì)飛還計(jì)劃打造區(qū)域級(jí)“千卡集群”,樹(shù)立城市AI算力賦能的新標(biāo)桿。

藍(lán)圖展開(kāi):DeepVerse 領(lǐng)銜,全場(chǎng)景算力矩陣精準(zhǔn)卡位

面向未來(lái)三年的規(guī)劃,云天勵(lì)飛CTO李?lèi)?ài)軍表示,將不遺余力投入大算力芯片DeepVerse的研發(fā),圍繞推理成本、時(shí)延與吞吐的核心矛盾持續(xù)迭代,并按產(chǎn)品節(jié)奏梯度覆蓋市場(chǎng)需求。

路線(xiàn)圖將對(duì)標(biāo)國(guó)際主流平臺(tái)的代際演進(jìn),聚焦長(zhǎng)上下文預(yù)填充(Prefill)、低時(shí)延解碼(Decode)等關(guān)鍵推理階段的系統(tǒng)優(yōu)化,在真實(shí)負(fù)載下持續(xù)兌現(xiàn)“更便宜、更穩(wěn)定、更易部署”的交付目標(biāo)。



推理時(shí)代的競(jìng)爭(zhēng),本質(zhì)是“單位推理成本”的競(jìng)爭(zhēng)。只有把推理做得足夠便宜、足夠穩(wěn)定、足夠易用,AI 才能從“看得見(jiàn)的能力”走向“用得起的生產(chǎn)力”。

未來(lái),云天勵(lì)飛將以 GPNPU 架構(gòu)為核心,大力推進(jìn)云端大算力強(qiáng)化軟硬協(xié)同與存儲(chǔ)體系攻堅(jiān),力爭(zhēng)將百萬(wàn) Tokens 推理成本降低 100 倍以上,推動(dòng)大模型從示范應(yīng)用走向規(guī)模化交付。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百億Token一分錢(qián)!云天勵(lì)喊出“推理成本萬(wàn)降”,公布三年路線(xiàn)圖

    勵(lì)再次闡述了GPNPU架構(gòu)的技術(shù)內(nèi)涵,并公開(kāi)了未來(lái)三年
    的頭像 發(fā)表于 02-09 14:54 ?4279次閱讀
    百億Token一分錢(qián)!<b class='flag-5'>云天</b><b class='flag-5'>勵(lì)</b><b class='flag-5'>飛</b>喊出“<b class='flag-5'>推理成本</b>萬(wàn)<b class='flag-5'>倍</b>降”,公布<b class='flag-5'>三年</b><b class='flag-5'>三</b>芯<b class='flag-5'>路線(xiàn)圖</b>

    云天勵(lì)正式舉辦大芯片戰(zhàn)略前瞻會(huì)

    2月3日,云天勵(lì)正式舉辦“大芯片戰(zhàn)略前瞻會(huì)”,
    的頭像 發(fā)表于 02-06 17:23 ?3638次閱讀

    曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

    已突破萬(wàn)片。 ? 啟望S3是專(zhuān)為大模型推理打造的定制化GPGPU芯片。在典型推理場(chǎng)景下,它的整體性?xún)r(jià)比較上一代提升超10。在
    的頭像 發(fā)表于 01-28 17:38 ?8646次閱讀

    云天勵(lì)與360集團(tuán)簽署戰(zhàn)略合作協(xié)議

    12月22日,云天勵(lì)與360集團(tuán)簽署戰(zhàn)略合作協(xié)議。雙方將圍繞“納米AI”底座建設(shè)、大模型安
    的頭像 發(fā)表于 12-25 17:09 ?508次閱讀

    云天勵(lì):AI推理需求狂飆,國(guó)產(chǎn)芯片機(jī)遇期加速到來(lái)

    今年來(lái)自國(guó)內(nèi)外的半導(dǎo)體創(chuàng)新領(lǐng)袖企業(yè)高管們又帶來(lái)哪些前瞻觀(guān)點(diǎn)?此次,電子發(fā)燒友網(wǎng)特別采訪(fǎng)了云天勵(lì),以下是這家公司對(duì)2026半導(dǎo)體產(chǎn)業(yè)的分析與展望。
    的頭像 發(fā)表于 12-23 10:13 ?1.1w次閱讀
    <b class='flag-5'>云天</b><b class='flag-5'>勵(lì)</b><b class='flag-5'>飛</b>:AI<b class='flag-5'>推理</b>需求狂飆,國(guó)產(chǎn)<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>機(jī)遇期加速到來(lái)

    積木+3D堆疊!GPNPU架構(gòu)創(chuàng)新,應(yīng)對(duì)AI推理需求

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025,人工智能正式邁入應(yīng)用推理時(shí)代。大模型從實(shí)驗(yàn)室走向千行業(yè),推理需求呈指數(shù)級(jí)爆發(fā)。然而,高昂的推理成本
    的頭像 發(fā)表于 12-11 08:57 ?7825次閱讀

    云天勵(lì)AI推理芯片如何賦能千行業(yè)

    11月26日,云天會(huì)客廳第二期生態(tài)沙龍暨深商聯(lián)高科技高成長(zhǎng)創(chuàng)新?tīng)I(yíng)走進(jìn)上市公司活動(dòng)圓滿(mǎn)舉辦。來(lái)自深圳科技領(lǐng)域的多位企業(yè)負(fù)責(zé)人齊聚云天勵(lì),共同探討AI
    的頭像 發(fā)表于 12-03 13:58 ?619次閱讀

    云天勵(lì)亮相2025中國(guó)國(guó)際半導(dǎo)體博覽會(huì)

    202511月23日,第二十二屆中國(guó)國(guó)際半導(dǎo)體博覽會(huì)(IC China 2025)在北京國(guó)家會(huì)議中心啟幕。在24日舉辦的 “人工智能及大模型芯片論壇” 上,云天勵(lì)
    的頭像 發(fā)表于 11-25 11:29 ?687次閱讀

    云天勵(lì)亮相ICCAD-Expo 2025

    當(dāng)大模型從技術(shù)探索邁向規(guī)?;瘧?yīng)用深水區(qū),“供需失衡”與“推理成本高企”已成為制約產(chǎn)業(yè)發(fā)展的關(guān)鍵瓶頸。
    的頭像 發(fā)表于 11-25 11:27 ?497次閱讀

    云天勵(lì)與金蝶達(dá)成戰(zhàn)略合作

    11月4日,在2025金蝶全球創(chuàng)見(jiàn)者大會(huì)上,云天勵(lì)與金蝶簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 11-05 18:09 ?1666次閱讀

    需求狂飆下的“效率競(jìng)賽”,國(guó)產(chǎn)AI芯片有何破局之道?

    電子發(fā)燒友原創(chuàng) 章鷹 近日,國(guó)產(chǎn)芯片廠(chǎng)商云天勵(lì)發(fā)布
    的頭像 發(fā)表于 10-19 01:11 ?9799次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>需求狂飆下的“效率競(jìng)賽”,國(guó)產(chǎn)AI<b class='flag-5'>芯片</b>有何破局之道?

    云天勵(lì)亮相2025灣區(qū)半導(dǎo)體產(chǎn)業(yè)生態(tài)博覽會(huì)

    在2025灣區(qū)半導(dǎo)體產(chǎn)業(yè)生態(tài)博覽會(huì)(灣芯展)上,云天勵(lì)以“積木”為核心理念,攜全棧AI推理
    的頭像 發(fā)表于 10-16 17:45 ?997次閱讀

    云天勵(lì)正式加入OISA生態(tài)

    近日,云天勵(lì)正式加入 OISA 生態(tài),攜手產(chǎn)業(yè)伙伴共同推動(dòng)國(guó)產(chǎn) AI 芯片互聯(lián)體系建設(shè),為中國(guó)
    的頭像 發(fā)表于 10-11 13:59 ?640次閱讀

    云天勵(lì)亮相2025全球AI芯片峰會(huì)

    9 月 17 日,全球 AI 芯片峰會(huì)在上海舉行,云天勵(lì)董事長(zhǎng)兼 CEO 陳寧出席并發(fā)表演講。
    的頭像 發(fā)表于 09-17 17:56 ?1363次閱讀

    《AI芯片:科技探索與AGI愿景》—— 勾勒計(jì)算未來(lái)戰(zhàn)略羅盤(pán)

    如果說(shuō)是AGI的“燃料”,那么AI芯片就是制造燃料的“精煉廠(chǎng)”。本書(shū)的卓越之處在于,它超越了單純的技術(shù)拆解,成功繪制了一幅從專(zhuān)用智能邁向通用智能的“戰(zhàn)略
    發(fā)表于 09-17 09:32