91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-01-28 17:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道 1月27日,國產(chǎn)GPU廠商曦望(Sunrise)重磅發(fā)布新一代推理GPU芯片——啟望S3。這是曦望在近一年累計完成約30億元戰(zhàn)略融資后的首次集中公開亮相。2025年,曦望芯片交付量已突破萬片。

啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場景下,它的整體性價比較上一代提升超10倍。在算力與存儲設(shè)計方面,該芯片支持FP16至FP4精度切換,采用LPDDR6顯存方案,顯存容量提升4倍,有效緩解了大模型推理的顯存瓶頸,成為國內(nèi)首款采用此顯存方案的芯片。在DeepSeek V3/R1滿血版等主流大模型推理中,單位Token成本較上一代降低約90%,讓“百萬Token一分錢”成為可能,極大推動了大模型推理的大規(guī)模普惠應(yīng)用。

曦望是國產(chǎn)全棧自研人工智能算力芯片企業(yè),其前身是商湯大芯片部門,于2024年底分拆獨(dú)立運(yùn)營。它專注于高性能GPU及多模態(tài)場景推理芯片的研發(fā)與商業(yè)化,憑借八年技術(shù)沉淀、二十億研發(fā)投入及兩代量產(chǎn)芯片的工程化驗(yàn)證,已成為國產(chǎn)GPU替代的核心力量。公司致力于為千行百業(yè)提供成本降低十倍、能效比突破的智能算力基石,推動各行業(yè)智能化發(fā)展,助力實(shí)現(xiàn)通用人工智能(AGI)的普惠化目標(biāo)。

曦望已構(gòu)建起覆蓋全場景需求的三代芯片產(chǎn)品矩陣。2020年量產(chǎn)的首款AI推理芯片S1,適配千余種CV模型,滿足了視覺推理領(lǐng)域的需求。2024年量產(chǎn)的S2芯片,深度兼容CUDA生態(tài),能流暢推理DeepSeek、Qwen等開源大模型,以及文生圖、文生視頻、文生3D主流模型,進(jìn)一步拓展了應(yīng)用場景。而此次推出的S3芯片,定位“推理性價比之王”,在單位Token成本、能耗表現(xiàn)上實(shí)現(xiàn)數(shù)量級突破,原生支持FP8/FP4低精度推理,為大模型推理提供核心支撐。

作為國內(nèi)首家All - in推理的GPU芯片公司,曦望始終深耕推理賽道。在一年內(nèi),它順利完成了近30億元戰(zhàn)略融資,投資方陣容強(qiáng)大。既有三一集團(tuán)旗下華胥基金、范式智能等產(chǎn)業(yè)投資方,也有無極資本、IDG資本等國內(nèi)知名VC/PE機(jī)構(gòu),還獲得了誠通混改基金等國資背景資本的鼎力加持。所籌資金將專項(xiàng)用于下一代推理GPU的核心技術(shù)研發(fā)、規(guī)?;慨a(chǎn)及生態(tài)共建,持續(xù)夯實(shí)其在推理算力賽道的核心競爭力。

此次發(fā)布,曦望不僅帶來了啟望S3芯片,還推出了一整套面向大模型推理的解決方案。寰望SC3 - 256超節(jié)點(diǎn)方案,面向千億、萬億級參數(shù)多模態(tài)MoE推理,采用全液冷設(shè)計,支持大規(guī)模專家并行部署,同等算力規(guī)模下,整體交付成本從“億元級”降至“千萬元級”?!鞍偃fToken一分錢”計劃,聯(lián)合商湯科技等伙伴共同發(fā)起,大幅降低企業(yè)使用算力的門檻。共建推理云通過GPU池化與彈性調(diào)度,將算力整合為統(tǒng)一“算力池”,以MaaS為核心入口,讓企業(yè)按需調(diào)用算力。

當(dāng)前,AI模型訓(xùn)練已邁入深水區(qū),推理環(huán)節(jié)成為AI技術(shù)商業(yè)化落地的關(guān)鍵。曦望以啟望S3芯片為核心,通過“芯片 + 系統(tǒng) + 生態(tài)”的布局,讓推理算力變得更像水電一樣,成為可規(guī)?;⒖沙掷m(xù)的基礎(chǔ)設(shè)施,引領(lǐng)國產(chǎn)GPU邁向新的高度。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135506
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    堪稱史上最強(qiáng)推理芯片!英偉達(dá)發(fā)布 Rubin CPX,實(shí)現(xiàn)50倍ROI

    款A(yù)I芯片,Rubin CPX采用了成本效益極高的單芯片設(shè)計,集成強(qiáng)大的NVFP4計算資源,其GPU專為AI
    的頭像 發(fā)表于 09-11 08:25 ?1.1w次閱讀
    堪稱史上最強(qiáng)<b class='flag-5'>推理</b><b class='flag-5'>芯片</b>!英偉達(dá)<b class='flag-5'>發(fā)布</b> Rubin CPX,實(shí)現(xiàn)50倍ROI

    云C系列GPU Day 0 適配智譜全新一代大模型GLM-5

    智譜AI正式上線并開源全新一代大模型 GLM-5,沐股份實(shí)現(xiàn)?Day 0 深度適配。 GLM-5目前可于云 C 系列(C500/C550/C588)上穩(wěn)定高效運(yùn)行。 近期,智譜AI相繼發(fā)布
    的頭像 發(fā)表于 02-12 10:53 ?830次閱讀
    <b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b> Day 0 適配智譜全<b class='flag-5'>新一代</b>大模型GLM-5

    百億Token分錢!云天勵飛喊出“推理成本萬倍降”,公布三年三芯路線圖

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)當(dāng)前,全球人工智能邁入具身智能(Agentic AI)時代,云天勵飛董事長兼CEO陳寧博士在“大算力芯片戰(zhàn)略前瞻會”上再次強(qiáng)調(diào):公司將聚焦大模型推理芯片。在大會上,云天
    的頭像 發(fā)表于 02-09 14:54 ?4375次閱讀
    百億<b class='flag-5'>Token</b><b class='flag-5'>一</b>分錢!云天勵飛喊出“<b class='flag-5'>推理成本</b>萬倍降”,公布三年三芯路線圖

    力爭百萬 Tokens 推理成本降低百倍:云天勵飛發(fā)布未來三年大算力芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    集中于攻克大模型落地的“成本壁壘”,致力于通過底層架構(gòu)創(chuàng)新,力爭實(shí)現(xiàn)百萬 Tokens 推理成本降低 100 倍以上的目標(biāo),推動 AI 從技術(shù)嘗鮮走向普惠生產(chǎn)力。產(chǎn)業(yè)變局:推理競速,從
    的頭像 發(fā)表于 02-03 20:25 ?1981次閱讀
    力爭百萬 Tokens <b class='flag-5'>推理成本</b><b class='flag-5'>降低</b>百倍:云天勵飛<b class='flag-5'>發(fā)布</b>未來三年大算力<b class='flag-5'>芯片</b>戰(zhàn)略,首曝 DeepVerse 路線圖

    今日看點(diǎn):消息稱 AMD、高通考慮導(dǎo)入 SOCAMM 內(nèi)存;發(fā)布新一代推理GPU芯片S3

    發(fā)布新一代推理GPU芯片
    發(fā)表于 01-28 11:09 ?411次閱讀

    云巨頭算力戰(zhàn)升級!微軟新一代3nm AI推理芯片性能提升30%,落地數(shù)據(jù)中心

    據(jù)外媒報道,微軟發(fā)布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達(dá)旗艦處理器以及云服務(wù)競爭對手亞馬遜、谷歌同類產(chǎn)品的替代選擇。微軟稱,這款
    的頭像 發(fā)表于 01-27 12:29 ?4944次閱讀
    云巨頭算力戰(zhàn)升級!微軟<b class='flag-5'>新一代</b>3nm AI<b class='flag-5'>推理</b><b class='flag-5'>芯片</b>性能提升30%,落地數(shù)據(jù)中心

    NVIDIA在CES 2026發(fā)布新一代Rubin AI平臺

    通過跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機(jī)、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網(wǎng)交換機(jī)的極致協(xié)同設(shè)計,大幅縮短訓(xùn)練時間,降低
    的頭像 發(fā)表于 01-09 10:23 ?628次閱讀

    華為數(shù)據(jù)存儲與「DaoCloud 道客」發(fā)布AI推理加速聯(lián)合解決方案

    規(guī)?;l(fā)展的攔路虎。在有限算力下,長序列輸入導(dǎo)致首Token時延(TTFT)增加,甚至超長序列超出模型上下文窗口限制;隨著并發(fā)數(shù)增加,推理吞吐開始下降,任務(wù)頻繁卡頓;歷史對話和行業(yè)知識的重復(fù)調(diào)用造成算力浪費(fèi),加大推理成本。如何優(yōu)
    的頭像 發(fā)表于 11-28 10:03 ?407次閱讀
    華為數(shù)據(jù)存儲與「DaoCloud 道客」<b class='flag-5'>發(fā)布</b>AI<b class='flag-5'>推理</b>加速聯(lián)合解決方案

    首款全國產(chǎn)通用GPU芯片發(fā)布集成推出云C600

    ,并支持MetaXLink超節(jié)點(diǎn)擴(kuò)展技術(shù),在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓(xùn)練和推理需求。 而且,沐股份與中國科學(xué)院合作的國產(chǎn)千卡集群,已完成多個大模型全參數(shù)訓(xùn)練,證實(shí)國產(chǎn)算力已具備大模型預(yù)訓(xùn)練能力。 公開資料
    的頭像 發(fā)表于 10-19 20:04 ?4.6w次閱讀

    今日看點(diǎn)丨華為發(fā)布AI推理創(chuàng)新技術(shù)UCM;比亞迪汽車出口暴增130%

    緩存加速算法工具,分級管理推理過程中產(chǎn)生的KV Cache記憶數(shù)據(jù),可擴(kuò)大推理上下文窗口,實(shí)現(xiàn)高吞吐、低時延的推理體驗(yàn),降低Token
    發(fā)表于 08-13 09:45 ?5363次閱讀

    今日看點(diǎn)丨兩家國產(chǎn)頭部廠商發(fā)布新一代AI芯片 ;臺積電在美先進(jìn)封裝布局啟動

    ? ? H20重返中國在即,兩家國產(chǎn)頭部廠商發(fā)布新一代AI芯片 ? 日前,燧原科技和沐這兩家頭部國產(chǎn)AI芯片廠商首發(fā)各自
    發(fā)表于 07-28 10:41 ?2485次閱讀
    今日看點(diǎn)丨兩家國產(chǎn)頭部廠商<b class='flag-5'>發(fā)布</b><b class='flag-5'>新一代</b>AI<b class='flag-5'>芯片</b> ;臺積電在美先進(jìn)封裝布局啟動

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強(qiáng)大的推理引擎能力,融合了自然語言處理(NLP)、深度
    發(fā)表于 07-16 15:29

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計于今年晚些時候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?3738次閱讀

    加速DeepSeek滿血版單卡C500異構(gòu)推理

    近日,基于開源KTransformers架構(gòu)的 CPU/GPU 異構(gòu)推理能力,沐云C500單卡GPU上成功實(shí)現(xiàn)DeepSeek-R1-
    的頭像 發(fā)表于 03-20 15:52 ?2268次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫加速并擴(kuò)展AI推理模型

    Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其
    的頭像 發(fā)表于 03-20 15:03 ?1247次閱讀