91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

?Groq LPU 如何讓萬億參數(shù)模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技

觀芯者 ? 來源:觀芯者 ? 作者:觀芯者 ? 2025-08-07 10:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Groq LPU 如何讓萬億參數(shù)模型「飛」起來?揭秘 Kimi K2 40 倍提速背后的黑科技?

最近,Moonshot AI 的千億參數(shù)大模型 ?Kimi K2? 在 ?GroqCloud? 上開放預(yù)覽,引發(fā)了開發(fā)者社區(qū)的瘋狂討論——?為什么 Groq 能跑得這么快??

傳統(tǒng) AI 推理硬件(如 GPU)往往面臨一個兩難選擇:
? ?快?(但犧牲精度)
? ?準(zhǔn)?(但延遲高到無法接受)

而 Groq 的 ?LPU(Language Processing Unit)? 卻打破了這一魔咒,?既快又準(zhǔn)?。

1. 精度與速度的「魚與熊掌」:如何兼得??
傳統(tǒng)硬件的「量化陷阱」?

大多數(shù) AI 加速器(如 GPU)為了提升推理速度,會采用 ?INT8/FP8 等低精度計算?,但這會導(dǎo)致?累積誤差?,模型質(zhì)量大幅下降。

Groq 的「TruePoint Numerics」黑科技?

Groq 的解決方案是 ?動態(tài)精度調(diào)整?:

權(quán)重/激活函數(shù)?:用低精度存儲(節(jié)省內(nèi)存)
矩陣運(yùn)算?:全精度計算(保證結(jié)果無損)
輸出階段?:根據(jù)下游需求?智能選擇量化策略?

這樣一來,?速度比 BF16 快 2-4 倍,但精度無損?(MMLU/HumanEval 等基準(zhǔn)測試驗證)。

2. 內(nèi)存架構(gòu)革命:SRAM 替代 HBM/DRAM?

傳統(tǒng) AI 芯片(如 GPU)依賴 ?HBM/DRAM? 作為主存,?每次權(quán)重訪問延遲高達(dá)數(shù)百納秒?,嚴(yán)重影響推理速度。

而 Groq ?直接集成數(shù)百兆片上 SRAM?,讓權(quán)重加載?零延遲?,計算單元?全速運(yùn)轉(zhuǎn)?。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301305
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3647

    瀏覽量

    5176
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    模型 ai coding 比較

    :DeepSeek 10/10(100%通過),Kimi 2/10(20%通過) 2. Debug修復(fù)能力(權(quán)重35%) 測試目標(biāo) :模型排查和修復(fù)代碼問題的能力 測評數(shù)據(jù)集:Debu
    發(fā)表于 02-19 13:43

    月之暗面發(fā)布官方編程工具Kimi Code

    月之暗面已正式發(fā)布 Kimi 的編程工具:Kimi Code。
    的頭像 發(fā)表于 01-29 10:23 ?977次閱讀
    月之暗面發(fā)布官方編程工具<b class='flag-5'>Kimi</b> Code

    月之暗面全新開源旗艦模型Kimi K2.5上線模力方舟

    模力方舟平臺現(xiàn)已上線來自月之暗面(Moonshot AI)發(fā)布的全新開源旗艦模型Kimi K2.5。
    的頭像 發(fā)表于 01-29 10:20 ?854次閱讀
    月之暗面全新開源旗艦<b class='flag-5'>模型</b><b class='flag-5'>Kimi</b> <b class='flag-5'>K</b>2.5上線模力方舟

    開源大模型算力革命下:電子谷連接技術(shù)的堅守與未來

    推動算力系統(tǒng)向超節(jié)點架構(gòu)轉(zhuǎn)型。"元腦SD200"等新一代服務(wù)器通過開放總線技術(shù)實現(xiàn)萬億參數(shù)模型的實時運(yùn)行,而這一突破的背后,離不開連接器、線束等核心部件的技術(shù)支撐
    的頭像 發(fā)表于 09-19 08:03 ?508次閱讀
    開源大<b class='flag-5'>模型</b>算力革命下:電子谷連接技術(shù)的堅守與未來

    重磅!智慧水利背后的NTP時間同步服務(wù)器揭秘!

    重磅!智慧水利背后的NTP時間同步服務(wù)器揭秘!
    的頭像 發(fā)表于 09-10 10:41 ?781次閱讀
    重磅!智慧水利<b class='flag-5'>背后</b>的NTP時間同步服務(wù)器<b class='flag-5'>揭秘</b>!

    Dynamo 0.4在NVIDIA Blackwell上通過PD分離將性能提升4

    近期,OpenAI 的 gpt-oss、月之暗面的 Kimi K2 等多個新的前沿開源模型相繼問世,標(biāo)志著大語言模型 (LLM) 創(chuàng)新浪潮的加速。近日發(fā)布的 Dynamo 0.4 提供
    的頭像 發(fā)表于 08-22 15:59 ?1421次閱讀
    Dynamo 0.4在NVIDIA Blackwell上通過PD分離將性能提升4<b class='flag-5'>倍</b>

    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點,面向萬億參數(shù)模型創(chuàng)新設(shè)計

    擴(kuò)展支持64路本土GPU芯片。元腦SD200可實現(xiàn)單機(jī)內(nèi)運(yùn)行超萬億參數(shù)模型,并支持多個領(lǐng)先大模型機(jī)內(nèi)同時運(yùn)行及多智能體實時協(xié)作與按需調(diào)用,目前已率先實現(xiàn)商用。在實際評測中,元腦SD2
    的頭像 發(fā)表于 08-08 22:17 ?673次閱讀
    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點,面向<b class='flag-5'>萬億</b><b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計

    請問InDTU IHDMP協(xié)議使用的CRC校驗使用的什么參數(shù)模型?

    InDTU IHDMP協(xié)議使用的CRC校驗使用的什么參數(shù)模型
    發(fā)表于 08-06 07:57

    面向萬億參數(shù)模型,“超節(jié)點”涌現(xiàn)

    UniPoD系列超節(jié)點產(chǎn)品,旨在為萬億參數(shù)模型的訓(xùn)練與推理提供更強(qiáng)勁、更智能且更綠色的算力支持。 ? H3C UniPoD系列超節(jié)點產(chǎn)品基于領(lǐng)先的Scale-up南向互聯(lián)技術(shù),可實現(xiàn)單機(jī)柜最高64卡GPU間的高速互聯(lián)互通,
    的頭像 發(fā)表于 08-03 02:37 ?8898次閱讀
    面向<b class='flag-5'>萬億</b>級<b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>,“超節(jié)點”涌現(xiàn)

    奇異摩爾邀您相約2025 AI網(wǎng)絡(luò)技術(shù)應(yīng)用創(chuàng)新大會

    AI大模型的軍備賽每天都在上演,近期Kimi發(fā)布的K2模型再次引發(fā)全球關(guān)注。相關(guān)專業(yè)機(jī)構(gòu)評價K2是至今最好的開源權(quán)重
    的頭像 發(fā)表于 08-01 17:27 ?1245次閱讀

    硅基流動攜手沐曦首發(fā)基于曦云的Kimi K2推理服務(wù)

    今天,硅基流動聯(lián)合沐曦集成電路(上海)股份有限公司(簡稱“沐曦”),全球首發(fā)基于沐曦曦云 C550 集群的月之暗面 Kimi-K2模型商業(yè)化服務(wù)部署。該服務(wù)運(yùn)行于匯天網(wǎng)絡(luò)科技有限公司(簡稱“匯
    的頭像 發(fā)表于 07-23 17:33 ?1922次閱讀

    萬億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布元腦企智一體機(jī)已率先完成對Kimi K2 萬億參數(shù)模型的適配支持,并實現(xiàn)單用戶70
    的頭像 發(fā)表于 07-22 09:27 ?556次閱讀
    <b class='flag-5'>萬億</b><b class='flag-5'>參數(shù)</b>!元腦企智一體機(jī)率先支持<b class='flag-5'>Kimi</b> <b class='flag-5'>K2</b>大<b class='flag-5'>模型</b>

    API電商“起來,告別手動操作

    ,您輕松告別繁瑣的手動操作。本文將一步步解析如何利用API實現(xiàn)電商流程的自動化,幫助您的業(yè)務(wù)“起來。我們將從基礎(chǔ)概念入手,逐步展示實際應(yīng)用,并提供一個簡單的代碼示例,確保您能快速上手。 什么是API及其在電商中的
    的頭像 發(fā)表于 07-16 10:31 ?424次閱讀
    API<b class='flag-5'>讓</b>電商“<b class='flag-5'>飛</b>”<b class='flag-5'>起來</b>,告別手動操作

    K1,K2,K3是圓形旋轉(zhuǎn)開關(guān)問題

    如圖所示,K1,K2,K3是圓形旋轉(zhuǎn)開關(guān)(控制M的轉(zhuǎn)速),一次只有一個接通,當(dāng)任意一個接通時,K4閉合則M1得電工作,需三個開關(guān)二極管但不懂選型,請熱心網(wǎng)友們支招,多謝!
    發(fā)表于 05-15 21:06

    模型部署到S32K3xx EVB時出現(xiàn)“下載失敗”錯誤的原因?如何解決?

    否與 Simulink 模型或 MATLAB 設(shè)置中缺少配置有關(guān)? 2- 我是否需要將任何特定的固件更新應(yīng)用于 OpenSDA 或 J-Link 調(diào)試器以支持 S32K3xx? 請
    發(fā)表于 04-11 06:27