91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

萬(wàn)億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2大模型

全球TMT ? 來(lái)源:全球TMT ? 作者:全球TMT ? 2025-07-22 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2025年7月21日 /美通社/ --浪潮信息宣布元腦企智一體機(jī)已率先完成對(duì)Kimi K2 萬(wàn)億參數(shù)大模型的適配支持,并實(shí)現(xiàn)單用戶70 tokens/s的流暢輸出速度,為企業(yè)客戶高效部署應(yīng)用大模型提供高處理性能和完善的軟件工具平臺(tái)支持。


Kimi K2是月之暗面推出的開(kāi)源萬(wàn)億參數(shù)大模型,創(chuàng)新使用了MuonClip優(yōu)化器進(jìn)行訓(xùn)練,大幅提升了模型的學(xué)習(xí)效率。K2在代碼生成、數(shù)學(xué)推理、Agent多步驟任務(wù)上展現(xiàn)出領(lǐng)先能力,評(píng)測(cè)指標(biāo)達(dá)到業(yè)界領(lǐng)先水平。自發(fā)布以來(lái),K2在開(kāi)發(fā)者和研究社區(qū)引起廣泛關(guān)注,迅速獲得在編碼輔助和Agent驅(qū)動(dòng)自動(dòng)化任務(wù)中的部署應(yīng)用。

Kimi K2的模型總參數(shù)量達(dá)1萬(wàn)億,激活參數(shù)為320億。K2使用混合專家(MoE)模型結(jié)構(gòu),較DeepSeek V3采用了更大的參數(shù)量和更多的專家數(shù)。K2模型1萬(wàn)億的參數(shù)量對(duì)AI計(jì)算系統(tǒng)提出至少1TB的顯存容量需求,384個(gè)路由專家所帶來(lái)的專家負(fù)載不均衡性對(duì)推理速度有很大影響。目前業(yè)界可公開(kāi)訪問(wèn)的K2 API的輸出速度一般低于20 tokens/s,這樣較低的性能對(duì)于編程或Agent類場(chǎng)景很不友好,會(huì)嚴(yán)重影響用戶體驗(yàn)。Kimi K2憑借其為智能體任務(wù)設(shè)計(jì)的架構(gòu)和優(yōu)秀的智能體驗(yàn),展現(xiàn)出巨大的應(yīng)用潛力,但提升推理速度和輸出穩(wěn)定性是其成為可信賴的生產(chǎn)力工具需要解決的核心挑戰(zhàn)。

元腦企智一體機(jī)采用元腦服務(wù)器NF5688G7作為算力底座,其搭載FP8計(jì)算引擎,配備1128GB HBM3e高速顯存,單臺(tái)服務(wù)器即可支持K2 萬(wàn)億參數(shù)全量模型部署。NF5688G7服務(wù)器具備900GB/s的GPU P2P帶寬,為Kimi K2提供了專家間高速并行通信,最大化并行效率。該服務(wù)器可支持3200Gbps的RDMA擴(kuò)展網(wǎng)絡(luò),為預(yù)填充-解碼分離部署和大規(guī)模專家并行預(yù)留了充足的擴(kuò)展空間。

浪潮信息已完成元腦企智一體機(jī)對(duì)K2的適配,支持64K上下文長(zhǎng)度和多路用戶實(shí)時(shí)并發(fā)訪問(wèn)。基于SGLang推理框架,通過(guò)減少M(fèi)oE對(duì)齊塊大小內(nèi)核的小批量模式開(kāi)銷和fused_moe的內(nèi)存消耗,并復(fù)用deepGEMM等高效算子,實(shí)現(xiàn)單用戶并發(fā)下輸出速度超過(guò)70 tokens/s,25用戶并發(fā)時(shí)每用戶輸出速度超過(guò)25 tokens/s。優(yōu)化后的計(jì)算性能可保證用戶在進(jìn)行復(fù)雜的代碼生成、長(zhǎng)文本書(shū)寫(xiě)或Agent調(diào)用時(shí),能夠獲得流暢、低延遲的交互體驗(yàn)。

wKgZO2h-PNGAL-wnAAF67yjafGk421.jpg


SGLang啟動(dòng)K2推理服務(wù),用戶交互時(shí)的解碼速度

元腦企智一體機(jī)提供了元腦企智(EPAI)平臺(tái)與K2大模型的無(wú)縫集成,為企業(yè)用戶提供了一套軟硬件協(xié)同優(yōu)化、開(kāi)箱即用的端到端大模型私有化部署解決方案。通過(guò)元腦企智平臺(tái),企業(yè)可利用低代碼、可視化界面,便捷地進(jìn)行數(shù)據(jù)準(zhǔn)備、模型微調(diào)、知識(shí)檢索(RAG)和智能體(Agent)構(gòu)建。

元腦企智一體機(jī)已成功部署于金融、制造、能源、醫(yī)療等多個(gè)關(guān)鍵行業(yè),幫助企業(yè)快速、安全、經(jīng)濟(jì)地構(gòu)建專屬大模型應(yīng)用,加速產(chǎn)業(yè)智能化轉(zhuǎn)型步伐。

浪潮信息是全球領(lǐng)先的IT基礎(chǔ)設(shè)施產(chǎn)品、方案和服務(wù)提供商,通過(guò)發(fā)展新一代以系統(tǒng)為核心的計(jì)算架構(gòu),打造開(kāi)放、多元、綠色的元腦智算產(chǎn)品和方案。浪潮信息致力于AI計(jì)算平臺(tái)、資源平臺(tái)和算法平臺(tái)的研發(fā)創(chuàng)新,并通過(guò)元腦生態(tài)攜手領(lǐng)先伙伴,加速人工智能的創(chuàng)新和應(yīng)用落地。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3651

    瀏覽量

    5191
  • Kimi
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    314
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DeepSeek一體機(jī)背后,國(guó)產(chǎn)算力芯片崛起

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)自DeepSeek推出以來(lái),最火的硬件產(chǎn)品非DeepSeek一體機(jī)莫屬。DeepSeek大模型的應(yīng)用和部署設(shè)計(jì)需要計(jì)算設(shè)備的支持,根據(jù)不同的大模型
    的頭像 發(fā)表于 03-10 08:19 ?7471次閱讀
    DeepSeek<b class='flag-5'>一體機(jī)</b>背后,國(guó)產(chǎn)算力芯片崛起

    OBOO鷗柏交互式查詢一體機(jī):展館里的智能信息導(dǎo)航站

    一體機(jī)
    鷗柏科技
    發(fā)布于 :2025年12月30日 19:04:58

    潤(rùn)和軟件入選大模型一體機(jī)產(chǎn)業(yè)圖譜

    近日,由中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟與中國(guó)信息通信研究院聯(lián)合編制的《大模型一體機(jī)產(chǎn)業(yè)圖譜》正式發(fā)布。該圖譜系統(tǒng)梳理并收錄了國(guó)內(nèi)大模型一體機(jī)產(chǎn)業(yè)鏈上下游70余家代表性企業(yè),全面呈現(xiàn)我國(guó)大
    的頭像 發(fā)表于 12-10 17:56 ?1512次閱讀
    潤(rùn)和軟件入選大<b class='flag-5'>模型</b><b class='flag-5'>一體機(jī)</b>產(chǎn)業(yè)圖譜

    澎峰科技最新推出Deep Fusion DF35智算一體機(jī)

    在人工智能加速落地的今天,企業(yè)部署大模型面臨成本、性能與數(shù)據(jù)安全的三重挑戰(zhàn)。澎峰科技最新推出的Deep Fusion DF35智算一體機(jī),以29000起的突破性定價(jià),將Qwen3-Next 80B FP16精度
    的頭像 發(fā)表于 10-13 16:51 ?1768次閱讀
    澎峰科技最新推出Deep Fusion DF35智算<b class='flag-5'>一體機(jī)</b>

    浪潮信息發(fā)布&quot;SD200&quot;超節(jié)點(diǎn),面向萬(wàn)億參數(shù)模型創(chuàng)新設(shè)計(jì)

    擴(kuò)展支持64路本土GPU芯片。SD200可實(shí)現(xiàn)單機(jī)內(nèi)運(yùn)行超萬(wàn)億參數(shù)模型,并
    的頭像 發(fā)表于 08-08 22:17 ?683次閱讀
    浪潮信息發(fā)布&quot;<b class='flag-5'>元</b><b class='flag-5'>腦</b>SD200&quot;超節(jié)點(diǎn),面向<b class='flag-5'>萬(wàn)億</b><b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計(jì)

    ?Groq LPU 如何讓萬(wàn)億參數(shù)模型「飛」起來(lái)?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何讓萬(wàn)億參數(shù)模型「飛」起來(lái)?揭秘 Kimi K2 40 倍提速背后的黑科技? 最近,Moonshot AI 的千億參數(shù)
    的頭像 發(fā)表于 08-07 10:01 ?985次閱讀

    一體機(jī)主板步入大存儲(chǔ)時(shí)代,存儲(chǔ)突圍到性能質(zhì)變

    ,我們發(fā)現(xiàn)了客戶新的需求。一體機(jī)電腦場(chǎng)景在企業(yè)辦公多任務(wù)處理中,多開(kāi)辦公軟件、數(shù)據(jù)報(bào)表處理卡頓,需要更多內(nèi)存支持多應(yīng)用同時(shí)流暢運(yùn)行。場(chǎng)景二專業(yè)設(shè)計(jì)與渲染、4K視頻剪
    的頭像 發(fā)表于 06-19 10:47 ?569次閱讀
    <b class='flag-5'>一體機(jī)</b>主板步入大存儲(chǔ)時(shí)代,存儲(chǔ)突圍到性能質(zhì)變

    開(kāi)普云「開(kāi)悟智核」:極致性價(jià)比的智能一體機(jī),破局大模型應(yīng)用難題

    當(dāng)下,AI一體機(jī)憑借開(kāi)箱即用、數(shù)據(jù)可控等優(yōu)勢(shì),成為行業(yè)大模型落地的重要載體之。然而實(shí)際應(yīng)用時(shí),用戶卻面臨諸多問(wèn)題:算力成本與性能難以平衡;非滿血版模型存在“幻覺(jué)”、精度低等問(wèn)題;由于
    的頭像 發(fā)表于 06-09 10:34 ?1105次閱讀
    開(kāi)普云「開(kāi)悟智核」:極致性價(jià)比的智能<b class='flag-5'>體</b><b class='flag-5'>一體機(jī)</b>,破局大<b class='flag-5'>模型</b>應(yīng)用難題

    松下4K手持式攝錄一體機(jī)AJ-UPX380介紹

    2025年第季度,松下正式推出4K手持式攝錄一體機(jī)AJ-UPX380,旨在為廣播及流媒體專業(yè)人士提供更高品質(zhì)的視頻制作解決方案。作為UPX系列專業(yè)攝錄一體機(jī)的新成員,AJ-UPX38
    的頭像 發(fā)表于 05-30 15:54 ?1612次閱讀

    21.5寸觸摸一體機(jī):便捷互動(dòng)的新窗口

    一體機(jī)
    朗銳智科
    發(fā)布于 :2025年04月10日 15:34:00

    中科曙光助力天翼云打造“翼政通”大模型一體機(jī)

    近來(lái),DeepSeek系列模型在政務(wù)領(lǐng)域展現(xiàn)出強(qiáng)大的賦能潛力。天翼云選擇曙光AI解決方案,憑借內(nèi)置的DeepAI深算智能引擎,完成軟硬件適配與深度調(diào)優(yōu),聯(lián)合打造出“翼政通”大模型一體機(jī)。該一體
    的頭像 發(fā)表于 03-13 11:35 ?1618次閱讀

    夜爆火的DeepSeek一體機(jī),如何改寫(xiě)AI游戲規(guī)則?

    DeepSeek一體機(jī),都不好意思說(shuō)自己懂AI。” 所謂一體機(jī),通常匯集了中央處理器(CPU)、圖形處理器(GPU)、存儲(chǔ)器、操作系統(tǒng)、AI 軟件平臺(tái)以及各類模型算法,是個(gè)軟硬件組件
    的頭像 發(fā)表于 03-11 15:52 ?1214次閱讀
    <b class='flag-5'>一</b>夜爆火的DeepSeek<b class='flag-5'>一體機(jī)</b>,如何改寫(xiě)AI游戲規(guī)則?

    浪潮信息:智DeepSeek一體機(jī)將舉辦生態(tài)伙伴推介體驗(yàn)會(huì)

    ?3月11日,浪潮信息將面向全國(guó)生態(tài)伙伴舉辦"智DeepSeek一體機(jī)生態(tài)伙伴推介體驗(yàn)
    的頭像 發(fā)表于 03-09 14:20 ?601次閱讀
    浪潮信息:<b class='flag-5'>元</b><b class='flag-5'>腦</b><b class='flag-5'>企</b>智DeepSeek<b class='flag-5'>一體機(jī)</b>將舉辦生態(tài)伙伴推介體驗(yàn)會(huì)