?近期,澎峰科技與沐曦完成了對PerfXLM(推理引擎)、PerfXCloud(大模型服務(wù)平臺)與沐曦的曦云系列通用計算GPU的聯(lián)合測試,測試結(jié)果表明PerfXLM、PerfXCloud軟件與沐曦GPU產(chǎn)品實現(xiàn)了全面兼容。
PerfXLM高性能大模型推理引擎與沐曦GPU硬件平臺完成適配,PerfXLM采用云邊端一體架構(gòu),支持云端和本地大模型推理。經(jīng)過雙方聯(lián)合測試,PerfXLM對沐曦GPU硬件平臺的兼容性、穩(wěn)定性和可靠性上取得極大領(lǐng)先,部分指標(biāo)實現(xiàn)了對NVIDIA A100的反超。PerfXLM 針對部分大模型的計算性能優(yōu)化成果堪稱卓越,多個主流模型在在該平臺的推理總吞吐速度實現(xiàn)了最高達到50%的性能提升。標(biāo)志著雙方在CUDA生態(tài)兼容上實現(xiàn)再次突破。
PerfXCloud大模型服務(wù)平臺與沐曦的GPU硬件平臺完成適配,并完成了超80種大模型的推理、微調(diào)(包括Qwen系列、Yi-Coder系列、DeepSeek系列、Llama系列、ChatGLM系列等)支持,兼容性在國內(nèi)處于領(lǐng)先地位。未來,雙方將不斷豐富模型倉庫,以滿足多樣化的應(yīng)用需求,為用戶提供更優(yōu)質(zhì)和便捷的模型服務(wù),幫助智算中心升級進化為超級AI Foundry。
此次合作,為國產(chǎn)計算軟硬融合和產(chǎn)業(yè)鏈合作建立了示范。未來,雙方將以市場需求為導(dǎo)向,共同探索更多可能性,為實現(xiàn)大模型人工智能技術(shù)的自主可控和可持續(xù)發(fā)展貢獻力量。
-
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135429 -
澎峰科技
+關(guān)注
關(guān)注
0文章
82瀏覽量
3699 -
沐曦
+關(guān)注
關(guān)注
1文章
80瀏覽量
1811
原文標(biāo)題:澎峰科技計算軟件棧與沐曦GPU完成適配和互認證
文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型
沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型
沐曦曦云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
沐曦股份與上海電信完成首期GPU生態(tài)專家認證培訓(xùn)
沐曦GPU與龍蜥操作系統(tǒng)完成適配
澎峰科技完成OpenAI最新開源推理模型適配
Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)
Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)
澎峰科技計算軟件棧與沐曦GPU完成適配和互認證
評論