4月8日,智譜新一代旗艦?zāi)P虶LM-5.1實(shí)現(xiàn)開源。目前,沐曦股份曦云 C 系列 GPU已完成該系列模型Day 0 全量適配,再度以全棧自主技術(shù)實(shí)力,領(lǐng)跑國產(chǎn) GPU 生態(tài)適配賽道。
相比于GLM-5,GLM-5.1的整體能力得到了全面提升,是目前全球最強(qiáng)的開源模型。GLM-5.1的代碼能力得到進(jìn)一步提升,在最接近真實(shí)軟件開發(fā)的SWE-bench Pro基準(zhǔn)測試中超過GPT-5.4、Claude Opus 4.6,刷新全球最佳成績。
值得一提的是,在模型整體性能大幅提升外,GLM-5.1還在長程任務(wù)(Long Horizon Task)處理能力上實(shí)現(xiàn)了顯著突破。有別于當(dāng)前以分鐘級交互為主的模型,GLM-5.1能夠在單次任務(wù)中持續(xù)、自主地工作長達(dá)8小時,憑借自主規(guī)劃、執(zhí)行與迭代進(jìn)化,最終交付完整的工程級成果。
此前,由智譜發(fā)布的基座模型GLM-5、文檔解析模型GLM-OCR、多模態(tài)系列模型GLM-4.6V,沐曦股份均實(shí)現(xiàn)Day 0適配。依托曦云 C 系列硬件算力與 MXMACA 軟件棧深度優(yōu)化,GLM-5.1模型在沐曦平臺實(shí)現(xiàn)“開箱即用、性能無損”,企業(yè)與開發(fā)者無需改碼、無需等待,模型發(fā)布當(dāng)日即可完成生產(chǎn)級部署。
發(fā)布即可用,產(chǎn)業(yè)落地?zé)o憂
沐曦曦云C系列GPU適配后的GLM-5.1,在代碼生成、復(fù)雜推理、長文本理解等核心純文本場景中,滿血釋放原生模型能力。
從單機(jī)部署到千卡級集群商用,從企業(yè)級智能辦公到代碼開發(fā)、知識庫搭建,沐曦曦云C系列為GLM-5.1提供全場景、高穩(wěn)定、低成本的國產(chǎn)算力方案,有效解決大模型落地過程中“適配慢、遷移難、性能損耗大”等行業(yè)痛點(diǎn),助力企業(yè)快速將GLM-5.1的技術(shù)優(yōu)勢轉(zhuǎn)化為產(chǎn)業(yè)價值。
自 2025 年 12 月以來,沐曦已完成十余款主流模型 Day 0 適配,覆蓋智譜、通義千問、階躍星辰、百度飛槳等頭部廠商最新旗艦,實(shí)現(xiàn)語言、多模態(tài)、OCR、翻譯全品類覆蓋,適配數(shù)量、速度、廣度均居行業(yè)領(lǐng)先地位。本次GLM-5.1 無縫適配,將進(jìn)一步推動“模型-芯片-框架-應(yīng)用”自主閉環(huán)加速成熟。
全棧自研軟硬一體,持續(xù)賦能千行百業(yè)
此次沐曦高效完成GLM-5.1的Day 0適配,并非簡單的移植兼容,而是基于“自研GPU硬件+MXMACA全棧軟件”的深度協(xié)同優(yōu)化。
曦云C系列GPU專為AI大模型訓(xùn)推場景設(shè)計,硬件規(guī)格原生匹配GLM-5.1的高算力、高帶寬需求。沐曦自主研發(fā)的MXMACA軟件棧已實(shí)現(xiàn)對國際主流生態(tài)的高度兼容,可支持超過6000個主流生態(tài)應(yīng)用及超過1,000個模型的原生適配,包括多個大模型的Day 0適配。
自2025年2月開源社區(qū)開放以來,截至2026年3月,MXMACA注冊用戶超過30萬人,API調(diào)用次數(shù)超過5591萬次,文件下載量超過16萬次,并已覆蓋超過半數(shù)的C9高校。
沐曦將持續(xù)深耕全棧 GPU 技術(shù),深化與主流大模型、開源社區(qū)及產(chǎn)業(yè)伙伴協(xié)同,以更快適配速度、更強(qiáng)性能表現(xiàn)、更完善生態(tài)支持,為金融、醫(yī)療健康、能源、教科研、交通、大文娛等領(lǐng)域提供安全、高效、自主可控的國產(chǎn)算力底座,與生態(tài)伙伴共筑中國 AI 產(chǎn)業(yè)創(chuàng)新未來。
關(guān)于智譜GLM-5.1
GLM-5.1是智譜迄今最智能的旗艦?zāi)P?,也是目前全球最?qiáng)的開源模型。GLM-5.1大大提高了代碼能力,在完成長程任務(wù)方面提升尤為顯著。和此前分鐘級交互的模型不同,GLM-5.1能夠在一次任務(wù)中獨(dú)立、持續(xù)地工作超過8小時,期間自主規(guī)劃、執(zhí)行、自我進(jìn)化,最終交付完整的工程級成果。
代碼能力是模型智能水平進(jìn)一步提升的關(guān)鍵。下圖是業(yè)內(nèi)最具代表性的三個代碼評測基準(zhǔn)的平均結(jié)果,包括衡量模型專業(yè)級軟件開發(fā)工作的SWE-Bench Pro、像工程師一樣操作命令行解決問題的Terminal-Bench 2.0、從零構(gòu)建完整代碼倉庫的NL2Repo。三項(xiàng)綜合平均分,GLM-5.1取得全球模型第三、國產(chǎn)模型第一、開源模型第一。
在最接近真實(shí)軟件開發(fā)的SWE-bench Pro基準(zhǔn)測試中,GLM-5.1刷新全球最佳成績,超過GPT-5.4、Claude Opus 4.6。SWE-Bench Pro要求模型在真實(shí)GitHub倉庫中定位并修復(fù)高難度工程Bug,是衡量模型能否勝任專業(yè)軟件開發(fā)的最硬指標(biāo)。
過去兩年,行業(yè)用Benchmark衡量模型有多智能。GLM團(tuán)隊認(rèn)為,下一階段的衡量標(biāo)準(zhǔn)應(yīng)該是“能工作多久”,即模型在長程任務(wù)(Long-Horizon Task)中的表現(xiàn),能獨(dú)立完成多長時間的人類任務(wù)。
這對模型提出了更深層次的挑戰(zhàn)。在長程任務(wù)中保持穩(wěn)定輸出,模型面對的不只是更大的代碼量,而是一連串復(fù)雜的工程決策點(diǎn):主動跑benchmark、定位瓶頸、修改方案、再跑測試。模型需要像一個真正的工程師一樣,形成“實(shí)驗(yàn)→分析→優(yōu)化”的完整閉環(huán),而不是寫完一版代碼就停下來等人打分。
在METR榜單的同等評估標(biāo)準(zhǔn)下,GLM-5.1是唯一達(dá)到8小時級持續(xù)工作的開源模型,也是全球范圍內(nèi)除Claude Opus 4.6外少數(shù)具備這一能力的模型。GLM團(tuán)隊的終極目標(biāo)是全自治智能體(Autonomous Agent),模型7×24小時不間斷地分解目標(biāo)、執(zhí)行交付、自我評價與糾正、自我進(jìn)化,從此無需人類介入。
使用以下命令獲取沐曦GLM-5.1推理鏡像:
docker pull pub-registry1.metax-tech.com/ai-opentest/dev/vllm-metax:0.14.0-maca.ai3.5.3.102-torch2.8-py310-ubuntu22.04-amd64_glm_w4a8_full
GLM-5.1模型地址:
Hugging Face:
https://huggingface.co/zai-org/GLM-5.1
ModelScope:
https://modelscope.cn/models/ZhipuAI/GLM-5.1
關(guān)于沐曦股份
沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。
-
gpu
+關(guān)注
關(guān)注
28文章
5244瀏覽量
135958 -
模型
+關(guān)注
關(guān)注
1文章
3802瀏覽量
52225 -
沐曦
+關(guān)注
關(guān)注
1文章
89瀏覽量
1873
原文標(biāo)題:沐曦股份曦云C系列GPU Day 0 適配智譜GLM-5.1 全棧技術(shù)領(lǐng)跑國產(chǎn)AI生態(tài)
文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
昆侖芯率先完成智譜新一代旗艦模型GLM-5.1深度支持
壁仞科技壁礪166系列產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型
天數(shù)智芯通用GPU產(chǎn)品Day 0適配GLM-5.1開源模型
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型
沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型
沐曦曦云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦?zāi)P?/h1>
評論