12月8日智譜AI發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型,沐曦股份曦云C系列GPU完成Day 0適配。
GLM-4.6V 系列多模態(tài)大模型共包含兩款模型:
GLM-4.6V(106B-A12B):面向云端與高性能集群場景的基礎(chǔ)版;
GLM-4.6V-Flash(9B):面向本地部署與低延遲應(yīng)用的輕量版。
作為 GLM 系列在多模態(tài)方向上的一次重要迭代,GLM-4.6V 將訓(xùn)練時上下文窗口提升到 128k tokens,在視覺理解精度上達到同參數(shù)規(guī)模 SOTA,并首次在模型架構(gòu)中將Function Call(工具調(diào)用)能力原生融入視覺模型,打通從「視覺感知」到「可執(zhí)行行動(Action)」的鏈路,為真實業(yè)務(wù)場景中的多模態(tài) Agent 提供統(tǒng)一的技術(shù)底座。
1原生多模態(tài)工具調(diào)用
傳統(tǒng)工具調(diào)用大多基于純文本,在面對圖像、視頻、復(fù)雜文檔等多模態(tài)內(nèi)容時,需要多次中間轉(zhuǎn)換,帶來信息損失和工程復(fù)雜度。
GLM-4.6V 從設(shè)計之初就圍繞「圖像即參數(shù),結(jié)果即上下文」,構(gòu)建了原生多模態(tài)工具調(diào)用能力:
輸入多模態(tài):圖像、截圖、文檔頁面等可以直接作為工具參數(shù),無需先轉(zhuǎn)為文字描述再解析,減少鏈路損耗。
輸出多模態(tài):對于工具返回的統(tǒng)計圖表、渲染后網(wǎng)頁截圖、檢索到的商品圖片等結(jié)果,模型能夠再次進行視覺理解,將其納入后續(xù)推理鏈路。
模型原生支持基于視覺輸入的工具調(diào)用,完整打通從感知到理解到執(zhí)行的閉環(huán)。這使得 GLM-4.6V 能夠應(yīng)對圖文混排輸出、商品識別與好價推薦、以及輔助型 Agent 場景等更復(fù)雜的視覺任務(wù)。
2同規(guī)模開源 SOTA
GLM-4.6V 在 MMBench、MathVista、OCRBench 等30+ 主流多模態(tài)評測基準上進行了驗證,較上一代模型取得顯著提升。在同等參數(shù)規(guī)模下,模型在多模態(tài)交互、邏輯推理和長上下文等關(guān)鍵能力上取得SOTA表現(xiàn)。

3MXMACA 軟件棧加速國產(chǎn)模型落地
MXMACA 軟件棧作為沐曦股份全棧 GPU 解決方案的核心,在vLLM, sglang 等主流AI推理框架中展現(xiàn)出快速適配的優(yōu)勢,其 GPU 架構(gòu)和優(yōu)化設(shè)計和良好的生態(tài)兼容性確保了高效、靈活的推理部署。此次沐曦股份曦云 C 系列GPU完成 Day 0 適配智譜 GLM-4.6V 系列多模態(tài)大模型再次印證了這一優(yōu)勢。MXMACA 軟件棧將繼續(xù)以開放式架構(gòu)和持續(xù)迭代優(yōu)化,賦能推理框架、模型、應(yīng)用開發(fā)到運維的全生命周期,助力開發(fā)者構(gòu)建更具競爭力的 AI 產(chǎn)品。
關(guān)于沐曦股份
沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟發(fā)展。
-
gpu
+關(guān)注
關(guān)注
28文章
5191瀏覽量
135398 -
沐曦
+關(guān)注
關(guān)注
1文章
80瀏覽量
1804 -
大模型
+關(guān)注
關(guān)注
2文章
3644瀏覽量
5173
原文標題:沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V
文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型
沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型
沐曦曦云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊混元圖像3.0圖生圖模型
沐曦股份正式推出曦索X系列全新GPU品牌與產(chǎn)品線
DLInfer聯(lián)手沐曦股份實現(xiàn)數(shù)據(jù)生成場景的實際落地
沐曦股份與上海電信完成首期GPU生態(tài)專家認證培訓(xùn)
首款全國產(chǎn)通用GPU芯片發(fā)布 沐曦集成推出曦云C600
沐曦GPU與龍蜥操作系統(tǒng)完成適配
沐曦曦云C系列產(chǎn)品已支持TileLang
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
評論