近日,天數(shù)智芯攜手眾智FlagOS 社區(qū)完成阿里云通義千問 Qwen3.5 系列多模態(tài)模型全量適配,實(shí)現(xiàn)模型精度精準(zhǔn)對(duì)齊與端到端無縫部署,再度彰顯公司在通用 GPU 領(lǐng)域深厚的技術(shù)積淀與領(lǐng)先的生態(tài)適配能力。
天數(shù)智芯堅(jiān)定走全棧自主創(chuàng)新發(fā)展路線,從底層硬件架構(gòu)到上層軟件生態(tài)均實(shí)現(xiàn)核心技術(shù)自主創(chuàng)新,構(gòu)建起覆蓋云邊端全場景的算力體系,打造出天垓訓(xùn)練系列、智鎧推理系列、彤央邊端系列三大核心產(chǎn)品線,形成“訓(xùn)推一體、云邊協(xié)同” 的全鏈路算力布局。
本次完成適配的Qwen3.5 系列多模態(tài)模型,涵蓋 397B MoE 旗艦?zāi)P团c 35B-A3B MoE 新模型。其中 Qwen3.5-35B-A3B 模型總參數(shù)達(dá) 350 億、激活參數(shù) 30 億,原生支持 262,144 tokens 超長上下文,采用門控增量網(wǎng)絡(luò)與稀疏混合專家的高效混合架構(gòu),通過多模態(tài)令牌早融合訓(xùn)練實(shí)現(xiàn)視覺 - 語言統(tǒng)一理解,可全面支持圖像、視頻等多模態(tài)輸入,在復(fù)雜推理、代碼開發(fā)、智能體任務(wù)及視覺理解等場景表現(xiàn)卓越。該類高階模型的跨芯移植、多機(jī)部署與精度對(duì)齊,對(duì)芯片系統(tǒng)軟件棧的兼容性、穩(wěn)定性提出嚴(yán)苛要求,天數(shù)智芯憑借全棧技術(shù)積累順利實(shí)現(xiàn)技術(shù)突破,完成全量適配。
依托全棧技術(shù)優(yōu)勢,天數(shù)智芯與眾智FlagOS 社區(qū)深度協(xié)同,結(jié)合 FlagOS 系統(tǒng)軟件棧的技術(shù)支撐,實(shí)現(xiàn) Qwen3.5 系列模型的高效適配與性能優(yōu)化。天數(shù)自研的硬件架構(gòu)與軟件生態(tài)可無縫兼容 FlagOS 提供的 vLLM-plugin-FL 多芯片接入插件,開發(fā)者無需修改原有調(diào)用代碼與使用習(xí)慣,即可實(shí)現(xiàn)模型快速部署,真正達(dá)成“零改碼、開箱即用”,大幅降低大模型落地的部署門檻。
性能表現(xiàn)上,經(jīng)ERQA、GPQA Diamond 等權(quán)威評(píng)測集驗(yàn)證,天數(shù)智芯適配后的 Qwen3.5 系列模型,在視覺語言理解、復(fù)雜推理等核心能力上與原生版本精準(zhǔn)對(duì)齊,充分釋放硬件算力潛能。這一成果得益于天數(shù)智芯在算子層、編譯層的深度優(yōu)化,公司軟硬件協(xié)同設(shè)計(jì)支持多精度混合計(jì)算,兼容主流量化算法與推理引擎,結(jié)合 FlagGems 高性能算子庫的專項(xiàng)優(yōu)化,進(jìn)一步提升模型推理效率,精準(zhǔn)解決大模型落地過程中性能損耗、適配繁瑣等行業(yè)痛點(diǎn)。
此次適配成果,更是天數(shù)智芯生態(tài)適配能力的直觀體現(xiàn)。公司始終秉持“兼容并包、開放共贏” 的生態(tài)建設(shè)策略,產(chǎn)品可無縫兼容主流操作系統(tǒng)與 AI 框架,實(shí)現(xiàn)開發(fā)者代碼的無感遷移;同時(shí)積極參與開源社區(qū)建設(shè),推動(dòng)“模型 - 系統(tǒng) - 芯片” 三層貫通的開放算力生態(tài)構(gòu)建。
未來,天數(shù)智芯將持續(xù)深耕核心技術(shù)自主創(chuàng)新,不斷完善全場景算力生態(tài)布局,聚焦千行百業(yè)智能化轉(zhuǎn)型核心需求,以全棧技術(shù)實(shí)力與廣泛的生態(tài)適配能力讓自主創(chuàng)新算力賦能更多產(chǎn)業(yè)應(yīng)用場景,為數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展注入持續(xù)動(dòng)力。
目前,開發(fā)者可在ModelScope(魔搭)、HuggingFace等主流開源社區(qū),獲取天數(shù)智芯適配版 Qwen3.5 模型文件、代碼及鏡像,一鍵完成模型部署。
-
gpu
+關(guān)注
關(guān)注
28文章
5226瀏覽量
135790 -
天數(shù)智芯
+關(guān)注
關(guān)注
0文章
104瀏覽量
6645 -
通義千問
+關(guān)注
關(guān)注
1文章
42瀏覽量
620
發(fā)布評(píng)論請先 登錄
海光DCU完成Qwen3.5多模態(tài)MoE模型全量適配
基于NVIDIA GPU加速端點(diǎn)使用千問3.5 VLM開發(fā)原生多模態(tài)智能體
美格智能高算力AI模組+Qwen3.5,打造端側(cè)最強(qiáng)AI智能體
摩爾線程MTT S5000全面適配Qwen3.5三款新模型
阿里巴巴開源全新一代大模型千問Qwen3.5-Plus
太初元碁:40+AI大模型全覆蓋,新版本即發(fā)即適配、上線即可用,實(shí)現(xiàn)國產(chǎn)“芯”速度
摩爾線程快速完成對(duì)Qwen3.5模型全面適配
阿里巴巴發(fā)布通義千問旗艦推理模型Qwen3-Max-Thinking
阿里通義千問發(fā)布小尺寸模型Qwen3-4B,手機(jī)也能跑
天數(shù)智芯完成阿里云通義千問Qwen3.5系列多模態(tài)模型全量適配
評(píng)論