91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

海光DCU完成Qwen3.5多模態(tài)MoE模型全量適配

CHANBAEK ? 來源:海光信息 ? 2026-03-26 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,海光DCU完成Qwen3.5-397B MoE旗艦多模態(tài)模型、Qwen3.5-35B-A3B MoE多模態(tài)模型全量適配、精度對齊與推理部署驗證。本次適配依托FlagOS專屬vLLM-plugin-FL多芯片插件實現(xiàn)落地。

FlagOS是一款專為異構(gòu)AI芯片打造的開源、統(tǒng)一系統(tǒng)軟件棧,支持AI模型一次開發(fā)即可無縫移植至各類硬件平臺,大幅降低遷移與適配成本。FlagOS專屬vLLM-plugin-FL多芯片插件完美兼容海光DCU芯片,全程無需修改模型接口、推理引擎邏輯與開發(fā)者調(diào)用代碼,通過底層插件和算子替換實現(xiàn)無縫適配,大幅降低遷移成本,真正做到開箱即用。

目前兩大版本模型在海光DCU算力平臺實現(xiàn)無縫穩(wěn)定運行,進(jìn)一步夯實國產(chǎn)算力支撐大模型落地的核心能力,為行業(yè)提供開箱即用的國產(chǎn)化部署方案。

高效攻克適配瓶頸,多模態(tài)能力完整落地

Qwen3.5-35B-A3B參數(shù)350億、激活參數(shù)30億,原生支持262144 tokens超長上下文,采用門控Delta網(wǎng)絡(luò)融合MoE架構(gòu),具備統(tǒng)一視覺/語言理解能力,覆蓋圖像、視頻多模態(tài)輸入,在推理、編碼、Agent及視覺理解等核心場景實現(xiàn)全面躍升。

面對如此復(fù)雜的模型架構(gòu)與多模態(tài)能力,精度對齊等技術(shù)挑戰(zhàn)尤為突出。海光DCU依托底層軟硬件優(yōu)化實力,基于眾智FlagOS全棧技術(shù)支撐,高效攻克適配瓶頸。經(jīng)驗證,Qwen3.5模型在海光DCU上推理穩(wěn)定。

零改造部署,降低落地門檻

FlagOS將核心算子、編譯器等組件內(nèi)置模型框架,加載時自動生效,配合標(biāo)準(zhǔn)化Docker鏡像與一鍵命令,徹底解決環(huán)境配置、性能優(yōu)化等痛點。

開發(fā)者可通過官方文檔獲取部署源碼,也可直接拉取魔搭、HuggingFace等社區(qū)的海光專屬模型鏡像、文件,無需額外遷移即可快速啟用。遷移版Qwen3.5-FlagOS模型文件、代碼和鏡像,可一鍵直達(dá)部署資源:

HuggingFace平臺:

https://huggingface.co/FlagRelease/Qwen3.5-35B-A3B-hygon-FlagOS

魔搭平臺:

https://modelscope.cn/models/FlagRelease/Qwen3.5-35B-A3B-hygon-FlagOS

全棧技術(shù)協(xié)同,精度性能雙達(dá)標(biāo)

眾智FlagOS構(gòu)建的統(tǒng)一AI系統(tǒng)軟件棧,為海光DCU提供全鏈路支撐,F(xiàn)lagRelease工具可半自動支撐實現(xiàn)適配、評測、打包全流程,極速推進(jìn)適配落地,將傳統(tǒng)數(shù)周周期壓縮至數(shù)天。

經(jīng)ERQA、AIME、GPQA Diamond等權(quán)威評測集驗證,海光DCU適配后的Qwen3.5系列模型,在視覺理解、復(fù)雜推理、語言編碼等核心能力上,與原生版本精度完全對齊,無業(yè)務(wù)效果折損,適配質(zhì)量達(dá)到行業(yè)頂尖水平。

此次適配實現(xiàn)“一次開發(fā)、多芯復(fù)用”,凸顯出國產(chǎn)算力承接高端大模型任務(wù)的常態(tài)化。海光DCU將持續(xù)深耕AI算力軟硬件優(yōu)化,聯(lián)合FlagOS等生態(tài)伙伴,拓展更多主流大模型適配場景,打造穩(wěn)定高效的國產(chǎn)算力底座,助力AI技術(shù)規(guī)?;?、普惠化落地。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3778

    瀏覽量

    52181
  • DCU
    DCU
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    3165
  • 海光信息
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    2686
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DCU完成階躍星辰基座模型Step 3.5 Flash推理適配

    近日,DCU正式完成對階躍星辰旗艦開源基座模型Step 3.5 Flash的
    的頭像 發(fā)表于 03-26 09:48 ?290次閱讀

    天數(shù)智芯完成阿里云通義千問Qwen3.5系列模態(tài)模型適配

    近日,天數(shù)智芯攜手眾智FlagOS 社區(qū)完成阿里云通義千問 Qwen3.5 系列模態(tài)模型
    的頭像 發(fā)表于 03-26 09:25 ?463次閱讀

    基于NVIDIA GPU加速端點使用千問3.5 VLM開發(fā)原生模態(tài)智能體

    阿里巴巴推出了全新開源 千問3.5 系列,專為構(gòu)建原生模態(tài)智能體而設(shè)計。該系列的首個模型是一款總參數(shù)為 397B、具備推理能力的原生視覺語言模型
    的頭像 發(fā)表于 03-04 16:37 ?917次閱讀

    沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型

    今日,通義千問團(tuán)隊正式開源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3
    的頭像 發(fā)表于 02-28 10:05 ?570次閱讀
    沐曦股份曦云C系列GPU全面<b class='flag-5'>適配</b>通義千問<b class='flag-5'>Qwen3.5</b>三款新<b class='flag-5'>模型</b>

    美格智能高算力AI模組+Qwen3.5,打造端側(cè)最強(qiáng)AI智能體

    在人工智能技術(shù)飛速迭代的今天,大模型的“云端爭霸”已漸入深水區(qū),而一場關(guān)于“端側(cè)智能”的靜默革命正悄然興起。隨著Qwen3.5等高性能開源模型的問世,模型能力已進(jìn)一步跨越,而如何為這些
    的頭像 發(fā)表于 02-27 08:33 ?486次閱讀
    美格智能高算力AI模組+<b class='flag-5'>Qwen3.5</b>,打造端側(cè)最強(qiáng)AI智能體

    摩爾線程MTT S5000全面適配Qwen3.5三款新模型

    第一時間做出極速響應(yīng),宣布已在旗艦級AI訓(xùn)推一體全功能GPU MTT S5000上,完成對這三款全新模型的全方位適配。 ? 此次高效支持充分展示了摩爾線程MUSA生態(tài)的成熟度與完備性。在本次Q
    的頭像 發(fā)表于 02-26 16:23 ?499次閱讀

    阿里巴巴開源全新一代大模型千問Qwen3.5-Plus

    千問3.5實現(xiàn)了底層模型架構(gòu)的全面革新,此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億,激活僅170億,以小勝大,性能超過萬億參數(shù)的Qwen3-Max
    的頭像 發(fā)表于 02-26 15:40 ?1079次閱讀
    阿里巴巴開源全新一代大<b class='flag-5'>模型</b>千問<b class='flag-5'>Qwen3.5</b>-Plus

    沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型

    今天,通義千問今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權(quán)重版本。沐曦股份曦云C系列GPU
    的頭像 發(fā)表于 02-26 14:26 ?613次閱讀
    沐曦股份曦云C系列GPU深度<b class='flag-5'>適配</b>通義千問<b class='flag-5'>Qwen3.5</b><b class='flag-5'>模型</b>

    太初元碁:40+AI大模型覆蓋,新版本即發(fā)即適配、上線即可用,實現(xiàn)國產(chǎn)“芯”速度

    日前,國產(chǎn)AI芯片企業(yè)太初(無錫)電子科技有限公司(又稱“太初元碁”)完成智譜GLM-5.0、阿里千問Qwen3.5-397B-A17B等大模型的深度適配,截至目前,其已
    的頭像 發(fā)表于 02-25 09:21 ?1844次閱讀

    摩爾線程快速完成Qwen3.5模型全面適配

    2月17日,摩爾線程宣布已在旗艦級AI訓(xùn)推一體全功能GPU MTT S5000上完成對阿里最新大模型Qwen3.5的全方位適配。此次支持充分展示了摩爾線程MUSA生態(tài)的成熟度與完備性,
    發(fā)表于 02-18 08:32 ?1013次閱讀

    Qwen3-VL 4B/8B全面適配,BM1684X成邊緣最佳部署平臺!

    算能BM1684X上完成Qwen3-VL4B/8B模型適配,推理速度13.7/7.2tokens/s,使其成為邊緣部署
    的頭像 發(fā)表于 10-16 18:00 ?2817次閱讀
    <b class='flag-5'>Qwen</b>3-VL 4B/8B全面<b class='flag-5'>適配</b>,BM1684X成邊緣最佳部署平臺!

    基于米爾瑞芯微RK3576開發(fā)板的Qwen2-VL-3B模型NPU模態(tài)部署評測

    模型(如 Qwen2-VL-2B)進(jìn)行專項優(yōu)化,token 生成速度達(dá) 10+每秒,適配本地化模態(tài)交互需求; 算力分配:RK3576 的
    發(fā)表于 08-29 18:08

    DCU率先展開文心系列模型的深度技術(shù)合作 FLOPs利用率(MFU)達(dá)47%

    模型的深度技術(shù)適配,預(yù)訓(xùn)練模型FLOPs利用率(MFU)達(dá)到47%,在多個文本與模態(tài)基準(zhǔn)測試中取得SOTA水平。此次合作標(biāo)志著國產(chǎn)算力基
    的頭像 發(fā)表于 07-01 14:35 ?2414次閱讀

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型
    的頭像 發(fā)表于 05-16 16:23 ?1067次閱讀

    愛芯通元NPU適配Qwen2.5-VL-3B視覺模態(tài)模型

    熟悉愛芯通元NPU的網(wǎng)友很清楚,從去年開始我們在端側(cè)模態(tài)模型適配上一直處于主動緊跟的節(jié)奏。先后適配了國內(nèi)最早開源的
    的頭像 發(fā)表于 04-21 10:56 ?3295次閱讀
    愛芯通元NPU<b class='flag-5'>適配</b><b class='flag-5'>Qwen</b>2.5-VL-3B視覺<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>