近日,阿里云重磅推出Qwen3 系列開(kāi)源混合推理模型。用時(shí)不到1天,后摩智能自研NPU迅速實(shí)現(xiàn)Qwen3 系列模型(Qwen3 0.6B-14B)在端邊側(cè)的高效部署。這一成果充分彰顯了后摩智能NPU在生態(tài)適配性與快速響應(yīng)能力方面的顯著優(yōu)勢(shì)。
通義千問(wèn) Qwen3 系列作為國(guó)內(nèi)領(lǐng)先的混合推理模型,其亮點(diǎn)在于創(chuàng)造性地將 “快思考” 與 “慢思考” 集成進(jìn)同一個(gè)模型架構(gòu)。對(duì)于簡(jiǎn)單需求,可迅速做出低算力響應(yīng),實(shí)現(xiàn) “秒回”;面對(duì)復(fù)雜問(wèn)題,能夠進(jìn)行多步驟深度思考,逐步推導(dǎo)出合理答案。此外,Qwen3 系列基于海量多語(yǔ)言、多模態(tài)數(shù)據(jù)預(yù)訓(xùn)練,并經(jīng)過(guò)高質(zhì)量數(shù)據(jù)微調(diào),在人類偏好對(duì)齊方面表現(xiàn)出色,推理效率提升 3 倍,支持 API 商用及開(kāi)源代碼庫(kù),為用戶提供了靈活多樣的部署選擇。
后摩智能通過(guò)多種產(chǎn)品組合,為用戶提供豐富的高性能 AI 算力選擇?;谧匝?NPU,后摩智能推出了力謀SM30 計(jì)算模組、力謀LM30 智能加速卡及力謀BX30 計(jì)算盒子等產(chǎn)品,在政務(wù)、工業(yè)、消費(fèi)、汽車等行業(yè)全面覆蓋端側(cè)與邊緣側(cè)的多樣化應(yīng)用場(chǎng)景。這些產(chǎn)品憑借其高性能、低功耗的特點(diǎn),為 AI 技術(shù)的落地提供了堅(jiān)實(shí)的算力基礎(chǔ),滿足了不同用戶在不同場(chǎng)景下的需求。
此前,后摩智能 NPU 已成功支持了 DeepSeek R1 Distilled 系列模型,展現(xiàn)出其在適配主流大模型方面的卓越性能和廣泛兼容性。此次適配通義千問(wèn) Qwen3 系列模型,進(jìn)一步驗(yàn)證了后摩智能 NPU 在處理復(fù)雜 AI 任務(wù)時(shí)的高效性和穩(wěn)定性,為國(guó)產(chǎn)技術(shù)棧的完整性與競(jìng)爭(zhēng)力提供了有力證明。
未來(lái),后摩智能將繼續(xù)深耕存算一體技術(shù),持續(xù)優(yōu)化 NPU 性能,加強(qiáng)與生態(tài)伙伴的合作,推動(dòng)國(guó)產(chǎn) NPU 在 AI 領(lǐng)域的廣泛應(yīng)用。通過(guò)技術(shù)創(chuàng)新與生態(tài)共建,后摩智能致力于為更多用戶提供高效、普惠的 AI 算力解決方案。
-
模型
+關(guān)注
關(guān)注
1文章
3752瀏覽量
52106 -
阿里云
+關(guān)注
關(guān)注
3文章
1038瀏覽量
45689 -
NPU
+關(guān)注
關(guān)注
2文章
373瀏覽量
21096 -
后摩智能
+關(guān)注
關(guān)注
0文章
51瀏覽量
1703
原文標(biāo)題:后摩智能 NPU 率先完成阿里 Qwen3 系列模型的端邊側(cè)部署
文章出處:【微信號(hào):后摩智能,微信公眾號(hào):后摩智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
沐曦股份曦云C系列GPU全面適配通義千問(wèn)Qwen3.5三款新模型
阿里巴巴發(fā)布通義千問(wèn)旗艦推理模型Qwen3-Max-Thinking
阿里通義千問(wèn)發(fā)布小尺寸模型Qwen3-4B,手機(jī)也能跑
廣和通加速通義千問(wèn)Qwen3在端側(cè)全面落地
Arm CPU適配通義千問(wèn)Qwen3系列模型
Intel OpenVINO? Day0 實(shí)現(xiàn)阿里通義 Qwen3 快速部署
NVIDIA RTX 5880 Ada與Qwen3系列模型實(shí)測(cè)報(bào)告
MediaTek天璣9400率先完成阿里Qwen3模型部署
幾B都有!BM1684X一鍵適配全系列Qwen3
后摩智能NPU適配通義千問(wèn)Qwen3系列模型
評(píng)論