91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為宣布開(kāi)源盤(pán)古7B稠密和72B混合專(zhuān)家模型

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-07-06 05:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報(bào)道 2025年6月30日,華為正式宣布開(kāi)源盤(pán)古70億參數(shù)的稠密模型、盤(pán)古Pro MoE 720億參數(shù)的混合專(zhuān)家模型及基于昇騰的模型推理技術(shù),此舉標(biāo)志著華為在AI技術(shù)生態(tài)建設(shè)領(lǐng)域邁出關(guān)鍵一步,為全球開(kāi)發(fā)者、企業(yè)及研究人員提供了強(qiáng)大的技術(shù)支撐。

華為此次開(kāi)源行動(dòng)涵蓋三大核心板塊:盤(pán)古Pro MoE 72B模型權(quán)重與基礎(chǔ)推理代碼已率先上線(xiàn)開(kāi)源平臺(tái);基于昇騰的超大規(guī)模MoE模型推理代碼同步開(kāi)放;盤(pán)古7B稠密模型相關(guān)代碼將于近期完成上線(xiàn)。開(kāi)發(fā)者可通過(guò)華為開(kāi)源社區(qū)(https://gitcode.com/ascend-tribe)獲取完整技術(shù)資源,參與模型優(yōu)化與生態(tài)共建。

作為70億參數(shù)的緊湊型模型,盤(pán)古7B在保持高效推理能力的同時(shí),顯著降低部署門(mén)檻。其設(shè)計(jì)聚焦行業(yè)場(chǎng)景的快速適配,特別適合資源受限環(huán)境下的邊緣計(jì)算應(yīng)用,為中小企業(yè)提供高性?xún)r(jià)比的AI解決方案。

該模型采用創(chuàng)新性的分組混合專(zhuān)家架構(gòu)(MoGE),通過(guò)動(dòng)態(tài)激活機(jī)制實(shí)現(xiàn)160億參數(shù)的高效利用。在SuperCLUE評(píng)測(cè)中,其以720億總參數(shù)量達(dá)到59分,與千億級(jí)模型持平,展現(xiàn)出“小參數(shù)量、大能力”的技術(shù)優(yōu)勢(shì)?;跁N騰AI計(jì)算平臺(tái)的優(yōu)化,單卡推理吞吐量達(dá)2300 Tokens/s,較傳統(tǒng)架構(gòu)提升4倍,支持384個(gè)專(zhuān)家并行推理的超級(jí)節(jié)點(diǎn)架構(gòu),更將算力利用率(MFU)提升50%以上。

華為通過(guò)開(kāi)源構(gòu)建開(kāi)放創(chuàng)新生態(tài),吸引全球開(kāi)發(fā)者參與模型優(yōu)化。目前,盤(pán)古大模型已形成覆蓋數(shù)據(jù)管理、訓(xùn)練、部署的全生命周期工具鏈,支持企業(yè)定制化開(kāi)發(fā)。這種“基礎(chǔ)開(kāi)源+商業(yè)增值”模式,既降低技術(shù)使用門(mén)檻,又通過(guò)商業(yè)發(fā)行版形成可持續(xù)的盈利路徑。

在金融、制造、醫(yī)療等領(lǐng)域,盤(pán)古模型的動(dòng)態(tài)負(fù)載均衡技術(shù)使云端推理成本降低30%,支撐高并發(fā)實(shí)時(shí)作業(yè)場(chǎng)景?;贛oGE架構(gòu)的輕量化引擎,可適配昇騰系列芯片,使百億級(jí)模型在邊緣設(shè)備高效運(yùn)行,為工業(yè)互聯(lián)網(wǎng)、智能座艙等場(chǎng)景開(kāi)辟新應(yīng)用空間。

作為首個(gè)由亞洲企業(yè)主導(dǎo)的AI大模型開(kāi)源項(xiàng)目,華為的實(shí)踐正在改變國(guó)際技術(shù)競(jìng)爭(zhēng)格局。通過(guò)Apache-2.0協(xié)議運(yùn)營(yíng),盤(pán)古模型已吸引科大訊飛、中國(guó)科學(xué)院等1300家機(jī)構(gòu)采用,推動(dòng)中國(guó)AI技術(shù)從跟跑向并跑乃至領(lǐng)跑轉(zhuǎn)變。

此次開(kāi)源行動(dòng),是華為“把復(fù)雜留給自己,把簡(jiǎn)單留給客戶(hù)”技術(shù)理念的生動(dòng)實(shí)踐。當(dāng)72B模型的專(zhuān)家網(wǎng)絡(luò)在昇騰超節(jié)點(diǎn)上高效運(yùn)轉(zhuǎn),當(dāng)7B模型的輕量化部署突破行業(yè)邊界,中國(guó)AI產(chǎn)業(yè)正以開(kāi)源為支點(diǎn),撬動(dòng)全球技術(shù)創(chuàng)新的新范式。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    218

    文章

    36003

    瀏覽量

    262081
  • 盤(pán)古大模型
    +關(guān)注

    關(guān)注

    1

    文章

    112

    瀏覽量

    1040
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    太強(qiáng)了!AI PC搭載70B模型,算力狂飆,內(nèi)存開(kāi)掛

    了1.5B/7B/8B/14B/32B/70B/671B
    的頭像 發(fā)表于 03-24 08:52 ?3586次閱讀
    太強(qiáng)了!AI PC搭載70<b class='flag-5'>B</b>大<b class='flag-5'>模型</b>,算力狂飆,內(nèi)存開(kāi)掛

    模型推理服務(wù)的彈性部署與GPU調(diào)度方案

    7B 模型 FP16 推理需要約 14GB 顯存,70B 模型需要 140GB+,KV Cache 隨并發(fā)數(shù)線(xiàn)性增長(zhǎng),顯存碎片化導(dǎo)致實(shí)際利用率不足 60%。
    的頭像 發(fā)表于 03-03 09:29 ?88次閱讀

    基于合眾恒躍rk3576?開(kāi)發(fā)板deepseek-r1-1.5b/7b 部署指南

    ? 核心結(jié)論:部署流程分為?5?大核心步驟,依次為基礎(chǔ)環(huán)境安裝、模型下載、模型格式轉(zhuǎn)換、部署程序編譯、開(kāi)發(fā)板運(yùn)行測(cè)試,1.5b?模型適配?4+32G?開(kāi)發(fā)板,
    的頭像 發(fā)表于 12-09 07:08 ?457次閱讀
    基于合眾恒躍rk3576?開(kāi)發(fā)板deepseek-r1-1.5<b class='flag-5'>b</b>/<b class='flag-5'>7b</b> 部署指南

    Arm率先適配騰訊混元開(kāi)源模型,助力端側(cè)AI創(chuàng)新開(kāi)發(fā)

    本周初,騰訊混元宣布開(kāi)源四款小尺寸模型(參數(shù)分別為 0.5B、1.8B、4B、
    的頭像 發(fā)表于 08-08 09:16 ?1384次閱讀
    Arm率先適配騰訊混元<b class='flag-5'>開(kāi)源</b><b class='flag-5'>模型</b>,助力端側(cè)AI創(chuàng)新開(kāi)發(fā)

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開(kāi)源其物理 AI 平臺(tái) NVIDIA Cosmos 中的關(guān)鍵模型——NVIDIA Cosmos Reason-1-7B。這款先進(jìn)的多模態(tài)大模型能夠理解視頻、進(jìn)行物理
    的頭像 發(fā)表于 07-09 10:17 ?808次閱讀

    華為正式開(kāi)源盤(pán)古7B稠密72B混合專(zhuān)家模型

    [中國(guó),深圳,2025年6月30日] 今日,華為正式宣布開(kāi)源盤(pán)古70億參數(shù)的稠密模型
    的頭像 發(fā)表于 06-30 11:19 ?1329次閱讀

    華為開(kāi)發(fā)者大會(huì)2025(HDC 2025)亮點(diǎn):華為云發(fā)布盤(pán)古模型5.5 宣布新一代昇騰AI云服務(wù)上線(xiàn)

    HarmonyOS、昇騰AI云服務(wù)、盤(pán)古模型等最新科技創(chuàng)新成果。 在主題演講中,華為常務(wù)董事、華為云計(jì)算CEO張平安宣布基于CloudMa
    的頭像 發(fā)表于 06-20 20:19 ?4439次閱讀
    <b class='flag-5'>華為</b>開(kāi)發(fā)者大會(huì)2025(HDC 2025)亮點(diǎn):<b class='flag-5'>華為</b>云發(fā)布<b class='flag-5'>盤(pán)古</b>大<b class='flag-5'>模型</b>5.5 <b class='flag-5'>宣布</b>新一代昇騰AI云服務(wù)上線(xiàn)

    在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期發(fā)布了 Cosmos Reason-1 的 7B 和 56B 兩款多模態(tài)大語(yǔ)言模型 (MLLM),它們經(jīng)過(guò)了“物理 AI 監(jiān)督微調(diào)”和“物理 AI 強(qiáng)化學(xué)習(xí)”兩個(gè)階段的訓(xùn)練。其中
    的頭像 發(fā)表于 06-04 13:43 ?957次閱讀

    代碼革命的先鋒:aiXcoder-7B模型介紹

    ? ? 國(guó)內(nèi)開(kāi)源代碼大模型 4月9日aiXcoder宣布正式開(kāi)源7B模型Base版,僅僅過(guò)去一
    的頭像 發(fā)表于 05-20 14:41 ?802次閱讀
    代碼革命的先鋒:aiXcoder-<b class='flag-5'>7B</b><b class='flag-5'>模型</b>介紹

    NVIDIA RTX 5880 Ada與Qwen3系列模型實(shí)測(cè)報(bào)告

    近日,阿里巴巴通義千問(wèn)團(tuán)隊(duì)正式推出新一代開(kāi)源大語(yǔ)言模型——Qwen3 系列,該系列包含 6 款 Dense 稠密模型和 2 款 MoE 混合
    的頭像 發(fā)表于 05-09 15:05 ?4347次閱讀
    NVIDIA RTX 5880 Ada與Qwen3系列<b class='flag-5'>模型</b>實(shí)測(cè)報(bào)告

    NVIDIA使用Qwen3系列模型的最佳實(shí)踐

    阿里巴巴近期發(fā)布了其開(kāi)源混合推理大語(yǔ)言模型 (LLM) 通義千問(wèn) Qwen3,此次 Qwen3 開(kāi)源模型系列包含兩款
    的頭像 發(fā)表于 05-08 11:45 ?2986次閱讀
    NVIDIA使用Qwen3系列<b class='flag-5'>模型</b>的最佳實(shí)踐

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】CPU部署DeekSeek-R1模型(1B7B

    架構(gòu)和動(dòng)態(tài)計(jì)算分配技術(shù),在保持模型性能的同時(shí)顯著降低了計(jì)算資源需求。 模型特點(diǎn): 參數(shù)規(guī)模靈活:提供1.5B/7B/33B等多種規(guī)格
    發(fā)表于 04-21 00:39

    從零復(fù)現(xiàn),全面開(kāi)源:360 Light-R1-14B/7B帶來(lái)端側(cè)AI平權(quán)時(shí)刻

    14B開(kāi)源颶風(fēng),360掀起端側(cè)推理性能革命
    的頭像 發(fā)表于 03-16 10:47 ?1096次閱讀
    從零復(fù)現(xiàn),全面<b class='flag-5'>開(kāi)源</b>:360 Light-R1-14<b class='flag-5'>B</b>/<b class='flag-5'>7B</b>帶來(lái)端側(cè)AI平權(quán)時(shí)刻

    利用英特爾OpenVINO在本地運(yùn)行Qwen2.5-VL系列模型

    近期阿里通義實(shí)驗(yàn)室在 Hugging Face 和 ModelScope 上開(kāi)源了 Qwen2.5-VL 的 Base 和 Instruct 模型,包含 3B7B
    的頭像 發(fā)表于 03-12 13:42 ?2605次閱讀
    利用英特爾OpenVINO在本地運(yùn)行Qwen2.5-VL系列<b class='flag-5'>模型</b>

    摩爾線(xiàn)程支持阿里云通義千問(wèn)QwQ-32B開(kāi)源模型

    近日,阿里云團(tuán)隊(duì)正式開(kāi)源全新推理模型——通義千問(wèn)QwQ-32B。摩爾線(xiàn)程在該模型發(fā)布后2小時(shí)內(nèi),迅速且高效完成了對(duì)千問(wèn)QwQ-32B的支持。
    的頭像 發(fā)表于 03-07 17:48 ?1352次閱讀
    摩爾線(xiàn)程支持阿里云通義千問(wèn)QwQ-32<b class='flag-5'>B</b><b class='flag-5'>開(kāi)源</b><b class='flag-5'>模型</b>