91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

摩爾線程“AI工廠”:五大核心技術(shù)支撐,打造大模型訓(xùn)練超級工廠

時光流逝最終成了回憶 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:綜合報道 ? 2025-07-28 11:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2025年7月25日,上?!谑澜?a target="_blank">人工智能大會(WAIC 2025)開幕前夕,摩爾線程以“算力進(jìn)化,精度革命”為主題舉辦技術(shù)分享會,并創(chuàng)新性提出“AI工廠”理念。摩爾線程創(chuàng)始人兼CEO張建中在主題演講中表示,為應(yīng)對生成式AI爆發(fā)式增長下的大模型訓(xùn)練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構(gòu)建新一代AI訓(xùn)練基礎(chǔ)設(shè)施,致力于為AGI時代打造生產(chǎn)先進(jìn)模型的“超級工廠”。


“AI工廠”:鍛造先進(jìn)模型的“超級工廠”

人工智能前沿模型的競爭正推動著AI智能水平的迅猛提升,全球科技巨頭正以驚人的速度迭代模型。從GPT系列、Gemini到DeepSeek、QWen的快速更新,模型訓(xùn)練迭代時間已縮短至不足3個月,這種高頻迭代不僅體現(xiàn)在大型語言模型(LLM)上,還同步擴(kuò)展至多模態(tài)模型、語音模型、世界模型等前沿模型領(lǐng)域。這些模型在性能、效率和應(yīng)用場景上實現(xiàn)的指數(shù)級突破,不僅推動了AI從專用領(lǐng)域向通用智能的跨越,其快速迭代的特性更對新一代高性能人工智能計算基礎(chǔ)設(shè)施提出了迫切需求。

摩爾線程提出的“AI工廠”,如同芯片晶圓廠的制程升級,是一個系統(tǒng)性、全方位的變革,需要實現(xiàn)從底層芯片架構(gòu)創(chuàng)新、到集群整體架構(gòu)的優(yōu)化,再到軟件算法調(diào)優(yōu)和資源調(diào)度系統(tǒng)的全面升級。這種全方位的基礎(chǔ)設(shè)施變革,將推動AI訓(xùn)練從千卡級向萬卡級乃至十萬卡級規(guī)模演進(jìn),以系統(tǒng)級工程實現(xiàn)生產(chǎn)力和創(chuàng)新效率的飛躍。

這座“AI工廠”的智能“產(chǎn)能”,由五大核心要素共同決定,其效率公式可概括為:AI工廠生產(chǎn)效率 = 加速計算通用性 × 單芯片有效算力 × 單節(jié)點效率 × 集群效率 × 集群穩(wěn)定性

摩爾線程以全功能GPU通用算力為基石,通過先進(jìn)架構(gòu)、芯片算力、單節(jié)點效率、集群效率優(yōu)化與可靠性等協(xié)同躍升的深度技術(shù)創(chuàng)新,旨在將全功能GPU加速計算平臺的強(qiáng)大潛能,轉(zhuǎn)化為工程級的訓(xùn)練效率與可靠性保障。

五大核心技術(shù):系統(tǒng)性提升AI訓(xùn)練效率

摩爾線程通過軟硬深度協(xié)同的系統(tǒng)級創(chuàng)新,從五大核心技術(shù)構(gòu)建“AI工廠”,致力于推動大模型訓(xùn)練效率實現(xiàn)質(zhì)的飛躍。

技術(shù)一:全功能GPU,實現(xiàn)加速計算通用性
在AI基礎(chǔ)設(shè)施建設(shè)中,計算功能的完備性與精度完整性是支撐多元場景的核心基石。摩爾線程以自主研發(fā)的全功能GPU為核心,構(gòu)建了“功能完備”與“精度完整”的通用性底座,全面覆蓋從AI訓(xùn)練、推理到科學(xué)計算的全場景需求。

  • 創(chuàng)新突破:單芯片覆蓋多場景。基于MUSA架構(gòu)的突破性設(shè)計,摩爾線程的GPU單芯片即可集成AI計算加速、圖形渲染、物理仿真及超高清視頻編解碼能力,充分適配AI訓(xùn)推、具身智能、AIGC等多樣化應(yīng)用場景。
  • 精度標(biāo)桿:性能躍升20%~30%。在計算精度方面,摩爾線程支持從FP64至INT8的完整精度譜系,并通過FP8混合精度技術(shù),在主流前沿大模型訓(xùn)練中實現(xiàn)20%~30%的性能躍升,為國產(chǎn)GPU的算力效率樹立行業(yè)標(biāo)桿。
  • 前瞻布局:推動AI基礎(chǔ)設(shè)施進(jìn)化。這一技術(shù)體系不僅滿足大模型時代的高效計算需求,更為世界模型和新興AI架構(gòu)的演化提供前瞻性支撐,助力AI基礎(chǔ)設(shè)施向高通用性、高精度方向持續(xù)升級。


技術(shù)二:自研MUSA架構(gòu),提升芯片有效算力
強(qiáng)大的芯片有效算力是驅(qū)動“AI工廠”高效運(yùn)轉(zhuǎn)的核心動力。摩爾線程基于自研MUSA架構(gòu),通過計算、內(nèi)存、通信三重突破,顯著提升單GPU運(yùn)算效率。

  • 創(chuàng)新架構(gòu)突破傳統(tǒng)限制:摩爾線程采用創(chuàng)新的多引擎、可伸縮GPU架構(gòu),通過硬件資源池化及動態(tài)資源調(diào)度技術(shù),構(gòu)建了全局共享的計算、內(nèi)存與通信資源池。這一設(shè)計不僅突破了傳統(tǒng)GPU功能單一的限制,還在保障通用性的同時顯著提升了資源利用率。其參數(shù)化配置可伸縮架構(gòu)允許面向目標(biāo)市場快速裁剪出優(yōu)化的芯片配置,大幅降低了新品芯片的開發(fā)成本。
  • 計算性能顯著提升:在計算層面,摩爾線程的AI加速系統(tǒng)(TCE/TME)全面支持INT8/FP8/FP16/BF16/TF32等多種混合精度計算。作為國內(nèi)首批實現(xiàn)FP8算力量產(chǎn)的GPU廠商,其FP8技術(shù)通過快速格式轉(zhuǎn)換、動態(tài)范圍智能適配和高精度累加器等創(chuàng)新設(shè)計,在保證計算精度的同時,將Transformer計算性能提升約30%。
  • 內(nèi)存與通信效率全面優(yōu)化:內(nèi)存系統(tǒng)方面,通過多精度近存規(guī)約引擎、低延遲Scale-Up、通算并行資源隔離等技術(shù),實現(xiàn)了50%的帶寬節(jié)省和60%的延遲降低。在通信和互聯(lián)領(lǐng)域,獨創(chuàng)的ACE異步通信引擎減少了15%的計算資源損耗,MTLink2.0互聯(lián)技術(shù)提供了高出國內(nèi)行業(yè)平均水平60%的帶寬,為大規(guī)模集群部署奠定了堅實基礎(chǔ)。

技術(shù)三:MUSA全棧系統(tǒng)軟件,提升單節(jié)點計算效率
當(dāng)AI算力競爭進(jìn)入深水區(qū),摩爾線程通過MUSA全棧系統(tǒng)軟件實現(xiàn)關(guān)鍵技術(shù)突破,推動AI工廠從單點創(chuàng)新轉(zhuǎn)向系統(tǒng)級效能提升。其核心創(chuàng)新包括:

  • 任務(wù)調(diào)度優(yōu)化:核函數(shù)啟動時間縮短50%;
  • 極致性能算子庫:GEMM算子算力利用率達(dá)98%,F(xiàn)lash Attention 算子算力利用率突破95%;
  • 通信效能躍升:MCCL通信庫實現(xiàn)RDMA網(wǎng)絡(luò)97%帶寬利用率;基于異步通信引擎優(yōu)化計算通信并行,集群性能提升10%;
  • 低精度計算效率革新:FP8優(yōu)化與重計算技術(shù)顯著降低訓(xùn)練開銷;
  • 開發(fā)生態(tài)完善:基于Triton-MUSA編譯器+MUSA Graph 實現(xiàn)DeepSeek R1推理加速1.5倍,全面兼容Triton等主流框架。


技術(shù)四:自研KUAE大規(guī)模集群,優(yōu)化集群效率

  • 當(dāng)單節(jié)點效率達(dá)到新高度,如何實現(xiàn)大規(guī)模集群的高效協(xié)作成為新的挑戰(zhàn)。摩爾線程自研KUAE計算集群通過5D大規(guī)模分布式并行計算技術(shù),實現(xiàn)上千節(jié)點的高效協(xié)作,推動AI基礎(chǔ)設(shè)施從單點優(yōu)化邁向系統(tǒng)工程級突破。
  • 創(chuàng)新5D并行訓(xùn)練:摩爾線程整合數(shù)據(jù)、模型、張量、流水線和專家并行技術(shù),全面支持Transformer等主流架構(gòu),顯著提升大規(guī)模集群訓(xùn)練效率。
  • 性能仿真與優(yōu)化:自主研發(fā)的Simumax工具面向超大規(guī)模集群自動搜索最優(yōu)并行策略,精準(zhǔn)模擬FP8混合精度訓(xùn)練與算子融合,為DeepSeek等模型縮短訓(xùn)練周期提供科學(xué)依據(jù)。
  • 秒級備份恢復(fù):針對大模型穩(wěn)定性難題,創(chuàng)新CheckPoint加速方案利用RDMA技術(shù),將百GB級備份恢復(fù)時間從數(shù)分鐘壓縮至1秒,提升GPU有效算力利用率。


技術(shù)五:零中斷容錯技術(shù),提升集群的穩(wěn)定性和可靠性
在構(gòu)建高效集群的基礎(chǔ)上,穩(wěn)定可靠的運(yùn)行環(huán)境是“AI工廠”持續(xù)產(chǎn)出的保障。

特別在萬卡級AI集群中,硬件故障導(dǎo)致的訓(xùn)練中斷會嚴(yán)重浪費(fèi)算力。摩爾線程創(chuàng)新推出零中斷容錯技術(shù),故障發(fā)生時僅隔離受影響節(jié)點組,其余節(jié)點繼續(xù)訓(xùn)練,備機(jī)無縫接入,全程無中斷。這一方案使KUAE集群有效訓(xùn)練時間占比超99%,大幅降低恢復(fù)開銷。
同時,KUAE集群通過多維度訓(xùn)練洞察體系實現(xiàn)動態(tài)監(jiān)測與智能診斷,異常處理效率提升50%;結(jié)合集群巡檢與起飛檢查,訓(xùn)練成功率提高10%,為大規(guī)模AI訓(xùn)練提供穩(wěn)定保障。


從訓(xùn)練到驗證:構(gòu)建完整閉環(huán)

摩爾線程以打造先進(jìn)的“AI工廠”為目標(biāo),憑借全功能GPU的通用計算能力、創(chuàng)新的MUSA架構(gòu)、優(yōu)化的MUSA軟件棧、自研的KUAE集群以及零中斷容錯技術(shù)這五大核心要素,構(gòu)建起高效的“AI工廠”,為AI大模型訓(xùn)練提供了強(qiáng)大而可靠的基礎(chǔ)設(shè)施支持。

完善的“AI工廠”不僅需要高效訓(xùn)練大模型,還需具備推理驗證能力。摩爾線程基于自研MUSA技術(shù)棧,構(gòu)建覆蓋LLM、視覺、生成類模型的全流程推理解決方案,實現(xiàn)“訓(xùn)練-驗證-部署”的無縫銜接。其MT Transformer自研推理引擎、TensorX自研推理引擎和vLLM-MUSA推理框架,為模型驗證和部署提供極致性能支持。

AI工廠,驅(qū)動千行百業(yè)智能升級

依托AI工廠,摩爾線程成功構(gòu)建起覆蓋"訓(xùn)練-推理-部署"全流程的高效體系。這一突破標(biāo)志著國產(chǎn)計算基礎(chǔ)設(shè)施已具備支撐AGI時代規(guī)?;⒏咝?、高可靠模型生產(chǎn)的關(guān)鍵能力。

從圖形渲染基石到AI算力引擎,摩爾線程全功能GPU持續(xù)加速計算革新。以“KUAE+MUSA”為智算業(yè)務(wù)核心,摩爾線程將加速賦能千行百業(yè),推動全功能GPU驅(qū)動的AI技術(shù)在物理仿真、AIGC、科學(xué)計算、具身智能、智能體、醫(yī)療影像分析、工業(yè)大模型等關(guān)鍵領(lǐng)域的應(yīng)用與部署。

同時,摩爾線程深知開放是生態(tài)繁榮之源。摩爾線程將于今年10月舉辦首屆MUSA開發(fā)者大會,誠邀全球開發(fā)者共探前沿技術(shù),共享MUSA自主新生態(tài)。

隨著WAIC 2025正式拉開帷幕,摩爾線程以“全功能GPU,為美好世界加速”為主題,精彩亮相上海世博展覽館H1-A821展位,誠邀業(yè)界同仁蒞臨參觀交流,共同見證國產(chǎn)人工智能基礎(chǔ)設(shè)施的創(chuàng)新突破與發(fā)展。



關(guān)于摩爾線程
摩爾線程以全功能GPU為核心,致力于向全球提供加速計算的基礎(chǔ)設(shè)施和一站式解決方案,為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計算支持。

我們的目標(biāo)是成為具備國際競爭力的GPU領(lǐng)軍企業(yè),為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計算平臺。我們的愿景是為美好世界加速。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 摩爾線程
    +關(guān)注

    關(guān)注

    2

    文章

    279

    瀏覽量

    6450
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3648

    瀏覽量

    5179
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    小馬智行與摩爾線程達(dá)成戰(zhàn)略合作

    2月6日,小馬智行與國產(chǎn)全功能GPU領(lǐng)軍企業(yè)摩爾線程正式宣布達(dá)成戰(zhàn)略合作。雙方將聚焦L4級自動駕駛技術(shù)落地與規(guī)?;瘧?yīng)用,圍繞小馬智行的技術(shù)核心
    的頭像 發(fā)表于 02-06 09:23 ?3592次閱讀

    全棧國產(chǎn)AI Coding上線:摩爾線程+硅基流動+智譜,強(qiáng)強(qiáng)聯(lián)合!

    摩爾線程今日正式推出AI Coding Plan 智能編程服務(wù)。作為首個基于國產(chǎn)全功能 GPU 算力底座構(gòu)建的智能開發(fā)解決方案,該服務(wù)以 MTT S5000 強(qiáng)勁的全精度計算能力為核心
    的頭像 發(fā)表于 02-03 17:07 ?1440次閱讀
    全棧國產(chǎn)<b class='flag-5'>AI</b> Coding上線:<b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>+硅基流動+智譜,強(qiáng)強(qiáng)聯(lián)合!

    摩爾線程正式推出AI Coding Plan智能編程服務(wù)

    摩爾線程今日正式推出 AI Coding Plan 智能編程服務(wù)。作為首個基于國產(chǎn)全功能 GPU 算力底座構(gòu)建的智能開發(fā)解決方案,該服務(wù)以 MTT S5000 強(qiáng)勁的全精度計算能力為核心
    的頭像 發(fā)表于 02-03 16:46 ?1395次閱讀

    算力即國力!摩爾線程架構(gòu)/芯片/超節(jié)點/萬卡集群四連發(fā),助力打造AI國之重器

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)在人工智能(AI)時代,算力如同工業(yè)革命的電力,成為驅(qū)動社會運(yùn)轉(zhuǎn)的“數(shù)字能源”,是AI技術(shù)研發(fā)走向大規(guī)模應(yīng)用的核心
    的頭像 發(fā)表于 12-23 09:29 ?5376次閱讀
    算力即國力!<b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>架構(gòu)/芯片/超節(jié)點/萬卡集群四連發(fā),助力<b class='flag-5'>打造</b><b class='flag-5'>AI</b>國之重器

    摩爾線程新一代大語言模型對齊框架URPO入選AAAI 2026

    近日,摩爾線程在人工智能前沿領(lǐng)域取得重要突破,其提出的新一代大語言模型對齊框架——URPO統(tǒng)一獎勵與策略優(yōu)化,相關(guān)研究論文已被人工智能領(lǐng)域的國際頂級學(xué)術(shù)會議AAAI 2026收錄。這一成果標(biāo)志著
    的頭像 發(fā)表于 11-17 16:03 ?481次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>新一代大語言<b class='flag-5'>模型</b>對齊框架URPO入選AAAI 2026

    摩爾線程發(fā)布大模型訓(xùn)練仿真工具SimuMax v1.0

    近日,摩爾線程正式發(fā)布并開源大模型分布式訓(xùn)練仿真工具SimuMax 1.0版本。該版本在顯存和性能仿真精度上實現(xiàn)突破性提升,同時引入多項關(guān)鍵功能,進(jìn)一步增強(qiáng)了
    的頭像 發(fā)表于 09-11 18:19 ?3710次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>發(fā)布大<b class='flag-5'>模型</b><b class='flag-5'>訓(xùn)練</b>仿真工具SimuMax v1.0

    摩爾線程五大核心技術(shù)提升 AI 工廠效率

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)第十三屆半導(dǎo)體設(shè)備與核心部件及材料展(CSEAC 2025)的主題是 “做強(qiáng)中國芯,擁抱芯世界”。在展會開幕式暨 2025 集成電路(無錫)創(chuàng)新發(fā)展論壇上,摩爾線程
    發(fā)表于 09-07 02:56 ?4109次閱讀

    摩爾線程副總裁王華:AI工廠全棧技術(shù)重構(gòu)算力基建,開啟國產(chǎn) GPU 黃金時代

    摩爾線程在世界人工智能大會(WAIC 2025)前夕舉辦以“算力進(jìn)化,精度革命”為主題的技術(shù)分享會,創(chuàng)新性提出“AI工廠” 理念。這一系統(tǒng)性
    的頭像 發(fā)表于 08-02 14:21 ?5347次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>副總裁王華:<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>全棧<b class='flag-5'>技術(shù)</b>重構(gòu)算力基建,開啟國產(chǎn) GPU 黃金時代

    摩爾線程WAIC2025亮相:以“AI工廠”理念重塑算力生態(tài) 全棧產(chǎn)品開啟智能新紀(jì)元

    決方案成為焦點,全方位展現(xiàn)了其在AI領(lǐng)域的技術(shù)實力與行業(yè)愿景。 ? ? 一、“AI工廠”理念:重構(gòu)大模型
    的頭像 發(fā)表于 07-28 16:00 ?1.1w次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>WAIC2025亮相:以“<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>”理念重塑算力生態(tài) 全棧產(chǎn)品開啟智能新紀(jì)元

    摩爾線程亮相WAIC 2025:以“AI工廠”理念驅(qū)動算力進(jìn)化,全棧AI應(yīng)用賦能千行百業(yè)

    模型的“超級工廠”。此次參會不僅彰顯了摩爾線程AI基礎(chǔ)設(shè)施領(lǐng)域的系統(tǒng)性創(chuàng)新,更通過多行業(yè)案例展
    的頭像 發(fā)表于 07-28 11:34 ?2100次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>亮相WAIC 2025:以“<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>”理念驅(qū)動算力進(jìn)化,全棧<b class='flag-5'>AI</b>應(yīng)用賦能千行百業(yè)

    摩爾線程AI工廠”:以系統(tǒng)級創(chuàng)新定義新一代AI基礎(chǔ)設(shè)施

    演講中表示,為應(yīng)對生成式AI爆發(fā)式增長下的大模型訓(xùn)練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構(gòu)建新一代A
    發(fā)表于 07-28 10:34 ?2796次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>“<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>”:以系統(tǒng)級創(chuàng)新定義新一代<b class='flag-5'>AI</b>基礎(chǔ)設(shè)施

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】第三章:探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

    數(shù)據(jù)中挖掘有價值信息,這也讓我意識到架構(gòu)設(shè)計對模型性能起著根本性作用,是 AI 具備強(qiáng)大能力的 “骨骼” 支撐。 二、流水線并行 書中關(guān)于流水線并行的內(nèi)容,展現(xiàn)了提升計算效率的巧妙思路。簡單流水線并行雖
    發(fā)表于 07-20 15:07

    關(guān)于AI工廠三階段模型

    在今天(2025年5月20日)的Computex大會上,富士康董事長劉揚(yáng)偉發(fā)表了以“AI工廠三階段模型”及“Genesis”為核心的Keynote演講,提到鴻海集團(tuán)在
    的頭像 發(fā)表于 05-20 23:26 ?1369次閱讀
    關(guān)于<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>三階段<b class='flag-5'>模型</b>

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    科正將AI能力體系化并賦能終端生態(tài)。 大會上,聯(lián)發(fā)科定義了“智能體化用戶體驗”的五大特征:主動及時、知你懂你、互動協(xié)作、學(xué)習(xí)進(jìn)化和專屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)
    發(fā)表于 04-13 19:52

    摩爾線程GPU原生FP8計算助力AI訓(xùn)練

    并行訓(xùn)練和推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線程是國內(nèi)率先原生支持FP8計算精度的國產(chǎn)GPU企業(yè),此次開源不僅為AI
    的頭像 發(fā)表于 03-17 17:05 ?1517次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU原生FP8計算助力<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>