91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦助力上海創(chuàng)智學(xué)院siiRL 2.0全面升級(jí)

沐曦MetaX ? 來源:沐曦MetaX ? 2025-09-29 11:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能加速邁向大模型與智能體時(shí)代的今天,強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)已經(jīng)成為推動(dòng)智能系統(tǒng)演化的關(guān)鍵技術(shù)。隨著強(qiáng)化學(xué)習(xí)訓(xùn)練規(guī)模不斷擴(kuò)大,對(duì)底層算力提出了前所未有的挑戰(zhàn)。近日,上海創(chuàng)智學(xué)院 AI Infra 團(tuán)隊(duì)發(fā)布的 siiRL 2.0,以其卓越特性為強(qiáng)化學(xué)習(xí)的發(fā)展帶來了新的突破,沐曦則憑借自身優(yōu)勢(shì)為 siiRL 2.0 的升級(jí)提供了堅(jiān)實(shí)支撐,共同推動(dòng)強(qiáng)化學(xué)習(xí)正式邁入 “千卡級(jí)”時(shí)代。

siiRL:全分布式架構(gòu)的顛覆性突破

上海創(chuàng)智學(xué)院AI Infra團(tuán)隊(duì)發(fā)布siiRL 2.0,聚焦性能、生態(tài)與前沿探索全面升級(jí):

卓越性能與擴(kuò)展性

基于全分布式架構(gòu),實(shí)現(xiàn)千卡級(jí)近線性擴(kuò)展與業(yè)界領(lǐng)先吞吐,性能在7B~235B(Dense/MoE)等大規(guī)模模型上穩(wěn)定驗(yàn)證。

自主可控,擁抱國(guó)產(chǎn)算力

全面適配多家主流國(guó)產(chǎn)芯片并完成千卡級(jí)擴(kuò)展驗(yàn)證,為AI基礎(chǔ)設(shè)施夯實(shí)自主可控的算力底座。

靈活易用與生態(tài)兼容

獨(dú)創(chuàng)DAG工作流支持無代碼算法實(shí)驗(yàn),兼容Megatron/FSDP等主流后端,極大提升研發(fā)效率。

面向前沿,支持多智能體研究

內(nèi)建強(qiáng)大的多智能體協(xié)同訓(xùn)練框架,為探索“智能涌現(xiàn)”等前沿課題提供關(guān)鍵基礎(chǔ)設(shè)施。

9b4e6c46-9829-11f0-8c8f-92fbcf53809c.png

圖 1:siiRL架構(gòu)概覽

技術(shù)論文:https://arxiv.org/abs/2507.13833

開源代碼倉(cāng)庫(kù):https://github.com/sii-research/siiRL

在本次siiRL的升級(jí)適配工作中,沐曦做了一系列針對(duì)性優(yōu)化:

siiRL框架高效適配

基于沐曦自研的MXMACA軟件棧,已經(jīng)完整適配了siiRL需要的所有后端引擎(Vllm/Pytorch fsdp/Megatron-LM/Ray)以及深度優(yōu)化的mccl高性能通信庫(kù),不需要其他額外的適配工作,實(shí)現(xiàn)了siiRL框架的高效適配。

超節(jié)點(diǎn)scale up

沐曦Dragonfly超節(jié)點(diǎn),提供了64卡的光互連高速通信帶寬。在訓(xùn)練過程中,通過設(shè)置fsdp_size=64,可以充分利用超節(jié)點(diǎn)內(nèi)的帶寬,提升模型的訓(xùn)練效率。

顯存優(yōu)化

通過設(shè)置模型參數(shù)offload選項(xiàng),在共置集群上,有效降低了rollout和training階段的峰值顯存,可以采用更優(yōu)的切分方式,進(jìn)一步提升計(jì)算效率。

分布式策略調(diào)整

結(jié)合實(shí)際負(fù)載與硬件拓?fù)?,?yōu)化了不同模型的分布式訓(xùn)練參數(shù)切分方式,并調(diào)整了親和性配置,以提升通信效率。

通過上述優(yōu)化,siiRL框架在沐曦超節(jié)點(diǎn)集群上實(shí)現(xiàn)了從64卡到1024卡的穩(wěn)定擴(kuò)展,系統(tǒng)保持了超過92%的高線性度拓展效率。在模型精度上,與國(guó)際主流生態(tài) GPU的訓(xùn)練結(jié)果相比,沐曦超節(jié)點(diǎn)集群在驗(yàn)證集上的平均絕對(duì)誤差控制在0.5%以內(nèi),滿足實(shí)際應(yīng)用場(chǎng)景的精度要求。

9bc2af0c-9829-11f0-8c8f-92fbcf53809c.png

圖 2:siiRL在沐曦超節(jié)點(diǎn)集群上的擴(kuò)展性評(píng)估,

展示了64卡到1024GPU規(guī)模下的高線性擴(kuò)展能力

隨著 AI 技術(shù)逐漸成為國(guó)家科技競(jìng)爭(zhēng)的核心,構(gòu)建自主可控的算力基礎(chǔ)設(shè)施已經(jīng)成為產(chǎn)業(yè)發(fā)展的必然選擇。沐曦與上海創(chuàng)智學(xué)院 AI Infra 團(tuán)隊(duì)的攜手合作,不僅驗(yàn)證了國(guó)產(chǎn) GPU 在前沿 AI 應(yīng)用上的可行性與先進(jìn)性,更為中國(guó)科研機(jī)構(gòu)、產(chǎn)業(yè)界提供了面向未來的堅(jiān)實(shí)算力底座。沐曦將持續(xù)與產(chǎn)學(xué)研伙伴深度協(xié)作,推動(dòng)大模型框架與國(guó)產(chǎn) GPU 的深度適配和生態(tài)完善,加速?gòu)?qiáng)化學(xué)習(xí)、大模型、智能體等關(guān)鍵領(lǐng)域的創(chuàng)新應(yīng)用落地。

關(guān)于沐曦

沐曦致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺(tái),為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5199

    瀏覽量

    135530
  • 沐曦
    +關(guān)注

    關(guān)注

    1

    文章

    80

    瀏覽量

    1834
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3660

    瀏覽量

    5196

原文標(biāo)題:強(qiáng)化學(xué)習(xí)進(jìn)入“千卡級(jí)”時(shí)代,沐曦助力 siiRL 2.0 全面升級(jí)

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型

    2月13日晚間,MiniMax正式開源MiniMax M2.5模型。技術(shù)團(tuán)隊(duì)依托MXMACA軟件棧,在24小時(shí)內(nèi)完成云C500/C550 對(duì)該模型的深度適配。
    的頭像 發(fā)表于 02-26 14:19 ?735次閱讀

    股份CXO預(yù)科班2026冬令營(yíng)圓滿收官

    2月6日,由集成電路(上海)股份有限公司(股票代碼:688802,簡(jiǎn)稱“股份”)主辦、之江實(shí)驗(yàn)室大力支持、
    的頭像 發(fā)表于 02-25 16:29 ?1099次閱讀

    云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力Padd
    的頭像 發(fā)表于 01-30 10:19 ?851次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    股份與江南大學(xué)建立聯(lián)合研究中心

    近日,教育部哲學(xué)社會(huì)科學(xué)實(shí)驗(yàn)室“食品安全與國(guó)家戰(zhàn)略治理實(shí)驗(yàn)室”揭牌暨合作簽約儀式、學(xué)術(shù)委員會(huì)會(huì)議在無錫隆重舉行?;顒?dòng)現(xiàn)場(chǎng),集成電路(上海)股份有限公司與江南大學(xué)簽署共建協(xié)議,并同步揭牌“江南大學(xué)
    的頭像 發(fā)表于 01-21 17:25 ?1409次閱讀

    與Arm、熠知一同到訪清華大學(xué)交流座談

    助力頂尖學(xué)府清華大學(xué)在“AI+教科研”領(lǐng)域取得新突破,培養(yǎng)具備AI創(chuàng)新能力的人才,1月12日,集成電路(上海)股份有限公司(股票代碼:688802)、半導(dǎo)體頭部企業(yè)Arm控股有限
    的頭像 發(fā)表于 01-14 13:52 ?366次閱讀

    受邀出席第二屆開源產(chǎn)業(yè)生態(tài)大會(huì)

    以“開源筑基·數(shù)實(shí)維新”為主題的第二屆開源產(chǎn)業(yè)生態(tài)大會(huì)將于1月13日在上海舉行。受邀出席本次行業(yè)盛會(huì),聯(lián)合創(chuàng)始人、CTO兼首席軟件架構(gòu)師楊建將發(fā)表主題演講并參與圓桌論壇環(huán)節(jié),分享
    的頭像 發(fā)表于 01-14 13:51 ?312次閱讀

    股份在上海證券交易所科創(chuàng)板掛牌上市

    近日,股份正式在上海證券交易所科創(chuàng)板掛牌上市,股票代碼:688802.SH。作為國(guó)內(nèi)高性
    的頭像 發(fā)表于 12-24 09:03 ?2676次閱讀

    股份云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    12月8日智譜AI發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型,股份云C系列GPU完成Day 0適配。
    的頭像 發(fā)表于 12-17 14:28 ?627次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    DLInfer聯(lián)手股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地

    近期,上海 AI 實(shí)驗(yàn)室 DeepLink 團(tuán)隊(duì)推出的 DLInfer 通過支持 LMDeploy 主流模型推理,助力股份云 C500
    的頭像 發(fā)表于 12-09 14:55 ?732次閱讀
    DLInfer聯(lián)手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地

    股份與上海電信完成首期GPU生態(tài)專家認(rèn)證培訓(xùn)

    近期,集成電路(上海)股份有限公司(以下簡(jiǎn)稱“股份”)攜手上海電信天翼云能力運(yùn)營(yíng)中心(以
    的頭像 發(fā)表于 10-31 10:33 ?514次閱讀

    首款全國(guó)產(chǎn)通用GPU芯片發(fā)布 集成推出云C600

    ,并支持MetaXLink超節(jié)點(diǎn)擴(kuò)展技術(shù),在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓(xùn)練和推理需求。 而且,股份與中國(guó)科學(xué)院合作的國(guó)產(chǎn)千卡集群,已完成多個(gè)大模型全參數(shù)訓(xùn)練,證實(shí)國(guó)產(chǎn)算力已具備大模型預(yù)訓(xùn)練能力。 公開資料
    的頭像 發(fā)表于 10-19 20:04 ?4.6w次閱讀

    GPU與龍蜥操作系統(tǒng)完成適配

    集成電路(上海)股份有限公司(以下簡(jiǎn)稱"")于 2020 年 9 月成立于上海,其擁有技
    的頭像 發(fā)表于 10-17 15:06 ?1226次閱讀

    書生大模型實(shí)戰(zhàn)營(yíng)魔樂專場(chǎng)MeetUP精彩回顧

    近日,由書生大模型社區(qū)、、魔樂社區(qū)、算豐和 DaoCloud 道客等聯(lián)合打造的「書生大模型實(shí)戰(zhàn)營(yíng)魔樂專場(chǎng) MeetUP 暨頒獎(jiǎng)儀式」在上海
    的頭像 發(fā)表于 08-20 11:33 ?1123次閱讀

    硅基流動(dòng)攜手首發(fā)基于云的Kimi K2推理服務(wù)

    今天,硅基流動(dòng)聯(lián)合集成電路(上海)股份有限公司(簡(jiǎn)稱“”),全球首發(fā)基于
    的頭像 發(fā)表于 07-23 17:33 ?1966次閱讀

    PaddleScience完成與AI芯片適配

    當(dāng)前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計(jì)算、科學(xué)建模等多個(gè)方向。這一趨勢(shì)正加速形成面向"Al for Science"的國(guó)產(chǎn)智算生態(tài)新格局。
    的頭像 發(fā)表于 05-06 14:49 ?1660次閱讀