2025年,人工智能產(chǎn)業(yè)步入規(guī)?;瘧?yīng)用深水區(qū),大模型技術(shù)迭代加速,對(duì)算力規(guī)模與效率提出更高要求。在這一背景下,9月,中科曙光依托國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心,聯(lián)合產(chǎn)業(yè)鏈上下游20多家企業(yè)共同推出AI計(jì)算開(kāi)放架構(gòu),推動(dòng)產(chǎn)業(yè)從封閉走向開(kāi)放,從單點(diǎn)突破走向系統(tǒng)優(yōu)化。
系統(tǒng)創(chuàng)新:打造開(kāi)放架構(gòu)的硬件基礎(chǔ)
面對(duì)AI算力需求爆發(fā)式增長(zhǎng),曙光率先在硬件架構(gòu)上實(shí)現(xiàn)突破。在11月的世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)上,正式發(fā)布全球首款單機(jī)柜級(jí)640卡超節(jié)點(diǎn)scaleX640。scaleX640采用“一拖二”系統(tǒng)設(shè)計(jì),單機(jī)柜實(shí)現(xiàn)最大640卡超高速總線互連,通過(guò)雙超節(jié)點(diǎn)組成千卡級(jí)計(jì)算單元。通過(guò)正交架構(gòu)、浸沒(méi)相變液冷等技術(shù),系統(tǒng)PUE降至1.04,算力密度相比業(yè)界傳統(tǒng)架構(gòu)提升20倍。
在12月的光合組織人工智能創(chuàng)新大會(huì)上,曙光進(jìn)一步推出scaleX萬(wàn)卡超集群系統(tǒng)?,F(xiàn)場(chǎng)展示的系統(tǒng)由16個(gè)scaleX640超節(jié)點(diǎn)通過(guò)自研scaleFabric網(wǎng)絡(luò)互連而成,依靠RDMA技術(shù)使萬(wàn)卡集群并行效率得到顯著提升,總算力規(guī)模超過(guò)5EFlops,網(wǎng)絡(luò)總體成本降低30%。
在產(chǎn)品創(chuàng)新方面,基于AI計(jì)算開(kāi)放架構(gòu)理念設(shè)計(jì)的scaleX超節(jié)點(diǎn)及超集群系統(tǒng),支持多品牌加速卡,兼容主流AI軟件生態(tài),為突破AI算力瓶頸提供新選擇。目前,基于開(kāi)放架構(gòu)的系列產(chǎn)品已在高校、科研院所、企業(yè)等30多個(gè)行業(yè)領(lǐng)域獲得應(yīng)用。
技術(shù)共享:構(gòu)建五層開(kāi)放能力體系
曙光認(rèn)識(shí)到,真正的開(kāi)放需要全棧技術(shù)能力的共享。中科曙光協(xié)同產(chǎn)業(yè)鏈伙伴,推進(jìn)部件級(jí)、系統(tǒng)層、基礎(chǔ)設(shè)施層、軟件層和數(shù)據(jù)集等五層技術(shù)能力開(kāi)放,降級(jí)創(chuàng)新門(mén)檻與研發(fā)成本,以促進(jìn)算力普惠與生態(tài)創(chuàng)新。
基礎(chǔ)設(shè)施層面,曙光數(shù)創(chuàng)牽頭編制冷板式液冷系統(tǒng)國(guó)家標(biāo)準(zhǔn),推動(dòng)液冷技術(shù)標(biāo)準(zhǔn)化。軟件層面,曙光推出UPTK通用異構(gòu)編程工具包,通過(guò)對(duì)異構(gòu)計(jì)算運(yùn)行時(shí)接口進(jìn)行標(biāo)準(zhǔn)化定義,使開(kāi)發(fā)者無(wú)需關(guān)注底層架構(gòu)差異,即可實(shí)現(xiàn)“一套代碼、多端部署”。此外,曙光還推出OneScience科學(xué)大模型開(kāi)發(fā)平臺(tái)、DeepAI深算智能引擎等模型軟件的開(kāi)放共享。截至目前,模型下載量超80萬(wàn)次,鏡像下載量超200萬(wàn)次。數(shù)據(jù)層面,中科天機(jī)全球率先發(fā)布“高分辨率氣象數(shù)據(jù)共享計(jì)劃”,先后共享模式數(shù)據(jù)、歷史數(shù)據(jù)集、融合數(shù)據(jù),實(shí)現(xiàn)了從比肩到超越歐洲中期天氣預(yù)報(bào)中心(ECMWF)數(shù)據(jù)的跨越式突破,賦能科研教育、新能源、低空經(jīng)濟(jì)、農(nóng)業(yè)、交通等行業(yè),并驅(qū)動(dòng)大模型革新。
產(chǎn)業(yè)協(xié)同:建立開(kāi)放架構(gòu)聯(lián)合實(shí)驗(yàn)室
在產(chǎn)業(yè)協(xié)作方面,依托光合組織,曙光聯(lián)合20多家上下游企業(yè)共同推進(jìn)建設(shè)“AI計(jì)算開(kāi)放架構(gòu)聯(lián)合實(shí)驗(yàn)室”,重點(diǎn)解決芯片與基礎(chǔ)軟件協(xié)同、模型-硬件適配優(yōu)化等實(shí)際問(wèn)題,破解“硬件墻”“生態(tài)墻”壁壘。
此外,光合組織人工智能創(chuàng)新大會(huì)上還公布了科學(xué)智能聯(lián)合攻關(guān)行動(dòng)、AI計(jì)算開(kāi)放架構(gòu)聯(lián)合實(shí)驗(yàn)室首批項(xiàng)目組協(xié)同創(chuàng)新計(jì)劃,旨在匯聚頂尖力量,針對(duì)科學(xué)大模型、多元異構(gòu)算力融合、統(tǒng)一基礎(chǔ)軟件棧、超大規(guī)模集群優(yōu)化等共性關(guān)鍵技術(shù)開(kāi)展聯(lián)合攻關(guān),將開(kāi)放協(xié)作深入研發(fā)源頭。
從單點(diǎn)突破到系統(tǒng)優(yōu)化,曙光AI計(jì)算開(kāi)放架構(gòu)的實(shí)踐表明,通過(guò)產(chǎn)業(yè)鏈協(xié)同破解復(fù)雜技術(shù)難題,是推動(dòng)中國(guó)智算產(chǎn)業(yè)可持續(xù)發(fā)展的可行路徑。這一探索不僅為行業(yè)提供技術(shù)解決方案,更在產(chǎn)業(yè)協(xié)作機(jī)制上積累了寶貴經(jīng)驗(yàn)。
-
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301356 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265275 -
中科曙光
+關(guān)注
關(guān)注
5文章
495瀏覽量
18908
原文標(biāo)題:2025答卷|開(kāi)放,為了更好的計(jì)算
文章出處:【微信號(hào):sugoncn,微信公眾號(hào):中科曙光】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
2025年中科曙光DeepAI深算智能引擎完成全面進(jìn)化
3年10億,攜手攻堅(jiān):“AI計(jì)算開(kāi)放架構(gòu)聯(lián)合實(shí)驗(yàn)室”協(xié)同創(chuàng)新計(jì)劃正式啟動(dòng)
2025年中科曙光聯(lián)合多家企業(yè)共同推出AI計(jì)算開(kāi)放架構(gòu)
評(píng)論