91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

奇異摩爾賦能萬卡集群互聯(lián)

奇異摩爾 ? 來源:奇異摩爾 ? 2024-09-19 13:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Intel、AMD博通(Broadcom)、思科(Cisco)、Google、惠普(Hewlett Packard Enterprise,HPE)、Meta和微軟(Microsoft)在內(nèi)的八家公司宣布他們已經(jīng)為人工智能數(shù)據(jù)中心的網(wǎng)絡(luò)制定了新的互聯(lián)技術(shù)UALink(Ultra Accelerator Link),以打破英偉達(dá)NVLink技術(shù)壟斷的消息受到了廣泛的關(guān)注。

“本期奇說芯語Kiwi Talks 將從萬卡集群大模型算力需求的挑戰(zhàn)說起,來解讀這場(chǎng)軍備賽的背后原理…”

智算網(wǎng)絡(luò)催生萬卡集群

隨著大模型的持續(xù)爆發(fā),其對(duì)算力的需求也在迅猛增長(zhǎng),這促使算力集群不斷向萬卡以上的規(guī)模演進(jìn)。這一趨勢(shì)不僅代表著計(jì)算能力的飛躍,也對(duì)網(wǎng)絡(luò)提出了前所未有的超高要求。

萬卡集群是指由一萬張及以上的加速卡(包括GPU、TPU及其他專用AI加速芯片)組成的高性能計(jì)算系統(tǒng),主要用于加速人工智能模型的訓(xùn)練和推理過程。這種集群的構(gòu)建旨在解決大模型訓(xùn)練對(duì)算力需求的巨大增長(zhǎng)問題,尤其是現(xiàn)在模型參數(shù)量從百億級(jí)、千億級(jí)邁向萬億級(jí)。大模型的訓(xùn)練和推理任務(wù)需要海量的計(jì)算資源和高效的網(wǎng)絡(luò)連接。

萬卡級(jí)別的算力集群意味著將有數(shù)以萬計(jì)的高性能計(jì)算節(jié)點(diǎn)協(xié)同工作,它們之間的數(shù)據(jù)傳輸和同步必須達(dá)到毫秒級(jí)甚至微秒級(jí)的延遲,以確保模型訓(xùn)練的高效性和準(zhǔn)確性。首先,大模型訓(xùn)練對(duì)于GPU之間的互聯(lián)通信要求極高,無論是機(jī)內(nèi)GPU的通信還是服務(wù)器之間的GPU通信。特別是在模型并行和數(shù)據(jù)并行等模式下,通信數(shù)據(jù)量更是達(dá)到了百GB級(jí)別。因此,網(wǎng)絡(luò)必須支持高速互聯(lián)協(xié)議,并且能夠提供足夠的單端口帶寬和總帶寬。

我們知道PCIe(Peripheral Component Interconnect Express):它是一種計(jì)算機(jī)總線標(biāo)準(zhǔn),用于在計(jì)算機(jī)內(nèi)部連接各種設(shè)備和組件(例如顯卡、存儲(chǔ)設(shè)備、擴(kuò)展卡等)。PCIe接口以串行方式傳輸數(shù)據(jù),具有較高的通信帶寬,適用于連接各種設(shè)備。然而,由于其基于總線結(jié)構(gòu),同時(shí)連接多個(gè)設(shè)備時(shí)可能會(huì)受到帶寬的限制受限于帶寬、延遲、數(shù)據(jù)傳輸效率,已成為大規(guī)模計(jì)算集群的互聯(lián)瓶頸。

英偉達(dá)NVLink的無損網(wǎng)絡(luò)護(hù)城河

英偉達(dá)的NVLink是其開發(fā)并推出的一種總線及其通信協(xié)議。NVLink采用點(diǎn)對(duì)點(diǎn)結(jié)構(gòu)、串列傳輸,用于中央處理器CPU)與圖形處理器(GPU)之間的連接,也可用于多個(gè)圖形處理器之間的相互連接。與PCI Express不同,一個(gè)設(shè)備可以包含多個(gè)NVLink,并且設(shè)備之間采用網(wǎng)格網(wǎng)絡(luò)而非中心集線器方式進(jìn)行通信。該協(xié)議于2014年3月首次發(fā)布,采用專有的高速信號(hào)互連技術(shù)(NVHS)。目前NVLink已經(jīng)升級(jí)到5.0版本。第五代 NVLink 大幅提高了大型多 GPU 系統(tǒng)的可擴(kuò)展性。單個(gè) NVIDIA Blackwell Tensor Core GPU 支持多達(dá) 18 個(gè) NVLink 100 GB/s 連接,總帶寬可達(dá) 1.8 TB/s,比上一代產(chǎn)品提高了兩倍,是 PCIe 5.0 帶寬的 14 倍之多。

NVLink 就是這種“多節(jié)點(diǎn)無損網(wǎng)絡(luò)”的代表,由一個(gè)強(qiáng)大的軟件協(xié)議組成,通常通過印在計(jì)算機(jī)板上的多對(duì)導(dǎo)線實(shí)現(xiàn),可以讓處理器以極高的速度收發(fā)共享內(nèi)存池中的數(shù)據(jù)。NVLink 設(shè)計(jì)的主要設(shè)計(jì)目的,就是突破PCIe的屏障,達(dá)成GPU-GPU及CPU-GPU的片間高效數(shù)據(jù)交互。

NVLink雖擁有優(yōu)秀的性能,但私有協(xié)議無法兼容不同來源的產(chǎn)品,這樣的封閉生態(tài)已成為行業(yè)發(fā)展掣肘。受到巨大的需求推動(dòng),以及為抵抗這種市場(chǎng)擠壓 ,AMD、谷歌、微軟、英特爾(Intel)、博通(Broadcom)、思科(Cisco)構(gòu)成聯(lián)盟建立一個(gè)開放的行業(yè)互聯(lián)標(biāo)準(zhǔn)即UALink。UALink將使系統(tǒng)OEM、IT專業(yè)人員和系統(tǒng)集成商能夠?yàn)槠淙斯ぶ悄苓B接數(shù)據(jù)中心創(chuàng)建一條更易于集成、更具靈活性和可擴(kuò)展性的途徑。

據(jù)官方消息,UALink 1.0規(guī)范支持連接多達(dá)1024個(gè)AI加速器,并允許在一個(gè)計(jì)算集群(Pod)內(nèi),讓接入的GPU等加速器附帶的內(nèi)存之間實(shí)現(xiàn)直接加載和存儲(chǔ)。

奇異摩爾賦能萬卡集群互聯(lián)

目前包括各大芯片廠商以及生態(tài)內(nèi)的服務(wù)器廠商開始不斷提及甚至對(duì)標(biāo)英偉達(dá)NVLink,都想要打破其所造的護(hù)城河。整個(gè)行業(yè)生態(tài)包括奇異摩爾在內(nèi)的企業(yè)正在積極探索如何解決滿足集群通信間通訊,片間互聯(lián)的高效互聯(lián)的解決方案。

目前,奇異摩爾基于自身的互聯(lián)技術(shù)優(yōu)勢(shì),較早布局IO Die、Base Die等高性能互聯(lián)芯粒,并基于Kiwi-Link統(tǒng)一互聯(lián)架構(gòu),提供涵蓋集群間、片間、Die間的全鏈路高性能互聯(lián)解決方案

GPU片間互聯(lián)

奇異摩爾的高性能網(wǎng)絡(luò)加速芯粒 – Kiwi NDSA,內(nèi)建RoCE V2高性能 RDMA (Remote Direct Memory Access) 和數(shù)十種卸載/加速引擎,可作為獨(dú)立芯粒應(yīng)用于GPU的傳輸加速器。奇異摩爾自研的全球首創(chuàng)GPU Link Chiplet “NDSA-G2G”,通過RDMA和D2D技術(shù),在芯片間搭建了高速數(shù)據(jù)交換網(wǎng)絡(luò),可實(shí)現(xiàn)近TB/s的超高速數(shù)據(jù)傳輸,其性能達(dá)到全球領(lǐng)先水平,滿足AI芯片對(duì)于片間交換不斷增長(zhǎng)的需求。

集群間通信

奇異摩爾 Kiwi NDSA SNIC是全球首款支持800G帶寬的RDMA NIC產(chǎn)品,具備極高的集群擴(kuò)展能力,可以大幅提升集群節(jié)點(diǎn)間的交互效率,使得更大規(guī)模的集群設(shè)計(jì)成為可能。除帶寬升級(jí)到800G之外,延時(shí)也降至納秒級(jí),并支持?jǐn)?shù)十GB的超大規(guī)模數(shù)據(jù)包,性能媲美目前全球標(biāo)桿ASIC產(chǎn)品。

業(yè)界紛紛提出集群通訊互聯(lián)的重要性

中國(guó)移動(dòng)研究院網(wǎng)絡(luò)與IT技術(shù)研究所主任研究員陳佳媛在近期公開演講中提及必須突破GPU卡間互聯(lián)技術(shù)瓶頸,提高卡間互聯(lián)帶寬,提升端口數(shù)量以滿足集群算力縱向擴(kuò)展升級(jí)需求;低延遲通信,減少GPU通信跳數(shù),優(yōu)化數(shù)據(jù)傳輸路徑。 新華三集團(tuán)高級(jí)副總裁、云與計(jì)算存儲(chǔ)產(chǎn)品線總裁徐潤(rùn)安此前也談到算力互聯(lián)。在他看來,過去,大家的目標(biāo)可能是做更強(qiáng)算力的單顆芯片,現(xiàn)在會(huì)從另一個(gè)角度努力,怎樣將芯片做成更大集群,同時(shí)使得集群的通信效果更高,集群的處理能力更強(qiáng);

浪潮信息高級(jí)副總裁劉軍發(fā)表的觀點(diǎn)是,實(shí)現(xiàn)更大的算力已經(jīng)不在芯片,而是在算法層面做創(chuàng)新,比如怎么把算力分布到系統(tǒng)層面上,怎么解決卡間互聯(lián)問題,怎么讓更多的GPU高效協(xié)同。

寫在最后,數(shù)據(jù)中心和算力集群是AI的核心,網(wǎng)絡(luò)則是它的命脈,它們共同構(gòu)筑了AI大模型底層網(wǎng)絡(luò)基礎(chǔ)設(shè)施,實(shí)現(xiàn)了數(shù)據(jù)和智能的無縫傳遞。然而AI芯片性能及軟件生態(tài)存在的差距,萬卡集群建設(shè)存在芯片間、卡之間、集群間的互聯(lián)問題,這些都需要更開放的平臺(tái)去持續(xù)地解決。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4108

    瀏覽量

    99397
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1572

    瀏覽量

    16796
  • 奇異摩爾
    +關(guān)注

    關(guān)注

    0

    文章

    80

    瀏覽量

    4052
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3692

    瀏覽量

    5215

原文標(biāo)題:Kiwi Talks | 智算網(wǎng)絡(luò)催生萬卡集群,all in通信互聯(lián)軍備賽

文章出處:【微信號(hào):奇異摩爾,微信公眾號(hào):奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    摩爾線程與中國(guó)移動(dòng)研究院等,聯(lián)合發(fā)布128高密超節(jié)點(diǎn)參考設(shè)計(jì),定義超大規(guī)模智算底座新標(biāo)準(zhǔn)

    隨著全球智算集群規(guī)??缛搿?b class='flag-5'>萬時(shí)代”并向“十萬”巔峰演進(jìn),傳統(tǒng)單機(jī)八服務(wù)器在應(yīng)對(duì)超萬億參數(shù)模型時(shí),因
    發(fā)表于 03-17 08:40 ?787次閱讀

    中科曙光3套scaleX集群落地國(guó)家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)

    2月5日,由中科曙光提供的3套集群系統(tǒng)在國(guó)家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)同時(shí)上線試運(yùn)行,成為全國(guó)首個(gè)實(shí)現(xiàn)3
    的頭像 發(fā)表于 02-09 10:32 ?573次閱讀

    中科曙光scaleX集群重塑超大規(guī)模算力基礎(chǔ)設(shè)施

    在“人工智能+”行動(dòng)深入推進(jìn)的當(dāng)下,算力基礎(chǔ)設(shè)施已成為國(guó)家戰(zhàn)略競(jìng)爭(zhēng)力的核心,而超大規(guī)模集群的運(yùn)維管控難題卻日益凸顯。中科曙光scaleX集群打造的智能管理體系,正以“
    的頭像 發(fā)表于 01-30 15:43 ?835次閱讀

    中科曙光scaleX集群背后的持續(xù)創(chuàng)新

    智算集群的發(fā)展浪潮正以超乎想象的速度襲來,未來五年,十萬級(jí)的算力集群將成為標(biāo)配。但一個(gè)核心挑戰(zhàn)也隨之而來:當(dāng)成千上的芯片緊密堆疊,如何將產(chǎn)生的巨額熱量快速帶走?
    的頭像 發(fā)表于 01-19 14:49 ?685次閱讀

    奇異摩爾參編人工智能加速器互聯(lián)芯粒技術(shù)要求團(tuán)體標(biāo)準(zhǔn)發(fā)布

    近日,中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)批準(zhǔn)并發(fā)布了《人工智能超節(jié)點(diǎn)服務(wù)器技術(shù)要求》等28項(xiàng)團(tuán)體標(biāo)準(zhǔn)。其中由中國(guó)移動(dòng)研究院牽頭、奇異摩爾產(chǎn)品市場(chǎng)&研發(fā)部門主要參編的《人工智能加速器互聯(lián)芯粒技術(shù)要求
    的頭像 發(fā)表于 01-09 11:20 ?647次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>參編人工智能加速器<b class='flag-5'>互聯(lián)</b>芯粒技術(shù)要求團(tuán)體標(biāo)準(zhǔn)發(fā)布

    部分能力超越2027年NVL576,中科曙光發(fā)布scaleX集群

    2025年12月18日,在昆山舉行的光合組織2025人工智能創(chuàng)新大會(huì)(HAIC2025)上,中科曙光發(fā)布并展出了全球領(lǐng)先的大規(guī)模智能計(jì)算系統(tǒng)——scaleX集群,這也是國(guó)產(chǎn)
    發(fā)表于 12-18 18:30 ?1115次閱讀
    部分能力超越2027年NVL576,中科曙光發(fā)布scaleX<b class='flag-5'>萬</b><b class='flag-5'>卡</b>超<b class='flag-5'>集群</b>

    奇異摩爾助力中國(guó)移動(dòng)GSE 2.5版本協(xié)議標(biāo)準(zhǔn)發(fā)布

    近日,在2025移動(dòng)合作伙伴大會(huì)“算力網(wǎng)絡(luò)聯(lián)合創(chuàng)新”分論壇上,中國(guó)移動(dòng)攜手包括奇異摩爾、中興及新華三等在內(nèi)的產(chǎn)業(yè)合作伙伴重磅發(fā)布GSE 2.5版本協(xié)議標(biāo)準(zhǔn),并同步啟動(dòng)“國(guó)芯國(guó)連”智算開放互聯(lián)GSE
    的頭像 發(fā)表于 10-17 16:44 ?1265次閱讀

    奇異摩爾Networking for AI生態(tài)沙龍成功舉辦

    近日,中國(guó)信息通信研究院華東分院與行業(yè)領(lǐng)先的AI網(wǎng)絡(luò)全棧式互聯(lián)產(chǎn)品及解決方案提供商——奇異摩爾聯(lián)合舉辦的“聚力向芯 算涌無界 Networking for AI”生態(tài)沙龍活動(dòng)在上海浦東成功舉辦。
    的頭像 發(fā)表于 10-09 12:45 ?842次閱讀

    奇異摩爾助力OISA全向智感互聯(lián)IO芯粒技術(shù)白皮書發(fā)布

    提供商,奇異摩爾憑借其在芯粒領(lǐng)域的深厚技術(shù)積累與產(chǎn)業(yè)實(shí)踐,多方位貢獻(xiàn)于該白皮書的撰寫與關(guān)鍵技術(shù)路徑的梳理工作。
    的頭像 發(fā)表于 09-23 15:55 ?2072次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>助力OISA全向智感<b class='flag-5'>互聯(lián)</b>IO芯粒技術(shù)白皮書發(fā)布

    奇異摩爾攜手中國(guó)移動(dòng)發(fā)布OISA 2.0協(xié)議

    山西大同,在 2025中國(guó)算力大會(huì)主論壇上,中國(guó)移動(dòng)攜手包括奇異摩爾、燧原科技、壁韌科技、摩爾線程、昆侖芯、盛科通信、浪潮集團(tuán)等多家AI基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈領(lǐng)先企業(yè)啟動(dòng)智算開放互聯(lián)OISA生
    的頭像 發(fā)表于 08-27 15:08 ?3388次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>攜手中國(guó)移動(dòng)發(fā)布OISA 2.0協(xié)議

    奇異摩爾田陌晨榮獲中國(guó)半導(dǎo)體行業(yè)領(lǐng)軍人物獎(jiǎng)

    實(shí)力與發(fā)展成果。奇異摩爾創(chuàng)始人兼 CEO 田陌晨憑借在AI網(wǎng)絡(luò)互聯(lián)領(lǐng)域的創(chuàng)新成就,榮膺 “領(lǐng)軍人物獎(jiǎng)”。
    的頭像 發(fā)表于 07-08 17:04 ?1908次閱讀

    燧原科技國(guó)產(chǎn)集群通過中國(guó)信通院權(quán)威認(rèn)證

    近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱“中國(guó)信通院”)成功召開智算集群服務(wù)推進(jìn)方陣年中總交流會(huì)。會(huì)議期間,中國(guó)信通院重磅發(fā)布了首批《大規(guī)模智算集群服務(wù)成熟度》評(píng)估結(jié)果。燧原科技作為算力
    的頭像 發(fā)表于 07-04 16:50 ?1266次閱讀

    弘信電子旗下燧弘華創(chuàng)加入智算集群服務(wù)推進(jìn)方陣

    近日,中國(guó)信息通信研究院在北京召開智算集群服務(wù)推進(jìn)方陣(ICCPA)年中總結(jié)交流會(huì)。會(huì)上為第二批成員單位辦法證書,發(fā)布一系列產(chǎn)業(yè)研究成果,并通過深度交流研討,凝聚產(chǎn)業(yè)共識(shí),規(guī)范產(chǎn)品建設(shè)體系,搭建高效的交流平臺(tái),引領(lǐng)智算
    的頭像 發(fā)表于 07-03 15:43 ?913次閱讀

    奇異摩爾攜手UALink聯(lián)盟助力AI網(wǎng)絡(luò)繁榮發(fā)展

    隨著AI大模型訓(xùn)推集群的規(guī)模不斷擴(kuò)大,Scale-up網(wǎng)絡(luò)的重要性已不限于訓(xùn)練集群側(cè),云端推理集群對(duì)于多機(jī)之間組成超節(jié)點(diǎn)HBD方案的需求正在逐步增加。面對(duì)其對(duì)互聯(lián)性能的極致追求,目前業(yè)
    的頭像 發(fā)表于 04-12 14:42 ?2067次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>攜手UALink聯(lián)盟助力AI網(wǎng)絡(luò)繁榮發(fā)展

    奇異摩爾互聯(lián)之長(zhǎng)推進(jìn)OISA GPU互聯(lián)生態(tài)適配

    進(jìn)行了精彩的主題分享。 作為AI網(wǎng)絡(luò)特別組及網(wǎng)絡(luò)工作組的成員,奇異摩爾積極參與大會(huì),與業(yè)界同仁共同探討AI網(wǎng)絡(luò)互聯(lián)應(yīng)用的發(fā)展趨勢(shì)。 當(dāng)前,國(guó)內(nèi)外GPU
    的頭像 發(fā)表于 04-01 19:35 ?1805次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>以<b class='flag-5'>互聯(lián)</b>之長(zhǎng)推進(jìn)OISA GPU<b class='flag-5'>卡</b>間<b class='flag-5'>互聯(lián)</b>生態(tài)適配