91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Magnum IO用于云本機超級計算架構(gòu)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-15 14:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

超級計算機是一項重要的投資,但對于研究人員和科學(xué)家來說,它們是極其寶貴的工具。為了有效和安全地共享這些數(shù)據(jù)中心的計算能力, NVIDIA 引入了云本地超級計算架構(gòu)。它結(jié)合了裸機性能、多租戶和超級計算的性能隔離。

Magnum IO是數(shù)據(jù)中心的 I / O 子系統(tǒng),它引入了新的增強功能,以加速支持多租戶數(shù)據(jù)中心的 I / O 和通信。我們將這些增強功能稱為 Magnum IO ,用于云本機超級計算架構(gòu)。

它們由 NVIDIA Quantum-2 InfiniBand 平臺提供,該平臺包括 NVIDIA Quantum-2 交換機系列、BlueField-3 DPU 和 ConnectX-7 網(wǎng)絡(luò)適配器。

這種進(jìn)化環(huán)境的挑戰(zhàn)是什么?

基于 GPU 的高性能計算已經(jīng)通過機器學(xué)習(xí)模擬改變了科學(xué)并增強了實驗。運行這些深度學(xué)習(xí)框架和模擬工具的 GPU 會消耗數(shù) PB 的數(shù)據(jù),并在整個數(shù)據(jù)中心造成擁塞和瓶頸。使事情進(jìn)一步復(fù)雜化的是,這些應(yīng)用程序的多個實例在共享超級計算基礎(chǔ)設(shè)施中同時運行會對每個應(yīng)用程序的性能產(chǎn)生不利影響,從而導(dǎo)致無法預(yù)測的運行時間。

Magnum IO for Cloud 本機超級計算體系結(jié)構(gòu)具有新的和改進(jìn)的功能,以減輕在多租戶環(huán)境中運行對最終用戶性能的負(fù)面影響。它提供確定性的性能級別,就好像它們的應(yīng)用程序是網(wǎng)絡(luò)上唯一運行的應(yīng)用程序一樣。

第三代 NVIDIA SHARP (可擴(kuò)展分層聚合和縮減協(xié)議)

夏普技術(shù)通過消除端點之間多次發(fā)送數(shù)據(jù)的需要,將集合操作從主機 CPU 卸載到交換機網(wǎng)絡(luò),從而提高了 MPI 操作的性能。這種方法減少了到達(dá)聚合節(jié)點時通過網(wǎng)絡(luò)的數(shù)據(jù)量,并顯著減少了 MPI 操作時間。

在網(wǎng)絡(luò)中實現(xiàn)集體通信算法還有其他好處,例如釋放寶貴的 CPU 資源用于計算,而不是使用它們來處理通信。

圖 1 NVIDIA SHARP 聚合架構(gòu)框圖。

最近發(fā)布的 NVIDIA Quantum-2 InfiniBand 交換機為通過網(wǎng)絡(luò)的大型數(shù)據(jù)聚合提供了幾乎無限的可擴(kuò)展性。由于支持無限的小消息縮減和每個交換機的多個大消息縮減流,跨共享系統(tǒng)運行應(yīng)用程序的多個租戶現(xiàn)在可以充分利用 SHARP 的優(yōu)勢。

Watch the In-Network Computing with NVIDIA SHARP Video.

性能隔離

多租戶超級計算涉及許多在共享基礎(chǔ)設(shè)施上運行的用戶應(yīng)用程序,可能會重復(fù)使用物理服務(wù)器、存儲、網(wǎng)絡(luò)以及這些應(yīng)用程序生成的 I / O 流量模式。

NVIDIA Quantum InfiniBand 在檢測到網(wǎng)絡(luò)擁塞時管理網(wǎng)絡(luò)擁塞,并在源位置實施控制以減少網(wǎng)絡(luò)擁塞。但使用多租戶,用戶應(yīng)用程序可能不知道對相鄰應(yīng)用程序流量的任意干擾,因此需要隔離以提供預(yù)期的性能級別。

借助最新的 NVIDIA Quantum-2 InfiniBand 平臺和 Magnum IO ,創(chuàng)新的主動監(jiān)控和擁塞管理提供了所需的流量隔離。這幾乎消除了性能抖動,并確保了預(yù)期的預(yù)測性能,就像應(yīng)用程序在專用系統(tǒng)上運行一樣。

pYYBAGJZFsmAYudXAABgOQ0GTXg079.png

圖 2 性能隔離的好處。

專為安全、多租戶、裸機性能而打造

NVIDIA Cloud-Native Supercomputing體系結(jié)構(gòu)使用 Magnum IO 在多租戶環(huán)境中實現(xiàn)最高性能、安全性和編排。

poYBAGJZFtCAc_hCAAECd4tBFts823.png

圖 3 使用 DPU 遷移到云本機超級計算體系結(jié)構(gòu)。

此外,實現(xiàn)這種架構(gòu)轉(zhuǎn)換的另一個核心元素是數(shù)據(jù)處理單元( DPU ),也稱為 BlueField 。作為一個完全集成的片上數(shù)據(jù)中心平臺, BlueField 卸載和管理數(shù)據(jù)中心基礎(chǔ)設(shè)施,而不是主機處理器,實現(xiàn)超級計算機的安全和協(xié)調(diào)。它還能夠提供額外的通信框架卸載,產(chǎn)生 100% 的通信計算重疊,同時實現(xiàn) MPI _ Alltoall 44% 的性能提升和 MPI _ iAllgather 36% 的性能提升。當(dāng)結(jié)合 NVIDIA Quantum-2 的最新進(jìn)展時,該體系結(jié)構(gòu)在安全的多節(jié)點體系結(jié)構(gòu)中展示了裸機性能的性能隔離。

Magnum IO 消除了 I / O 瓶頸,并公開了硬件級加速引擎、網(wǎng)絡(luò)計算和擁塞控制方面的最新技術(shù),這些技術(shù)是支持當(dāng)今具有裸機性能的多租戶數(shù)據(jù)中心所必需的。

關(guān)于作者

Scot Schultz 是 HPC 技術(shù)專家,專注于人工智能和機器學(xué)習(xí)系統(tǒng)。 Scot 在分布式計算、操作系統(tǒng)、人工智能框架、高速互連和處理器技術(shù)方面擁有廣泛的知識。在他的整個職業(yè)生涯中,擁有超過 25 年的高性能計算系統(tǒng)經(jīng)驗,他的職責(zé)包括各種工程和領(lǐng)導(dǎo)角色,包括戰(zhàn)略 HPC 技術(shù)生態(tài)系統(tǒng)支持。 Scot 在眾多行業(yè)標(biāo)準(zhǔn)組織的成長和發(fā)展中發(fā)揮了重要作用。

Harry Petty 是一位經(jīng)驗豐富的數(shù)據(jù)中心營銷人員和技術(shù)專家,曾在大型科技公司擔(dān)任領(lǐng)導(dǎo)職務(wù),為混合云、存儲解決方案、網(wǎng)絡(luò)處理器和服務(wù)器產(chǎn)品線推廣 SDN 產(chǎn)品。他曾與許多客戶合作,在多個數(shù)據(jù)中心部署應(yīng)用程序。當(dāng) Harry 不討論 HPC 數(shù)據(jù)中心的 IO 子系統(tǒng)時,他喜歡在北加利福尼亞州附近的 Sierra 山麓和湖泊中進(jìn)行戶外活動。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5658

    瀏覽量

    75045
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50115

    瀏覽量

    265569
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136996
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    計算行業(yè)科普:從基礎(chǔ)概念到未來趨勢全解析

    支撐。本文將從基礎(chǔ)定義、核心架構(gòu)、發(fā)展歷程、產(chǎn)業(yè)鏈條、行業(yè)特征到未來趨勢,全方位拆解計算行業(yè),帶你讀懂這一數(shù)字時代的核心技術(shù)領(lǐng)域。一、計算
    的頭像 發(fā)表于 03-11 14:28 ?157次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>計算</b>行業(yè)科普:從基礎(chǔ)概念到未來趨勢全解析

    什么是企業(yè)服務(wù)器-計算

    企業(yè)服務(wù)器是指為企業(yè)提供的基于計算技術(shù)的服務(wù)器解決方案。華納是一家計算服務(wù)提供商,為企業(yè)
    的頭像 發(fā)表于 12-29 17:57 ?813次閱讀

    融合:創(chuàng)新計算架構(gòu)的全面解析與應(yīng)用

    在當(dāng)今數(shù)字化的時代,計算已經(jīng)成為推動企業(yè)創(chuàng)新和發(fā)展的關(guān)鍵技術(shù)。隨著企業(yè)需求的多樣化和技術(shù)環(huán)境的不斷變化,單一的計算模式已無法滿足企業(yè)對靈活性、可擴(kuò)展性以及智能化服務(wù)的需求。融合
    的頭像 發(fā)表于 12-23 14:17 ?349次閱讀

    探秘MAGNUM RF Ganged RF組件:SMPM至65 GHz的卓越設(shè)計

    探秘MAGNUM RF Ganged RF組件:SMPM至65 GHz的卓越設(shè)計 在電子工程領(lǐng)域,高頻組件的性能和可靠性至關(guān)重要。今天,我們就來深入了解一下MAGNUM RF Ganged RF組件
    的頭像 發(fā)表于 12-18 11:30 ?283次閱讀

    NVIDIA推出NVQLink高速互連架構(gòu)

    NVIDIA 推出 NVIDIA NVQLink,這是一種開放式系統(tǒng)架構(gòu),可將 GPU 計算的極致性能與量子處理器緊密結(jié)合,以構(gòu)建加速的量子超級計算機。
    的頭像 發(fā)表于 11-03 14:53 ?740次閱讀

    干貨分享 | TSMaster IO功能使用指南—基于同星帶IO設(shè)備的配置與操作步驟

    IO模塊是一種用于連接計算機系統(tǒng)或控制系統(tǒng)與外部設(shè)備之間的接口模塊。數(shù)字IO模塊用于處理二進(jìn)制信號的輸入和輸出,它們可以接收和發(fā)送數(shù)字信號,
    的頭像 發(fā)表于 08-09 20:04 ?1073次閱讀
    干貨分享 | TSMaster <b class='flag-5'>IO</b>功能使用指南—基于同星帶<b class='flag-5'>IO</b>設(shè)備的配置與操作步驟

    中國信通院發(fā)布“2025計算十大關(guān)鍵詞”

    、大模型工程化交付、大模型一體機、終端、智能混合、卓越架構(gòu)、央國企“+AI”、
    的頭像 發(fā)表于 07-30 10:53 ?3194次閱讀
    中國信通院發(fā)布“2025<b class='flag-5'>云</b><b class='flag-5'>計算</b>十大關(guān)鍵詞”

    曙光率先發(fā)布交通智能體參考架構(gòu)

    當(dāng)前,交通基礎(chǔ)設(shè)施數(shù)字化轉(zhuǎn)型正成為我國交通強國戰(zhàn)略的重要落地路徑。面對交通行業(yè)的新變化和長期存在的老問題,曙光率先發(fā)布“交通智能體”參考架構(gòu),即以為基礎(chǔ)、以AI為核心、以可信計算
    的頭像 發(fā)表于 06-30 13:46 ?846次閱讀

    NVIDIA驅(qū)動的現(xiàn)代超級計算機如何突破速度極限并推動科學(xué)發(fā)展

    ,研究人員用個人電腦構(gòu)建了強大的集群,甚至改造游戲顯卡,把它們用于科學(xué)研究。 當(dāng)今的高性能計算系統(tǒng)專為高速計算而設(shè)計,其中許多都采用了 NVIDIA 加速計算技術(shù)。在 ISC 2025
    的頭像 發(fā)表于 06-26 19:39 ?1275次閱讀
    NVIDIA驅(qū)動的現(xiàn)代<b class='flag-5'>超級</b><b class='flag-5'>計算</b>機如何突破速度極限并推動科學(xué)發(fā)展

    Blue Lion超級計算機將在NVIDIA Vera Rubin上運行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機 Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計算機提升了約 30 倍。這臺新的超級
    的頭像 發(fā)表于 06-12 15:39 ?1164次閱讀

    NVIDIA技術(shù)賦能歐洲最快超級計算機JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計算機成為歐洲最快超級計算機,其運行 HPC 和 AI 工作負(fù)載的速度是第二名的兩倍以上。
    的頭像 發(fā)表于 06-12 15:33 ?1444次閱讀

    Arm架構(gòu)何以成為現(xiàn)代計算的基礎(chǔ)

    2025 年 4 月,Arm 架構(gòu)迎來了問世 40 周年。這個始于英國劍橋一隅、懷揣雄心壯志的項目,如今已成為全球廣泛采用的計算架構(gòu)。從傳感器、智能手機、筆記本電腦,到汽車、數(shù)據(jù)中心等諸多領(lǐng)域,有數(shù)十億設(shè)備如今運行在 Arm
    的頭像 發(fā)表于 05-20 10:02 ?1212次閱讀

    EM儲能網(wǎng)關(guān) ZWS智慧儲能應(yīng)用(11) — 一級架構(gòu) 主從架構(gòu)

    ZWS智慧儲能針對儲能場景下不同的架構(gòu)體系進(jìn)行了兼容,可以適配用戶面臨的復(fù)雜現(xiàn)場環(huán)境,滿足更深層次的管理和維護(hù)需求。簡介儲能系統(tǒng)包含PCS、BMS、EMS等多個組件,不同儲能架構(gòu)管理和決策方式也有
    的頭像 發(fā)表于 04-17 13:00 ?779次閱讀
    EM儲能網(wǎng)關(guān) ZWS智慧儲能<b class='flag-5'>云</b>應(yīng)用(11) — 一級<b class='flag-5'>架構(gòu)</b> 主從<b class='flag-5'>架構(gòu)</b>

    IO數(shù)據(jù)采集物聯(lián)網(wǎng)平臺是什么?有什么功能?

    IO數(shù)據(jù)采集物聯(lián)網(wǎng)平臺是一種專門用于采集、處理、分析和管理來自各種物聯(lián)網(wǎng)設(shè)備的輸入輸出(IO)數(shù)據(jù)的軟件平臺。以下是對其功能、架構(gòu)、應(yīng)用的詳細(xì)介紹: 主要功能 數(shù)據(jù)采集:支持多種通信協(xié)
    的頭像 發(fā)表于 04-10 09:22 ?914次閱讀

    超級計算與 HPC 之間的界限日趨模糊

    本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自semiengineering由于人工智能和分解而加速的性能改進(jìn)正在推動計算前沿的重大變革。由于人工智能的普及,超級計算機和高性能計算
    的頭像 發(fā)表于 03-17 10:33 ?1039次閱讀
    <b class='flag-5'>超級</b><b class='flag-5'>計算</b>與 HPC 之間的界限日趨模糊