91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

應(yīng)用NVIDIA Spectrum-X網(wǎng)絡(luò)構(gòu)建新型主權(quán)AI云

NVIDIA英偉達(dá) ? 來源: NVIDIA英偉達(dá) ? 2024-07-26 18:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

法國云服務(wù)提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPUSpectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺構(gòu)建區(qū)域性 GPU 集群,為用戶提供 AI 按需服務(wù)業(yè)務(wù)。

Scaleway 是法國的一家擁有高性能基礎(chǔ)設(shè)施的云服務(wù)提供商,創(chuàng)立于 1999 年,擁有 80+ 云產(chǎn)品及服務(wù),為全球 25,000+ 客戶提供云服務(wù),客戶包括 Mistral AI、Aternos、Hugging Face、Golem.ai 等。Scaleway 提供一站式的云服務(wù),以開發(fā)創(chuàng)新解決方案并幫助用戶從零開始構(gòu)建和擴(kuò)展 AI 項目,目前 Scaleway 正在構(gòu)建區(qū)域 AI 云,提供 GPU 基礎(chǔ)設(shè)施,用于大規(guī)模的 AI 模型訓(xùn)練、推理及部署。

客戶挑戰(zhàn)

云 AI 工作負(fù)載需求正以前所未有的速度增長,同時生成式 AI 應(yīng)用也在激增。為滿足客戶部署生成式 AI 應(yīng)用程序、訓(xùn)練基礎(chǔ) AI 大模型的需求,云服務(wù)提供商面臨巨大挑戰(zhàn),需要構(gòu)建 AI 云,使用加速計算技術(shù)和高性能網(wǎng)絡(luò)來支持 AI 業(yè)務(wù)。

Scaleway 的核心需求包括:

對于分布式 AI 訓(xùn)練任務(wù),單個任務(wù)的訓(xùn)練時間由最慢的計算節(jié)點(diǎn)的運(yùn)行時間決定,這使得尾部延遲至關(guān)重要。AI 云需要一個高吞吐、低延遲、低抖動、易擴(kuò)展的高性能網(wǎng)絡(luò),來確保 GPU 間快速、高效的通信,尤其是在大規(guī)模部署的場景下。

在多個 AI 任務(wù)同時運(yùn)行的多租戶環(huán)境中,性能隔離對于保護(hù)一個租戶的 AI 任務(wù)免受其他租戶業(yè)務(wù)的影響是必不可少的。由此提出了對多租戶多任務(wù)場景下性能隔離的需求。

對于復(fù)雜的 AI 云環(huán)境,需要專門適用于 AI 網(wǎng)絡(luò)的監(jiān)控管理工具,提供細(xì)粒度的網(wǎng)絡(luò)可視化功能、同時具備網(wǎng)絡(luò)監(jiān)控和故障定位能力。

為實(shí)現(xiàn) AI 云數(shù)據(jù)中心的高效、快速部署,需要強(qiáng)大的網(wǎng)絡(luò)仿真及自動化平臺。

隨著云上用戶、數(shù)據(jù)、應(yīng)用的快速增長,網(wǎng)絡(luò)安全威脅不容忽視,需要提供私有的、安全的零信任基礎(chǔ)設(shè)施,保障用戶的業(yè)務(wù)安全。

解決方案

Scaleway 采用了 NVIDIA 的 Hopper GPU 和 Spectrum-X 網(wǎng)絡(luò)平臺應(yīng)對以上挑戰(zhàn)。

Scaleway 將 HGX Hopper GPU 服務(wù)器加入其 GPU 集群陣容中,以覆蓋廣泛的計算需求,利用 GPU 的速度和效率加速 AI 分布式工作負(fù)載。

對于 Scale-Out AI 網(wǎng)絡(luò),Scaleway 采用了基于 BlueField-3 SuperNICSpectrum SN5600 交換機(jī)構(gòu)建的 Spectrum-X 網(wǎng)絡(luò)平臺。NVIDIA 的 Spectrum-X 網(wǎng)絡(luò)平臺是全球首個專為 AI 構(gòu)建的以太網(wǎng)端到端解決方案,與傳統(tǒng)以太網(wǎng)相比,其生成式 AI 訓(xùn)練的網(wǎng)絡(luò)通信效率提高了 1.6 倍。

同時 Spectrum-X 部署將利用以下網(wǎng)絡(luò)軟件堆棧:

NVIDIA Air 用于 AI 網(wǎng)絡(luò)仿真,NVIDIA Air 是一個云托管的數(shù)據(jù)中心網(wǎng)絡(luò)仿真平臺,其行為類似于真實(shí)世界的生產(chǎn)環(huán)境。使用 NVIDIA Air 創(chuàng)建數(shù)據(jù)中心的數(shù)字孿生,可以驗(yàn)證網(wǎng)絡(luò)配置、網(wǎng)絡(luò)功能以及自動化部署代碼,提升數(shù)據(jù)中心的部署效率。

NetQ 用于 AI 網(wǎng)絡(luò)監(jiān)控,通過高頻遙測技術(shù)監(jiān)控 AI 工作負(fù)載,NetQ 提供有關(guān)數(shù)據(jù)中心運(yùn)行狀況的數(shù)據(jù)和統(tǒng)計信息,關(guān)聯(lián)配置和運(yùn)行狀態(tài),并跟蹤狀態(tài)變化?;谶b測信息,NetQ 提供動態(tài)路由監(jiān)控,RoCE 流量計數(shù)器,交換機(jī)隊列直方圖等功能,以識別和應(yīng)對網(wǎng)絡(luò)微突發(fā)、擁塞場景,方便網(wǎng)絡(luò)故障定位。

Cumulus Linux 用于軟件驅(qū)動的數(shù)據(jù)中心網(wǎng)絡(luò)自動化,Cumulus Linux 是創(chuàng)新的開放網(wǎng)絡(luò)操作系統(tǒng),支持 BGP/OSPF 路由協(xié)議,以太網(wǎng)虛擬專用網(wǎng)絡(luò) EVPN,虛擬路由和轉(zhuǎn)發(fā)。

DOCA SDK 和庫用于增強(qiáng) BlueField-3 SuperNIC 性能,DOCA SDK 提供行業(yè)標(biāo)準(zhǔn)的開放 API 和軟件框架,包括針對 RDMA、網(wǎng)絡(luò)、安全、存儲、數(shù)據(jù)路徑加速的 SDK,幫助開發(fā)者快速創(chuàng)建軟件定義、SuperNIC 加速的服務(wù)。

使用的 NVIDIA 產(chǎn)品

硬件:

NVIDIA HGX Hopper 服務(wù)器

NVIDIA Spectrum-4 SN5600 以太網(wǎng)交換機(jī)

NVIDIA BlueField-3 B3140H SuperNICs

軟件:

Cumulus Linux 網(wǎng)絡(luò)操作系統(tǒng)

NetQ 監(jiān)控管理平臺

NVIDIA Air 仿真平臺

DOCA SDK

實(shí)際效果

采用 NVIDIA 的整體解決方案后,極大地提升了 AI 計算能力,縮短了 AI 訓(xùn)練時間,同時加速了 AI 解決方案的開發(fā)、部署和上市時間,有效提高了投資回報率。

Scaleway 客戶可以從幾個 GPU 擴(kuò)展到幾千個 GPU,以適應(yīng)任何 AI 用例

Spectrum-X 提供多租戶、多任務(wù)的 AI 環(huán)境所需的高性能和安全性, 借助動態(tài)路由、擁塞控制、全局共享緩沖區(qū)等多種機(jī)制,實(shí)現(xiàn)了多任務(wù)的性能隔離。

NetQ 提供對 AI 網(wǎng)絡(luò)健康狀況的深度可視性,具有 RoCE 流量計數(shù)器、事件和 WJH(What Just Happened)警報等豐富的儀表板,實(shí)現(xiàn) AI 網(wǎng)絡(luò)可視化、故障排除和驗(yàn)證功能。

NVIDIA Air 和 Cumulus Linux 支持 API 原生網(wǎng)絡(luò)環(huán)境,該環(huán)境可集成到 DevOps 工具鏈中,實(shí)現(xiàn)了第 0 天、第 1 天 和第 2 天操作的無縫銜接。

NVIDIA 網(wǎng)絡(luò)高級副總裁 Gilad Shainer 表示:

“生成式 AI 等開創(chuàng)性技術(shù)的飛速發(fā)展,使每家企業(yè)都必須把網(wǎng)絡(luò)創(chuàng)新放在第一位,從而獲得競爭優(yōu)勢。NVIDIA Spectrum-X 是對以太網(wǎng)絡(luò)的一次革命,讓企業(yè)能夠充分利用其 AI 基礎(chǔ)設(shè)施的強(qiáng)大力量來改變其運(yùn)營方式,甚至顛覆他們的行業(yè)?!?/p>

Scaleway 首席執(zhí)行官 Damien Lucas 表示:

“NVIDIA Spectrum-X 網(wǎng)絡(luò)技術(shù)為我們的‘GPU 集群按需服務(wù)’提供了更快的網(wǎng)絡(luò)連接和更高效的 GPU 通信,使我們的客戶能夠加速開發(fā)和部署他們的 AI 解決方案?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5602

    瀏覽量

    109833
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39980

    瀏覽量

    301612
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99270

原文標(biāo)題:應(yīng)用 NVIDIA Spectrum-X 網(wǎng)絡(luò)構(gòu)建新型主權(quán) AI 云

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA攜手合作伙伴基于AI-RAN平臺構(gòu)建未來AI原生無線網(wǎng)絡(luò)

    實(shí)地試驗(yàn)、新的性能基準(zhǔn)測試、日益增長的運(yùn)營商采納率,以及合作伙伴基于 NVIDIA 平臺構(gòu)建的創(chuàng)新成果,共同印證了行業(yè)正加速邁向 AI 原生 5G 與 6G 網(wǎng)絡(luò)。
    的頭像 發(fā)表于 03-09 16:36 ?825次閱讀

    NVIDIA Spectrum-X以太網(wǎng)硅光技術(shù)助力AI工廠網(wǎng)絡(luò)創(chuàng)新

    NVIDIA 將率先為 AI 工廠引入采用光電一體封裝 (CPO) 的優(yōu)化以太網(wǎng)網(wǎng)絡(luò),通過 NVIDIA Spectrum-X 以太網(wǎng)硅光
    的頭像 發(fā)表于 01-14 09:06 ?642次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum-X</b>以太網(wǎng)硅光技術(shù)助力<b class='flag-5'>AI</b>工廠<b class='flag-5'>網(wǎng)絡(luò)</b>創(chuàng)新

    NVIDIA擴(kuò)大與微軟合作推動AI超級工廠建設(shè)

    在 Microsoft Ignite 大會上,NVIDIA 擴(kuò)大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅(qū)動的全新 Microsoft Fairwater AI 超級工廠中部署新一代
    的頭像 發(fā)表于 12-01 09:52 ?809次閱讀

    NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    Facebook 開放交換系統(tǒng)平臺。 Oracle 采用 Spectrum-X 以太網(wǎng)交換機(jī)構(gòu)建十億瓦級(Giga-Scale)AI 超級計算機(jī)。 NVIDIA 宣布 Meta 和
    的頭像 發(fā)表于 10-14 10:26 ?1846次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum-X</b> 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle 加速<b class='flag-5'>網(wǎng)絡(luò)</b>性能

    NVIDIA AI網(wǎng)絡(luò)閃耀2025云棲大會

    2025 云棲大會于 9 月 24 日至 9 月 26 日舉辦,NVIDIA 作為大會巔峰合作伙伴參與 2025 云棲大會。本文將帶您回顧 NVIDIA AI 網(wǎng)絡(luò)在本屆云棲大會上的精
    的頭像 發(fā)表于 10-13 11:19 ?1208次閱讀

    NVIDIA在Hot Chips 2025大會展示創(chuàng)新技術(shù)

    本周在加利福尼亞州帕洛阿爾托(Palo Alto)舉行的 Hot Chips 大會上,NVIDIA 專家詳細(xì)介紹了 NVIDIA NVLink 和Spectrum-X 以太網(wǎng)技術(shù)、Blackwell 以及 CUDA 如何為全球數(shù)
    的頭像 發(fā)表于 08-27 12:52 ?1938次閱讀

    NVIDIA推出Spectrum-XGS以太網(wǎng)技術(shù)

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太網(wǎng)。這項跨區(qū)域擴(kuò)展(scale-across)技術(shù)可將多個分布式數(shù)據(jù)中心組合成一個十億瓦級 AI 超級工廠。
    的頭像 發(fā)表于 08-27 12:51 ?1350次閱讀

    NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體

    AI Factory 的經(jīng)驗(yàn)證設(shè)計將加速基礎(chǔ)設(shè)施與軟件(包括全新 NVIDIA NIM 微服務(wù)和經(jīng)擴(kuò)展的 NVIDIA Blueprint)相結(jié)合,為各國和企業(yè)簡化了全棧式 AI 開發(fā)
    的頭像 發(fā)表于 06-16 14:28 ?1362次閱讀

    歐洲聯(lián)手NVIDIA打造AI基礎(chǔ)設(shè)施

    NVIDIA 于近日宣布,其正在攜手歐洲各國、科技和行業(yè)領(lǐng)導(dǎo)者,共同建造 NVIDIA Blackwell AI 基礎(chǔ)設(shè)施,以強(qiáng)化數(shù)字主權(quán)、支撐經(jīng)濟(jì)增長,并推動歐洲大陸成為
    的頭像 發(fā)表于 06-16 14:25 ?1451次閱讀

    NVIDIA計劃打造全球首個工業(yè)AI平臺

    NVIDIA 宣布,其正在為歐洲制造商構(gòu)建全球首個工業(yè) AI 。這家總部位于德國的 AI 工廠將配備 1 萬個 GPU,包括通過
    的頭像 發(fā)表于 06-16 14:17 ?1451次閱讀

    歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語言模型

    NVIDIA 正攜手歐洲和中東的模型構(gòu)建商與提供商,共同優(yōu)化主權(quán)大語言模型 (LLM),加速該地區(qū)各行業(yè)采用企業(yè)級 AI。
    的頭像 發(fā)表于 06-12 15:42 ?1210次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強(qiáng)大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?1309次閱讀

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA與行業(yè)領(lǐng)先存儲企業(yè)共同推出面向AI時代的新型企業(yè)基礎(chǔ)設(shè)施

    存儲提供商構(gòu)建搭載 AI 查詢智能體的基礎(chǔ)設(shè)施,利用 NVIDIA 計算、網(wǎng)絡(luò)和軟件,針對復(fù)雜查詢進(jìn)行推理并快速生成準(zhǔn)確響應(yīng) NVIDIA
    的頭像 發(fā)表于 03-21 09:42 ?1352次閱讀

    NVIDIA推出全新硅光網(wǎng)絡(luò)交換機(jī)

    NVIDIA 今天推出了 NVIDIA Spectrum-XNVIDIA Quantum-X 硅光
    的頭像 發(fā)表于 03-20 14:52 ?1014次閱讀

    NVIDIA 與行業(yè)領(lǐng)先的存儲企業(yè)共同推出面向 AI 時代的新型企業(yè)基礎(chǔ)設(shè)施

    存儲提供商構(gòu)建搭載 AI 查詢智能體的基礎(chǔ)設(shè)施,利用 NVIDIA 計算、網(wǎng)絡(luò)和軟件,針對復(fù)雜查詢進(jìn)行推理并快速生成準(zhǔn)確響應(yīng) ? 美國加利福尼亞州圣何塞 —— GTC —— 太平洋時間
    發(fā)表于 03-19 10:11 ?501次閱讀
    <b class='flag-5'>NVIDIA</b> 與行業(yè)領(lǐng)先的存儲企業(yè)共同推出面向 <b class='flag-5'>AI</b> 時代的<b class='flag-5'>新型</b>企業(yè)基礎(chǔ)設(shè)施