91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)Quantum-2 Infiniband平臺技術(shù)

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-07-18 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著大數(shù)據(jù)和人工智能等技術(shù)的快速發(fā)展,高性能計算需求日益增長。英偉達(dá)Quantum-2 Infiniband平臺應(yīng)運(yùn)而生,為用戶提供高速、低延遲的數(shù)據(jù)傳輸和處理能力,實現(xiàn)卓越的分布式計算性能。

Quantum-2采用最新一代NVIDIA Mellanox HDR 200Gb/s Infiniband網(wǎng)絡(luò)適配器,支持高速數(shù)據(jù)傳輸和低延遲計算。結(jié)合NVIDIA GPU,實現(xiàn)加速計算和分布式存儲,提高計算效率和資源利用率。

b8ce0c4e-24fa-11ee-962d-dac502259ad0.png

此外,Quantum-2還支持多種先進(jìn)技術(shù),如NVIDIA RDMA、NVLink和Multi-host等,實現(xiàn)數(shù)據(jù)中心范圍內(nèi)的高效數(shù)據(jù)傳輸和資源共享。用戶可根據(jù)實際需求,搭建高性能計算集群或分布式存儲系統(tǒng),為大數(shù)據(jù)分析、人工智能、科學(xué)計算等領(lǐng)域提供強(qiáng)大支持。

Q:CX7 NDR 200 QSFP112能否兼容HDR/EDR線纜?

A:可以

b8f0d01c-24fa-11ee-962d-dac502259ad0.png

Q:CX7 NDR能否支持CR8模塊?

A:CX7 NDR用Nvidia SR4多模或者DR4單模規(guī)格的模塊,IB交換機(jī)側(cè)使用SR8或者DR8模塊。Q:CX7 Dual-port 400G能否bonding后達(dá)到800G,為啥200G bonding后能疊加達(dá)到400G?

A:目前CX7并沒有雙口400G配置,網(wǎng)絡(luò)總性能由PCle帶寬/網(wǎng)卡處理能力/網(wǎng)口物理帶寬的瓶頸決定,PCle帶寬上限為512G,網(wǎng)卡處理能力》400G,故雙口200G bond可達(dá)到400G帶寬。

Q:一分二線纜怎么連接

A:Al訓(xùn)練場景需配合NCCLSHARP通信環(huán)連接SU內(nèi)不同節(jié)點的網(wǎng)卡。

Q:哪些卡是IB/ETH雙模的,IB/ETH雙模怎么切換

A:mlxconfig -d mlx5_x s LINK_TYPE_P1=1(Or 2)

b913e0b6-24fa-11ee-962d-dac502259ad0.png

Q: Superpod組網(wǎng)里,假如我每臺服務(wù)器上配置4個NDR200的卡,那我能直接用一個一分四的線纜直接連接到同一個交換機(jī)上嗎?還是說得用2根一分二的分別連不同的交換機(jī)?

A:不推薦,這種連接方式不符合SuperPoD組網(wǎng)規(guī)則,考慮到NCCL/SHARP性能,需要Leaf層交換機(jī)分別使用一分四線纜連接SU內(nèi)不同服務(wù)器的NDR200端口,形成不同的通信環(huán)。

Q:Super Pod組網(wǎng)中,如果最后一個SU中,節(jié)點的數(shù)量不足32臺,比如只有16臺,那最后一個SU的Leaf交換機(jī)可以只用4臺嗎?這樣會出現(xiàn)同一個節(jié)點的兩個網(wǎng)卡接入到一個leaf交換機(jī)上,SHARP樹會不會有問題?

A:可以但不推薦,NDR交換機(jī)可以支持64 SAT(SHARP Aggregation Tree)。

Q.NDR交換機(jī)上的同一個模塊,一個口插NDR線纜,另一個口插NDR 200的一分二線纜嗎?

A:可以,需要交換機(jī)側(cè)做NDR口的端口分拆配置。

Q.有一個關(guān)于最新superpod組網(wǎng)的問題想咨詢您一下,我看到最新的superpod組網(wǎng)白皮書是計算網(wǎng)絡(luò)中單獨配置2臺IB交換機(jī)組UFM軟件的網(wǎng)絡(luò),但是這樣就導(dǎo)致了我集群會減少一臺GPU節(jié)點。如果我不單獨配置UFM交換機(jī),只在管理節(jié)點部署UFM軟件,在不占用計算網(wǎng)絡(luò)的情況下通過另一套存儲網(wǎng)絡(luò)管理集群是否可以呢?

A:建議配置UFM設(shè)備(含軟件),計算網(wǎng)內(nèi)的管理節(jié)點部署UFM軟件是可選方案,但該節(jié)點不應(yīng)該承擔(dān)GPU計算業(yè)務(wù)負(fù)載。 存儲網(wǎng)絡(luò)是單獨組網(wǎng)的,是不同的網(wǎng)絡(luò)平面,無法管理計算集群。

Q: UFM Enterprise,SDN, Telemetry, Cyber-Al有什么區(qū)別?是不是必須買UFM?

A:可使用OFED自帶的opensm和命令腳本工具進(jìn)行簡單的管理和監(jiān)控,但是不具備UFM友好的可視化界面,功能也少了很多。

b938665c-24fa-11ee-962d-dac502259ad0.png

Q:交換機(jī)的子網(wǎng)管理器,OFED的子網(wǎng)管理器,UFM,三個管理節(jié)點的數(shù)目是否有差異?客戶部署時選擇哪個比較合適?

A:管理交換機(jī)適合2K節(jié)點內(nèi)的管理,UFM和OFED的openSM節(jié)點管理能力無限制,需要配合管理節(jié)點的CPU以及硬件處理能力。

Q: DAC ACC AOC Transceiver的區(qū)別,每種的限制。

A:連接距離,布線的難易程度如下圖。

b94b3f48-24fa-11ee-962d-dac502259ad0.png

Q: 交換機(jī) 64 個 400Gb port, 為什么是 32 個 QSFP56 端口

A: 尺寸和功耗,2U 面板只能 32 cage;這是 OSPF 接口,支持兩個 400G ports,NDR 交換機(jī)要把 cage 和 port 的概念區(qū)分清楚。

Q: 請問兩端的模塊不同,可以通過線纜鏈接起來打通數(shù)據(jù)嗎?比如服務(wù)器這邊是 OSFP,交換機(jī)是 QSFP112

A: IB 必須用我們的 module 和 cable,現(xiàn)在主要介紹 IB,IB 交換機(jī)只有是 OSFP;兩側(cè)的模塊都要使用 NVIDIA 的推薦模塊,可以支持

Q: UFM 可以用來監(jiān)控 RoCE 網(wǎng)絡(luò)嗎

A: 不可以,只支持 IB

Q: UFM 跟有管理性 Switch 和非管性 switch, 功能性是否一樣

A: 一樣

Q: IB 線纜在不影響傳輸帶寬時延的前提下,最大支持多遠(yuǎn)的傳輸距離

A: 模塊+cable,最遠(yuǎn) 500m,多模;DAC 銅纜 3m 以下,ACC 5m

Q: CX7 網(wǎng)卡開以太模式可以與其他家的 400G 支持 RDMA 的以太網(wǎng)交換機(jī)互聯(lián)嗎

A: 400G ethernet 互聯(lián)可以,RDMA 是 RoCE,可以在這種情況下跑,性能沒有保證;400G 以太網(wǎng)建議使用 BF3+Spectrum-4 組成的 Spectrum-X 平臺

Q: NDR 兼容 HDR、EDR 的話,這種線纜和模塊只有一體的嗎?

A: 是的,沒有分體的方案

Q: OSFP 網(wǎng)卡側(cè)的模塊應(yīng)該是用的 flat 的吧?

A: 是的,網(wǎng)卡用 flat

Q: IB 卡開以太模式是不支持 RDMA 的嗎?

A: 可以跑 RoCE,就是 RDMA over Ethernet,推薦用 Nvidia Spectrum-X solution

Q: BF3 現(xiàn)在量產(chǎn)了嗎

A: 根據(jù) OPN 不同,量產(chǎn)時間不同,具體跟負(fù)責(zé) SA 聯(lián)系,提供你需要的 OPN

Q: 為什么 NDR 的光纜是分開的,沒有像 HDR 一樣的那種 AOC 線纜呢

A: 混雜了單多模,風(fēng)水冷,不同長度這些因素,AOC 一體的方案會非常復(fù)雜,部署也不靈活

Q: 請問 400G 的 IB 和 400G 的以太,除了光模塊不一樣,線纜是一樣的嗎

A: 光纜是相同的,注意是 APC 帶 8 度斜角的類型

Q: CX7 網(wǎng)卡延時性能有具體要求么?在滿內(nèi)存,已綁核等最優(yōu)調(diào)試環(huán)境下對于網(wǎng)絡(luò)延時要求是?小于多少 us 算合適?

A: 這個跟測試機(jī)器的主頻,配置都有關(guān)系,還跟測試用 perftest, mpi 工具都有關(guān)系,建議你聯(lián)系負(fù)責(zé) SA,給你提供具體支持

Q: OSFP 網(wǎng)卡側(cè)的模塊應(yīng)該是用的 OSFP-flat 的吧?為啥會說用的是 OSFP-Riding Heatsink 的呢?

A: riding heatsink 指的是在 cage 上有個散熱器

b97a682c-24fa-11ee-962d-dac502259ad0.png

Q: 這個集群方案里 ufm 的部分在哪里呢?想了解下這部分的作用

A: UFM 單獨跑在 server 上,可以當(dāng)做一個 node,可以 HA 接兩臺。 但不建議跑 UFM 的node 同時跑計算業(yè)務(wù)

Q: 集群規(guī)模多大的時候,建議推薦 UFM 呢?

A: IB 網(wǎng)絡(luò)都建議配置,UFM 不只是 opensm,還有其他非常強(qiáng)大的管理和接口功能

A: 只要客戶有網(wǎng)管需求,建議都配置 UFM

Q: PCIe 5 是否只有 512G 嗎?PCIe4 是多少

A: Gen5 32G*16=512G, Gen 4 16G*16=256G

Q: IB 卡有單工或者雙工說法么

A: 都是雙工;單工或者雙工對于當(dāng)前的設(shè)備來講,只是概念而已 因為收和發(fā)物理通道已經(jīng)分離了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50116

    瀏覽量

    265591
  • 網(wǎng)絡(luò)適配器

    關(guān)注

    0

    文章

    43

    瀏覽量

    12049
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99251
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9066

    瀏覽量

    143815

原文標(biāo)題:英偉達(dá)Quantum-2 Infiniband平臺技術(shù)A&Q

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    企業(yè)級AI Agent王炸! 英偉達(dá)GTC將開源 NemoClaw

    消息人士透露,英偉達(dá)計劃在下周在美國圣荷西舉行的年度開發(fā)者大會前后正式公布 NemoClaw。據(jù)知情人士向 WIRED 透露,該平臺允許企業(yè)部署 AI 代理為內(nèi)部團(tuán)隊執(zhí)行任務(wù),且不限于使用英偉
    的頭像 發(fā)表于 03-10 11:35 ?7445次閱讀
    企業(yè)級AI Agent王炸! <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GTC將開源 NemoClaw

    羅德與施瓦茨攜手英偉達(dá)推進(jìn)基于數(shù)字孿生技術(shù)的AI-RAN測試

    羅德與施瓦茨(以下簡稱“R&S”)與英偉達(dá)持續(xù)深化合作,共同推動面向5G-Advanced與6G的AI-RAN技術(shù)創(chuàng)新。雙方將于2026年巴塞羅那世界移動通信大會(以下簡稱“MWC 2026
    的頭像 發(fā)表于 03-03 13:45 ?400次閱讀
    羅德與施瓦茨攜手<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>推進(jìn)基于數(shù)字孿生<b class='flag-5'>技術(shù)</b>的AI-RAN測試

    英偉達(dá)Rubin平臺引入微通道冷板技術(shù),100%全液冷設(shè)計

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)英偉達(dá)在近期舉辦的 CES 2026 展會上,正式推出了其全新的 Vera Rubin 計算平臺。作為繼 Blackwell 架構(gòu)之后的又一力作,Rubin 平臺
    的頭像 發(fā)表于 01-19 07:15 ?1.1w次閱讀

    麥格納宣布擴(kuò)大與英偉達(dá)的戰(zhàn)略合作

    麥格納宣布擴(kuò)大與英偉達(dá)的戰(zhàn)略合作,為整車廠基于英偉達(dá)DRIVE Hyperion平臺的項目落地提供支持。
    的頭像 發(fā)表于 01-09 12:59 ?375次閱讀

    英偉達(dá)重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆收購。但
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!AI 推理存儲全面覺醒

    NVIDIA新聞:英偉達(dá)10億美元入股諾基亞 英偉達(dá)推出全新量子設(shè)備

    研發(fā)并推出相關(guān)產(chǎn)品。 英偉達(dá)CEO黃仁勛出現(xiàn)在美國華盛頓的GTC DC大會上的演講中表示;“今天我們宣布與諾基亞建立了合作關(guān)系,諾基亞是世界第二大電信制造商,這是一個價值3萬億美元的產(chǎn)業(yè)。”黃仁勛說,全世界有數(shù)百萬個基站,雙方合作將能在新
    的頭像 發(fā)表于 10-29 17:12 ?1733次閱讀

    英偉達(dá)發(fā)布 NVQLink 開放系統(tǒng)架構(gòu);國內(nèi)首個汽車芯片標(biāo)準(zhǔn)驗證平臺投入使用

    英偉達(dá)發(fā)布 NVQLink 開放系統(tǒng)架構(gòu) 在華盛頓特區(qū)舉行的英偉達(dá)全球技術(shù)大會上,英偉
    發(fā)表于 10-29 10:33 ?1229次閱讀

    英偉達(dá)力挺SOCAMM2,國產(chǎn)存儲廠商緊密跟進(jìn)

    SOCAMM 內(nèi)存模塊,但據(jù)稱隨后發(fā)現(xiàn)了技術(shù)問題,項目兩次擱置,并未能下達(dá)任何實際的大規(guī)模訂單。目前開發(fā)重點已經(jīng)轉(zhuǎn)移到SOCAMM 2,英偉達(dá)已開始與三星電子、SK 海力士和美光合作對
    發(fā)表于 09-21 02:32 ?1941次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>力挺SOCAMM<b class='flag-5'>2</b>,國產(chǎn)存儲廠商緊密跟進(jìn)

    國家網(wǎng)信辦約談英偉達(dá)

    近日,英偉達(dá)算力芯片被曝出存在嚴(yán)重安全問題。此前,美議員呼吁要求美出口的先進(jìn)芯片必須配備“追蹤定位”功能。美人工智能領(lǐng)域?qū)<彝嘎叮?b class='flag-5'>英偉達(dá)算力芯片“追蹤定位”“遠(yuǎn)程關(guān)閉”
    的頭像 發(fā)表于 07-31 13:56 ?2726次閱讀
    國家網(wǎng)信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>

    從游戲到智能駕駛,英偉達(dá)有哪些技術(shù)升級?

    [首發(fā)于智駕最前沿微信公眾號]在2025年國際消費電子展(CES 2025)上,英偉達(dá)重磅發(fā)布了其最新一代車規(guī)級自動駕駛芯片“Thor”,并同步展示了在智能汽車領(lǐng)域的技術(shù)進(jìn)展與合作布局。英偉
    的頭像 發(fā)表于 05-16 09:02 ?1007次閱讀
    從游戲到智能駕駛,<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>有哪些<b class='flag-5'>技術(shù)</b>升級?

    盤點#機(jī)器人開發(fā)平臺

    圖,電子技術(shù)資料網(wǎng)站具身智能機(jī)器人****開發(fā)平臺——Fibot廣和通發(fā)布機(jī)器人開發(fā)平臺-電子發(fā)燒友網(wǎng)NVIDIA Isaac 英偉達(dá)綜合性
    發(fā)表于 05-13 15:02

    IBM攜手英偉達(dá)AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉達(dá)(納斯達(dá)克股票代碼:NVDA)開展全新合作,雙方將基于英偉達(dá) AI 數(shù)據(jù)平臺參考架構(gòu)(re
    發(fā)表于 03-24 19:20 ?520次閱讀

    新思科技攜手英偉達(dá)加速芯片設(shè)計,提升芯片電子設(shè)計自動化效率

    宣布在英偉達(dá) Grace Blackwell 平臺上實現(xiàn)高達(dá) 30 倍的預(yù)期性能提升,加速下一代半導(dǎo)體的電路仿真 ? 摘要: 在今年GTC主題演講中,新思科技作為生態(tài)系統(tǒng)的一部分,展示了全棧EDA
    發(fā)表于 03-19 17:59 ?505次閱讀

    新思科技亮相英偉達(dá)GTC 2025大會

    為了實現(xiàn)這一速度提升,新思科技在GTC全球AI大會上宣布,正在使用英偉達(dá) CUDA-X庫優(yōu)化其下一代半導(dǎo)體開發(fā)解決方案。公司還在擴(kuò)大對英偉達(dá)Grace CPU架構(gòu)的支持,并將在2025
    的頭像 發(fā)表于 03-19 17:53 ?1327次閱讀