91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU之間是怎么通信互聯(lián)的呢?

SDNLAB ? 來源:了不起的云計算 ? 2023-11-10 16:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天想跟大家一起學(xué)習(xí)下GPU之間是怎么通信互聯(lián)的。

自從GPU出現(xiàn)后,計算機(jī)愛好者和發(fā)燒友們就一直尋找新的方法來進(jìn)一步提高系統(tǒng)GPU性能。

在單個GPU性能有限的情況下,將兩個或多個GPU連接起來這種在當(dāng)時看起來非?;闹嚨南敕ň谷粷u漸成為提升系統(tǒng)GPU性能的主流方法。

特別是隨著游戲、圖形應(yīng)用的發(fā)展,以及AI、HPC等新興應(yīng)用的助推,多個GPU之間的互聯(lián)技術(shù)得到了快速迭代和發(fā)展,如今的GPU互聯(lián)已經(jīng)成為系統(tǒng)內(nèi)非常常見的一種技術(shù)。今天我們就來聊聊這些GPU互聯(lián)的那些技術(shù)。

第一個連接多個GPU解決方案:SLI

SLI,全稱為 " 可擴(kuò)展的鏈接接口 "( Scalable Link Interface),最早是由 3DFx Interactive 開發(fā)。

然而,3DFx Interactive這家公司在2000年破產(chǎn),NVIDIA公司收購了這家公司并獲得了多GPU技術(shù)的權(quán)利。

于是,在2004年,NVIDIA首次推出了SLI技術(shù)版本,同時發(fā)布了GeForce 6800 Ultra GPU。該技術(shù)允許兩個GeForce 6800 Ultra GPU一起工作,以增強(qiáng)游戲時的圖形性能**。**因此,SLI技術(shù)迅速在游戲玩家和愛好者中流行起來。

SLI采用主從配置方式在系統(tǒng)中實現(xiàn)使用多個GPU,這種配置的重點是使用一個GPU作為主車,其他GPU作為從卡,SLI能夠同時連接4個GPU。

**SLI是第一個連接多個GPU的解決方案。**但是與所有技術(shù)一樣,SLI也有各種優(yōu)點和局限性。SLI配置必須選擇相同型號的兼容GPU。同時還需要分配一個單獨的PSU來滿足多個GPU的協(xié)調(diào)要求,導(dǎo)致GPU之間的通信延遲較高,且GPU之間的數(shù)據(jù)共享缺乏靈活性。

另外,NVIDIA大約在兩年前停止了對該技術(shù)的支持,為開發(fā)NVLink等新技術(shù)讓路。

SLI與CrossFire:多GPU解決方案之爭

雖然NVIDIA的SLI走在了多GPU互聯(lián)的前面,但也并非沒有競爭。

作為NVIDIA GPU市場上多年的老對手,AMD也推出了CrossFire這個技術(shù)來參與競爭。

與SLI技術(shù)類似,使用CrossFire技術(shù)時,用戶可選擇使用兩個或更多顯卡進(jìn)行渲染,從而增加幀數(shù)和提高游戲運行效率。

CrossFire技術(shù)的一大優(yōu)點是用戶可以使用不同型號的AMD顯卡,從而節(jié)省成本。

然而,CrossFire也有其自身的優(yōu)勢和挑戰(zhàn),CrossFire經(jīng)常因其軟件堆棧而受到批評,一些用戶發(fā)現(xiàn)該軟件堆棧不如NVIDIA SLI可靠且配置更復(fù)雜。

盡管存在這些差異,但這兩種技術(shù)都致力于實現(xiàn)相同的目標(biāo):增強(qiáng)游戲和消費者圖形體驗。它們在處理更高級、數(shù)據(jù)密集型任務(wù)方面的局限性最終將為 NVLink等下一代解決方案鋪平道路。

隨著2010年代的到來,計算領(lǐng)域開始發(fā)生巨大變化。人工智能 (AI)、高性能計算(HPC)和大數(shù)據(jù)分析的興起需要更強(qiáng)大的多GPU解決方案。很明顯,最初設(shè)計時考慮到游戲和消費者工作負(fù)載的SLI不足以滿足這些計算密集型任務(wù)。NVIDIA需要一個新的GPU互聯(lián)技術(shù)。

雙GPU卡:多GPU計算的獨特存在

雖然SLI和CrossFire等技術(shù)專注于連接多個獨立GPU,但還有另一種不太常見或者可以說是奇葩的多 GPU配置方法:雙GPU卡。

這些專用顯卡在單個PCB(印刷電路板)上安裝了兩個GPU核心,有效地充當(dāng)單張卡上的SLI或CrossFire 設(shè)置。NVIDIA GeForce GTX 690和AMD Radeon HD 6990等卡是這種方法的流行示例。

雙GPU卡具有多種優(yōu)勢, 他們通過將兩個GPU壓縮到一個卡槽中來節(jié)省空間,這使得它們對小型PC很有吸引力。同時他們還無需將單獨的卡與外部連接器連接起來,從而簡化了設(shè)置。

然而,這些雙GPU卡散熱是一個重大問題,可以說每一個卡都是一個**"小火爐"****。**通常這種配置方式需要先進(jìn)的冷卻解決方案。同時功耗也很高,需要強(qiáng)大的電源來提供穩(wěn)定的電流。

雙GPU卡的方式看起來是一種"兩全其美"的解決方案,將多GPU設(shè)置的原始功能與單卡的簡單性結(jié)合在一起。然而,由于其高成本和相關(guān)的技術(shù)挑戰(zhàn),雙GPU卡經(jīng)常被視為雞肋產(chǎn)品。

隨著NVLink等多GPU技術(shù)不斷發(fā)展以提供更高的帶寬和更低的延遲,對雙 GPU卡的需求已經(jīng)減少。盡管如此,它仍然是GPU發(fā)展史上一個獨特的存在。

****** NVLink 的誕生******

NVLink是2017年隨NVIDIA Volta架構(gòu)推出的技術(shù)。這項技術(shù)不僅僅是SLI技術(shù)的升級,而且是對GPU如何互連的根本性重新思考。

NVLink提供了更高的帶寬(最新版本高達(dá)900 GB/s)、更低的延遲以及允許GPU之間更復(fù)雜和大量互連的網(wǎng)狀拓?fù)?。此外,NVLink引入了統(tǒng)一內(nèi)存的概念,支持連接的 GPU 之間的內(nèi)存池,這對于需要大型數(shù)據(jù)集的任務(wù)來說是一個至關(guān)重要的功能。

SLI與NVLink有何區(qū)別?

乍一看,人們可能會認(rèn)為NVLink是SLI的簡單升級,但這過于武斷了。雖然這兩種技術(shù)都旨在連接多個GPU,但NVLink的設(shè)計考慮了不同的受眾。它專為科學(xué)研究、數(shù)據(jù)分析,尤其是人工智能和機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計。更高的帶寬、更低的延遲和統(tǒng)一的內(nèi)存使NVLink成為應(yīng)對當(dāng)今計算挑戰(zhàn)的更加靈活和強(qiáng)大的解決方案。

雖然NVLink和SLI兩者均由Nvidia開發(fā),但存在一些差異。S****LI按照主從關(guān)系原理運行,而NVLink通過網(wǎng)狀網(wǎng)絡(luò)運行。結(jié)果,SLI中形成了NVLink中不存在的數(shù)據(jù)瓶頸。

采用網(wǎng)狀網(wǎng)絡(luò)開發(fā)的并行連接可增強(qiáng)GPU的性能。因此,多個GPU作為一個單元,有助于提供增強(qiáng)的處理能力。連接的GPU擁有自己的內(nèi)存,從而增加了系統(tǒng)的總可用內(nèi)存。NVLink橋還支持20至30 GB/s 的帶寬,為4個GPU 的設(shè)置提供超過100GB/s 的速度。

網(wǎng)狀網(wǎng)絡(luò)消除 GPU之間的層級關(guān)系。計算數(shù)據(jù)因此連接到每個GPU的節(jié)點,從而提高了整體渲染速度。因此,150至200GB/s的帶寬也可以實現(xiàn)。與SLI 相比,NVLink的延遲非常低。

****** NVLink的技術(shù)原理******

NVLink代表了多GPU互聯(lián)技術(shù)的邏輯演變,不僅在速度方面,而且在架構(gòu)設(shè)計方面。NVLink的結(jié)構(gòu)由可以雙向傳輸數(shù)據(jù)的高速數(shù)據(jù)通道組成。與傳統(tǒng)的基于總線的系統(tǒng)不同,NVLink采用點對點連接,有效減少瓶頸并提高數(shù)據(jù)吞吐量。最新的迭代提供高達(dá)900GB/s的帶寬,比SLI的功能有了顯著增強(qiáng)。

NVLink與眾不同的關(guān)鍵功能之一是它支持網(wǎng)狀拓?fù)涞哪芰Α?/strong>與舊技術(shù)的菊花鏈或中心輻射型拓?fù)湎啾?,網(wǎng)格設(shè)置允許GPU之間實現(xiàn)更通用且數(shù)量更多的連接。這在數(shù)據(jù)中心和高性能計算應(yīng)用程序中特別有用,在這些應(yīng)用程序中,復(fù)雜的數(shù)據(jù)路由是常態(tài)。

統(tǒng)一內(nèi)存是NVLink的另一個特點。這允許GPU共享公共內(nèi)存池,從而實現(xiàn)更高效的數(shù)據(jù)共享并減少在GPU之間復(fù)制數(shù)據(jù)的需要。這對于機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析等應(yīng)用程序來說是一個巨大的推動,在這些應(yīng)用程序中,大型數(shù)據(jù)集通常超過單個GPU的內(nèi)存容量。

NVLink還改善了延遲,這是任何高性能計算設(shè)置中的一個關(guān)鍵因素。較低的延遲可確保GPU之間更快的數(shù)據(jù)傳輸和同步,從而實現(xiàn)更高效的并行計算。這是通過NVLink的直接內(nèi)存訪問 (DMA) 功能實現(xiàn)的,允許GPU直接讀寫彼此的內(nèi)存,而不需要CPU的參與。

NVlink的影響

鑒于人工智能在現(xiàn)代計算中的重要性日益增加,NVLink的優(yōu)勢不僅是漸進(jìn)式的,而且是變革性的。在AI模型訓(xùn)練和數(shù)據(jù)創(chuàng)建中,NVLink可實現(xiàn)GPU之間更快的數(shù)據(jù)傳輸,從而實現(xiàn)更高效的并行處理。這在處理大型訓(xùn)練數(shù)據(jù)集時尤其有用,這是一個與人工智能模型訓(xùn)練數(shù)據(jù)創(chuàng)建的新興領(lǐng)域密切相關(guān)的主題。

隨著量子模擬、實時分析和下一代人工智能算法等先進(jìn)計算的需求不斷增長,我們可以期待NVLink的功能進(jìn)一步增強(qiáng)。無論是帶寬的增加還是促進(jìn)GPU之間更好合作的新功能,NVLink或其后繼者無疑仍將是滿足未來計算需求的核心。

從SLI到NVLink的過渡是多GPU技術(shù)的一個重要里程碑,它反映了NVIDIA 對創(chuàng)新的承諾以及對不斷變化的計算環(huán)境的敏銳理解。從游戲到人工智能,從消費應(yīng)用程序到數(shù)據(jù)中心,NVLink和SLI的發(fā)展歷程說明了需求對孕育創(chuàng)新、推動技術(shù)發(fā)展的重要價值。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5600

    瀏覽量

    109824
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5200

    瀏覽量

    135538
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    346

    瀏覽量

    24997
  • PSU
    PSU
    +關(guān)注

    關(guān)注

    0

    文章

    53

    瀏覽量

    12499

原文標(biāo)題:一文讀懂:多卡GPU是如何互聯(lián)通信的?

文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    汽車中的GPU是如何使用的?

    (HMI)的發(fā)展尤為迅猛。隨著電子電氣架構(gòu)(EEA)的集中化,車輛對高性能計算能力的需求顯著提升,GPU(圖形處理單元)的靈活性、可擴(kuò)展性以及高效并行計算能力,使其成為支持這些創(chuàng)新應(yīng)用的核心組件
    的頭像 發(fā)表于 12-03 14:45 ?9592次閱讀
    汽車中的<b class='flag-5'>GPU</b>是如何使用的?

    DSP、FPGA之間SRIO通信的問題?

    目前在使用DSP和FPGA之間通過SRIO的SWRITE事務(wù)完成雙向數(shù)據(jù)通信,大多數(shù)情況下都正常,但是在我不停的給DSP進(jìn)行燒寫程序時,會偶爾出錯,F(xiàn)PGA無法收到DSP下發(fā)的數(shù)據(jù)。偶爾故障情況下buf_lcl_phy_buf_stat_out始終是5\'b10000,且
    發(fā)表于 11-15 16:22

    NICE接口和協(xié)處理器之間怎樣實現(xiàn)通信?

    NICE接口和協(xié)處理器之間怎樣實現(xiàn)通信
    發(fā)表于 11-05 12:42

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標(biāo)

    GPU架構(gòu)參數(shù)如CUDA核心數(shù)、顯存帶寬、TensorTFLOPS、互聯(lián)方式等,并非“冰冷的數(shù)字”,而是直接關(guān)系設(shè)備能否滿足需求、如何發(fā)揮最大價值、是否避免資源浪費等問題的核心要素。本篇文章將全面
    的頭像 發(fā)表于 10-09 09:28 ?1158次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構(gòu)?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)指標(biāo)

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了
    發(fā)表于 07-25 08:18

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    帶來了總雙向帶寬160GB/s的通訊速率,遠(yuǎn)高于當(dāng)時的PCIe接口(實際比現(xiàn)在的PCIe5.0也還要快)。首代的NVlink主要是增強(qiáng)了GPUGPU通信性能和GPU對系統(tǒng)內(nèi)存的訪問
    發(fā)表于 06-18 19:31

    華為助力算力互聯(lián)網(wǎng)跨域算間無損互聯(lián)

    近日,NIDA發(fā)布的《工信部首提數(shù)據(jù)通信產(chǎn)業(yè),賦能算力互聯(lián)網(wǎng)新征程》一文引發(fā)廣泛關(guān)注。文章解讀工信部最新發(fā)布的《算力互聯(lián)互通行動計劃》,清晰地揭示了數(shù)據(jù)通信產(chǎn)業(yè)與算力
    的頭像 發(fā)表于 06-14 11:17 ?1266次閱讀

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計算引擎,廣泛應(yīng)用于人工智能、科學(xué)計算
    的頭像 發(fā)表于 05-30 10:36 ?1888次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    上位機(jī)和下位機(jī)之間通信是通過什么實現(xiàn)的

    上位機(jī)和下位機(jī)之間通信可通過多種方式實現(xiàn),以下從有線通信和無線通信兩大類別展開介紹: 有線通信 串口
    的頭像 發(fā)表于 05-29 09:24 ?1108次閱讀

    如何破解GPU集群集合通信路徑的“黑盒”難題?

    集合通信庫(如NCCL、HCCL)的運行細(xì)節(jié)用戶完全無感知,形成“黑盒”狀態(tài)。EPS通過實時解析集合通信庫的底層運行狀態(tài),將隱蔽的通信路徑、GPU與網(wǎng)卡狀態(tài)等信息可視化,并提供智能路由
    的頭像 發(fā)表于 05-22 10:13 ?953次閱讀
    如何破解<b class='flag-5'>GPU</b>集群集合<b class='flag-5'>通信</b>路徑的“黑盒”難題?

    認(rèn)識 Thread 協(xié)議的互聯(lián)能力

    Thread 是專門為 loT 設(shè)備提供無線網(wǎng)狀網(wǎng)絡(luò)通信的協(xié)議,由三星、ARM、Nest 三家企業(yè)共同推出。為了加速 Thread 協(xié)議普及,多家公司于2014年7月組成 \"Thread
    發(fā)表于 04-26 23:17

    奇異摩爾以互聯(lián)之長推進(jìn)OISA GPU卡間互聯(lián)生態(tài)適配

    進(jìn)行了精彩的主題分享。 作為AI網(wǎng)絡(luò)特別組及網(wǎng)絡(luò)工作組的成員,奇異摩爾積極參與大會,與業(yè)界同仁共同探討AI網(wǎng)絡(luò)互聯(lián)應(yīng)用的發(fā)展趨勢。 當(dāng)前,國內(nèi)外GPU卡間互聯(lián)技術(shù)正呈現(xiàn)出多樣化的繁榮景象,不同標(biāo)準(zhǔn)、協(xié)議及產(chǎn)業(yè)鏈生態(tài)迅速發(fā)展,
    的頭像 發(fā)表于 04-01 19:35 ?1774次閱讀
    奇異摩爾以<b class='flag-5'>互聯(lián)</b>之長推進(jìn)OISA <b class='flag-5'>GPU</b>卡間<b class='flag-5'>互聯(lián)</b>生態(tài)適配

    可以手動構(gòu)建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發(fā)表于 03-28 06:35

    高性能GPU服務(wù)器推薦

    面對市場上種類繁多的GPU服務(wù)器,如何選擇一款適合自身需求的設(shè)備?接下來,AI部落小編為您推薦。
    的頭像 發(fā)表于 03-20 10:14 ?1098次閱讀