91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PCIe?結(jié)構(gòu)和RAID如何在GPUDirect存儲中釋放全部潛能

jf_pJlTbmA9 ? 來源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-07-08 15:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著更快的圖形處理單元(GPU)能夠提供明顯更高的計算能力,存儲設(shè)備和GPU存儲器之間的數(shù)據(jù)路徑瓶頸已經(jīng)無法實現(xiàn)最佳應(yīng)用程序性能。NVIDIA的Magnum IO GPUDirect存儲解決方案通過在存儲設(shè)備和GPU存儲器之間實現(xiàn)直接路徑,可以極大地幫助解決該問題。然而,同等重要的是要使用容錯系統(tǒng)來優(yōu)化其已經(jīng)非常出色的能力,從而確保在發(fā)生災(zāi)難性故障時備份關(guān)鍵數(shù)據(jù)。該解決方案通過PCIe?結(jié)構(gòu)連接邏輯RAID卷,在PCIe 4.0規(guī)范下,這可以將數(shù)據(jù)速率提高到26 GB/s。為了解如何實現(xiàn)這些優(yōu)勢,首先需要檢查該解決方案的關(guān)鍵組件及其如何協(xié)同工作來提供結(jié)果。

Magnum IO GPUDirect存儲

Magnum IO GPUDirect存儲解決方案的關(guān)鍵優(yōu)勢是其能夠消除主要性能瓶頸之一,方法是不使用CPU中的系統(tǒng)存儲器將數(shù)據(jù)從存儲設(shè)備加載到GPU中進行處理。通常將數(shù)據(jù)移動到主機存儲器并傳送到GPU,這依賴于CPU系統(tǒng)存儲器中的回彈緩沖區(qū),在數(shù)據(jù)傳送到GPU之前,會在其中創(chuàng)建數(shù)據(jù)的多個副本。但是,通過這種路徑移動大量數(shù)據(jù)會產(chǎn)生延遲時間,降低GPU性能,并在主機中占用許多CPU周期。借助Magnum IO GPUDirect存儲解決方案,無需訪問CPU并避免了回彈緩沖區(qū)效率低下(圖1)。

1672907747484612.jpg

圖1. Magnum IO GPUDirect存儲解決方案無需訪問CPU,避免了從數(shù)據(jù)路徑回彈緩沖

性能直接隨著傳送數(shù)據(jù)量的增加而提高,傳送數(shù)據(jù)量則隨著人工智能AI)、機器學(xué)習(xí)(ML)、深度學(xué)習(xí)(DL)和其他數(shù)據(jù)密集型應(yīng)用所需的大型分布式數(shù)據(jù)集呈指數(shù)級增長。當(dāng)數(shù)據(jù)在本地存儲或遠程存儲時,可以實現(xiàn)這些優(yōu)勢,從而允許以比CPU存儲器中的頁面緩存更快的速度訪問數(shù)拍字節(jié)的遠程存儲。

優(yōu)化RAID性能

該解決方案中的下一個元素是包括RAID功能,用于保持?jǐn)?shù)據(jù)冗余和容錯能力。雖然軟件RAID可以提供數(shù)據(jù)冗余,但底層軟件RAID引擎仍然使用精簡指令集計算機(RISC)架構(gòu)進行操作,例如奇偶校驗計算。當(dāng)比較高級RAID級別(例如RAID 5和RAID 6)的寫I/O延遲時間時,硬件RAID仍然比軟件RAID快得多,因為提供了專用處理器來執(zhí)行這些操作和回寫高速緩存。在流傳輸應(yīng)用中,軟件RIAD的長期RIAD響應(yīng)時間會導(dǎo)致數(shù)據(jù)堆積在高速緩存中。硬件RAID解決方案不存在緩存數(shù)據(jù)堆積問題,并且具有專門的備用電池,可以防止出現(xiàn)災(zāi)難性系統(tǒng)掉電時數(shù)據(jù)丟失的情況。

標(biāo)準(zhǔn)硬件RAID雖然減輕了主機的奇偶校驗管理負(fù)擔(dān),但大量數(shù)據(jù)仍需經(jīng)過RAID控制器才能發(fā)送到NVMe?驅(qū)動器,導(dǎo)致數(shù)據(jù)路徑更加復(fù)雜。針對此問題的解決方案是NVMe優(yōu)化的硬件RAID,該解決方案提供了簡化的數(shù)據(jù)路徑,無需經(jīng)過固件或RAID片上控制器即可傳送數(shù)據(jù)。它還允許維護基于硬件的保護和加密服務(wù)。

混合PCIe結(jié)構(gòu)

PCIe Gen 4現(xiàn)在是存儲子系統(tǒng)內(nèi)的基本系統(tǒng)互連接口,但標(biāo)準(zhǔn)PCIe交換網(wǎng)具有與前幾代相同的基于樹的基本層級。這意味著,主機間通信需要非透明橋接(NTB)來實現(xiàn)跨分區(qū)通信,這使其變得復(fù)雜,特別是在多主機多交換網(wǎng)配置中。Microchip的PAX PCIe高級結(jié)構(gòu)交換網(wǎng)等解決方案能夠克服這些限制,因為它們支持冗余路徑和循環(huán),而這是使用傳統(tǒng)PCIe無法實現(xiàn)的。

結(jié)構(gòu)交換網(wǎng)具有兩個獨立的域,主機虛擬域(專用于每個物理主機)和結(jié)構(gòu)域(包含所有端點和結(jié)構(gòu)鏈路)。來自主機域的事務(wù)會在結(jié)構(gòu)域中轉(zhuǎn)換為ID和地址,反之,結(jié)構(gòu)域中通信的非分層路由也是如此。這樣,系統(tǒng)中的所有主機便可共享連接到交換網(wǎng)和端點的結(jié)構(gòu)鏈路。

嵌入式CPU上運行的結(jié)構(gòu)固件通過可配置的下行端口數(shù)虛擬化符合PCIe標(biāo)準(zhǔn)的交換網(wǎng)。因此,交換網(wǎng)將始終顯示為具有直連端點的標(biāo)準(zhǔn)單層PCIe設(shè)備,而與這些端點在結(jié)構(gòu)中的位置無關(guān)。由于結(jié)構(gòu)交換網(wǎng)會攔截來自主機的所有配置平面通信(包括PCIe枚舉過程)并選擇最佳路徑,因此它可以實現(xiàn)這一點。這樣,GPU等端點便可綁定到域中的任何主機(圖2)。

1672907741572600.jpg

圖2. 交換網(wǎng)固件虛擬化的主機域顯示為每個主機符合PCIe標(biāo)準(zhǔn)的單層交換網(wǎng)

在以下示例(圖3)中,我們給出了雙主機PCIe結(jié)構(gòu)引擎設(shè)置。此處,我們可以看到,結(jié)構(gòu)虛擬化允許每個主機看到一個透明PCIe拓?fù)?,其中包含一個上行端口、三個下行端口和三個連接到它們的端點,并且主機可以正確枚舉它們。圖3中的有趣之處是具有一個包含兩個虛擬功能的SR-IOV SSD,通過Microchip的PCIe高級結(jié)構(gòu)交換網(wǎng),同一驅(qū)動器的虛擬功能可以共享給不同的主機。

1672907735729851.jpg

圖3. 雙主機PCIe?結(jié)構(gòu)引擎

這種PAX結(jié)構(gòu)交換網(wǎng)解決方案還支持在各結(jié)構(gòu)之間直接跨域點對點傳輸,因此可減少根端口阻塞并進一步緩解CPU性能瓶頸,如圖4所示。

1672907726831240.jpg

圖4. 通過結(jié)構(gòu)路由通信,可減少根端口阻塞

性能優(yōu)化

在探索了NVMe驅(qū)動器和GPU之間數(shù)據(jù)傳輸?shù)男阅軆?yōu)化過程中涉及的所有組件之后,現(xiàn)在可以結(jié)合使用這些組件來實現(xiàn)預(yù)期的結(jié)果。說明這一點的最佳方式是利用圖示演示各個步驟,圖5顯示了主機CPU及其根端口以及可實現(xiàn)最佳結(jié)果的各種配置。

如圖5左側(cè)所示,盡管使用的是高性能NVMe控制器,但由于根端口的開銷,PCI Gen 4 x 4(4.5 GB/s)的最大數(shù)據(jù)速率也限制為3.5 GB/s。不過,通過RAID(邏輯卷)同時聚合多個驅(qū)動器(如右側(cè)所示),SmartRAID控制器可為四個NVMe驅(qū)動器各創(chuàng)建兩個RAID卷,并通過根端口創(chuàng)建傳統(tǒng)PCIe點對點路由。這會將數(shù)據(jù)速率提高到9.5 GB/s。

但是,利用跨域點對點傳輸(底部的圖),可以通過結(jié)構(gòu)鏈路而不是根端口來路由通信,從而實現(xiàn)26 GB/s的速率,這是使用SmartROC 3200 RAID控制器可達到的最高速率。在最后一個場景中,交換網(wǎng)提供不受固件影響的直接數(shù)據(jù)路徑,并且仍然保持基于硬件的RAID保護和加密服務(wù),同時充分利用GPUDirect存儲的全部潛能。

1672907709348977.jpg

圖5. 實現(xiàn)26 GB/s的路徑

總結(jié)

高性能PCIe結(jié)構(gòu)交換網(wǎng)(例如Microchip的PAX)允許多主機共享支持單根I/O虛擬化(SR-IOV)的驅(qū)動器,以及動態(tài)劃分可在多個主機之間共享的GPU和NVMe SSD池。Microchip的PAX結(jié)構(gòu)交換網(wǎng)可以將端點資源動態(tài)重新分配給需要這些資源的任何主機。

這種解決方案還使用了SmartROC 3200 RAID控制器系列支持的SmartPQI驅(qū)動程序,因此無需自定義驅(qū)動程序。Microchip的SmartROC 3200 RAID控制器是目前惟一能夠提供最高傳輸速率(即26 GB/s)的設(shè)備。它具有極低的延遲時間,可向主機提供最多16個PCIe Gen 4通道,并向后兼容PCIe Gen 2。與Microchip基于Flashtec?系列的NVMe SSD結(jié)合使用時,可在多主機系統(tǒng)中發(fā)揮PCIe和Magnum IO GPUDirect存儲的全部潛能??傮w而言,上述所有特性使其能夠構(gòu)建一種強大的系統(tǒng),該系統(tǒng)可以滿足AI、ML、DL以及其他高性能計算應(yīng)用的實時需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4811

    瀏覽量

    90124
  • PCIe
    +關(guān)注

    關(guān)注

    16

    文章

    1464

    瀏覽量

    88579
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RK3588平臺雙存儲(SPI+PCIE)OTA升級方案教學(xué)文檔

    在嵌入式設(shè)備,單一存儲介質(zhì)可能存在容量限制或可靠性風(fēng)險。RK3588 平臺的雙存儲 OTA 升級方案支持SPI(如 SPI NAND/NOR)與 PCIE
    的頭像 發(fā)表于 02-01 16:46 ?1656次閱讀
    RK3588平臺雙<b class='flag-5'>存儲</b>(SPI+<b class='flag-5'>PCIE</b>)OTA升級方案教學(xué)文檔

    井芯微全新PCIe Switch擴展卡重磅發(fā)布

    算力時代,互連技術(shù)是釋放硬件潛能的核心命脈。近期,一款搭載國內(nèi)首款全自主可控 PCIe Gen4 Switch 芯片(JXW8848)的擴展卡耀世登場,不僅填補了全國產(chǎn)化 PCIe
    的頭像 發(fā)表于 01-28 14:54 ?476次閱讀
    井芯微全新<b class='flag-5'>PCIe</b> Switch擴展卡重磅發(fā)布

    釋放多屏潛能:迅為RK3588開發(fā)板Android多屏同顯開發(fā)完全指南

    釋放多屏潛能:迅為RK3588開發(fā)板Android多屏同顯開發(fā)完全指南
    的頭像 發(fā)表于 12-16 16:11 ?933次閱讀
    <b class='flag-5'>釋放</b>多屏<b class='flag-5'>潛能</b>:迅為RK3588開發(fā)板Android多屏同顯開發(fā)完全指南

    ICY DOCK的企業(yè)級PCIe插槽硬盤盒與存儲擴展方案

    在企業(yè)計算環(huán)境,PCIe擴展插槽一直是最具價值的系統(tǒng)資源之一。傳統(tǒng)上,這些插槽多用于網(wǎng)絡(luò)、存儲或加速卡等關(guān)鍵組件,而隨著存儲需求的持續(xù)增長,如何高效利用
    的頭像 發(fā)表于 12-12 16:55 ?1267次閱讀
    ICY DOCK的企業(yè)級<b class='flag-5'>PCIe</b>插槽硬盤盒與<b class='flag-5'>存儲</b>擴展方案

    服務(wù)器數(shù)據(jù)恢復(fù)—5盤RAID5的4盤重建RAID5,RAID5數(shù)據(jù)恢復(fù)秘籍!

    解具體情況下,使用raid5陣列沒有掉線的4塊硬盤重新創(chuàng)建了一組全新的RAID5陣列,并完成同步數(shù)據(jù),導(dǎo)致原始5盤raid5陣列的數(shù)據(jù)
    的頭像 發(fā)表于 11-13 16:20 ?616次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—5盤<b class='flag-5'>RAID</b>5<b class='flag-5'>中</b>的4盤重建<b class='flag-5'>RAID</b>5,<b class='flag-5'>RAID</b>5數(shù)據(jù)恢復(fù)秘籍!

    服務(wù)器數(shù)據(jù)恢復(fù)—EqualLogic存儲raid5磁盤陣列數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境&故障: 某品牌EqualLogic PS6100存儲陣列上有一組由16塊硬盤組建的raid5磁盤陣列。磁盤陣列上層劃分多個大小不同的卷,存放虛擬機文件。 硬盤出現(xiàn)故障導(dǎo)致
    的頭像 發(fā)表于 10-21 15:04 ?358次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—Raid5多盤掉線,存儲復(fù)活大揭秘!

    某單位同友存儲存儲中有一組raid5磁盤陣列。存儲內(nèi)部共有虛擬機若干臺,raid5陣列崩潰導(dǎo)致存儲
    的頭像 發(fā)表于 10-10 13:44 ?439次閱讀
    服務(wù)器數(shù)據(jù)恢復(fù)—<b class='flag-5'>Raid</b>5多盤掉線,<b class='flag-5'>存儲</b>復(fù)活大揭秘!

    曙光存儲超級隧道技術(shù)助力應(yīng)對PCIe 6.0時代

    8月29日,聚焦“智存·智算·智能”的第二屆CCF中國存儲大會在武漢隆重召開。會上,曙光存儲副總裁郭照斌宣布,“超級隧道”技術(shù)能更好的應(yīng)對PCIe 6.0時代,為下一代國產(chǎn)芯片效能釋放
    的頭像 發(fā)表于 09-03 14:01 ?610次閱讀

    Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴展 NVMe? RAID 存儲解決方案

    采用分離式架構(gòu),充分利用主機 CPU 和 PCIe??基礎(chǔ)設(shè)施,克服傳統(tǒng)存儲瓶頸 ? 為更好地支持服務(wù)器原始設(shè)備制造商(OEM)、存儲系統(tǒng)、數(shù)據(jù)中心和企業(yè)客戶,Microchip
    的頭像 發(fā)表于 08-06 16:31 ?1.9w次閱讀
    Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴展 NVMe? <b class='flag-5'>RAID</b> <b class='flag-5'>存儲</b>解決方案

    WAIC 直擊|Arm 鄒挺:突破基礎(chǔ)設(shè)施、數(shù)據(jù)安全與人才三重挑戰(zhàn),釋放 AI 發(fā)展新潛能

    WAIC 直擊|Arm 鄒挺:突破基礎(chǔ)設(shè)施、數(shù)據(jù)安全與人才三重挑戰(zhàn),釋放 AI 發(fā)展新潛能
    的頭像 發(fā)表于 07-28 11:33 ?1226次閱讀
    WAIC 直擊|Arm 鄒挺:突破基礎(chǔ)設(shè)施、數(shù)據(jù)安全與人才三重挑戰(zhàn),<b class='flag-5'>釋放</b> AI 發(fā)展新<b class='flag-5'>潛能</b>

    通道渲染:釋放渲染的全部潛能!通道渲染的作用、類型、技巧

    在3D圖形創(chuàng)作,渲染通道(RenderPasses)是一項至關(guān)重要的技術(shù),它通過將復(fù)雜的渲染圖像拆分為多個圖層,如陰影、光照、法線等,使藝術(shù)家能夠在后期制作更精準(zhǔn)地控制和調(diào)整畫面。我們常常驚嘆于
    的頭像 發(fā)表于 07-15 14:22 ?767次閱讀
    通道渲染:<b class='flag-5'>釋放</b>渲染的<b class='flag-5'>全部</b><b class='flag-5'>潛能</b>!通道渲染的作用、類型、技巧

    DDN攜手NVIDIA釋放結(jié)構(gòu)化數(shù)據(jù)的AI價值

    DDN 通過與 NVIDIA AI 數(shù)據(jù)平臺的合作,推出聯(lián)合解決方案,簡化了企業(yè)對非結(jié)構(gòu)化數(shù)據(jù)的存儲、訪問和激活方式,助力客戶釋放生成式 AI 的巨大商業(yè)潛能。DDN 全球合作伙伴負(fù)責(zé)
    的頭像 發(fā)表于 06-10 10:31 ?991次閱讀

    nvme IP開發(fā)之PCIe

    數(shù)據(jù),Posted類型的事務(wù)請求不需要使用 完成報文。 PCIe總線協(xié)議定義了基于地址的路由、基于ID的路由和隱式路由三種TLP路由 方式。其中,存儲器讀寫和I/O讀寫TLP采用基于地址的路由,該類
    發(fā)表于 05-18 00:48

    27MHz HCSL 差分晶體振蕩器在數(shù)據(jù)中心網(wǎng)絡(luò)存儲系統(tǒng)的應(yīng)用方案

    一、應(yīng)用背景:存儲系統(tǒng)需要高精度參考時鐘保障穩(wěn)定性 在現(xiàn)代數(shù)據(jù)中心中,服務(wù)器主板、RAID控制器、企業(yè)級SSD以及高速網(wǎng)絡(luò)存儲設(shè)備(NAS、SAN等)構(gòu)成了存儲系統(tǒng)的核心。為了支持高吞
    發(fā)表于 04-14 21:19