91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

借助 NVIDIA Spectrum 以太網(wǎng)最大限度地提高存儲網(wǎng)絡性能

NVIDIA英偉達 ? 來源:未知 ? 2023-07-05 18:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著數(shù)據(jù)生成的不斷增加,線性性能擴展已成為橫向擴展存儲的絕對要求。存儲網(wǎng)絡就像汽車道路系統(tǒng):如果道路不是為速度而建造的,那么汽車的潛在速度就無關緊要了。即使是法拉利在充滿障礙的非鋪裝的土路上也會很慢。

連接存儲節(jié)點的以太網(wǎng)網(wǎng)絡架構(gòu)可能會阻礙橫向擴展存儲性能。NVIDIA 加速以太網(wǎng)可以消除性能瓶頸,從而為一般應用程序,特別是 AI/ML 實現(xiàn)最高的存儲性能。

橫向擴展存儲需要強大的網(wǎng)絡

全球每秒有 54000 張照片被拍攝。當您閱讀本文時,這一數(shù)字將會更高。無論您的業(yè)務是什么,您都有可能擁有大量需要存儲和分析的數(shù)據(jù),而且數(shù)據(jù)量每天都在增長。

以前使用越來越大的存儲文件服務器的縱向擴展方法已被橫向擴展方法所取代,以提供在容量和性能方面線性擴展的存儲。

借助橫向擴展存儲或分布式存儲,可以配置和連接多個較小的節(jié)點,使其成為一個邏輯單元。單個文件或?qū)ο罂梢苑植荚诙鄠€節(jié)點上。

當需要更大的規(guī)模時,可以輕松添加額外的存儲節(jié)點,以提高存儲容量和性能。這既適用于傳統(tǒng)的企業(yè)存儲供應商解決方案,也適用于軟件和硬件獨立采購的軟件定義解決方案。

分布式存儲實現(xiàn)了靈活的擴展和成本效益,但需要高性能網(wǎng)絡來連接存儲節(jié)點。許多數(shù)據(jù)中心交換機不適合存儲的獨特流量特性,實際上可能會削弱橫向擴展存儲解決方案的性能。

存儲流量與傳統(tǒng)流量的區(qū)別

對于許多用例來說,網(wǎng)絡流量是一致且同構(gòu)的,傳統(tǒng)以太網(wǎng)就足夠了。但是,存儲設備生成的流量可能會導致以下詳述問題。

01

網(wǎng)絡壓力

當前的存儲解決方案受益于更快的 SSD 和存儲接口,如 NVMe 和 PCIe Gen 4(即將推出 PCIe Gen 5),旨在提供更高的性能。

02

擁塞

當存儲網(wǎng)絡架構(gòu)飽和時,網(wǎng)絡擁塞就不可避免,就像高速公路上交通量過多時造成道路擁堵一樣。網(wǎng)絡擁塞對于橫向擴展存儲來說尤其成問題,因為每個存儲節(jié)點都需要提供快速的數(shù)據(jù)傳輸。但當出現(xiàn)擁塞時,許多數(shù)據(jù)中心交換機都存在公平問題,其中一些節(jié)點的速度會比其他節(jié)點慢得多。單個文件或?qū)ο笸ǔ7植荚诙鄠€節(jié)點上,因此任何降低單個節(jié)點速度的操作都會有效地降低整個集群的速度。

03

突發(fā)流量

大多數(shù)存儲工作負載都是突發(fā)的,會產(chǎn)生密集的數(shù)據(jù)傳輸,并在短時間內(nèi)反復需要大量帶寬。當這種情況發(fā)生時,網(wǎng)絡交換機必須使用其緩沖區(qū)來吸收突發(fā),直到瞬時突發(fā)結(jié)束,從而防止數(shù)據(jù)包丟失。否則,數(shù)據(jù)包丟失將需要重新傳輸數(shù)據(jù),從而顯著降低應用程序性能。

04

存儲巨型幀

傳統(tǒng)的數(shù)據(jù)中心網(wǎng)絡流量使用的最大數(shù)據(jù)包大?。?MTU)為 1.5KB。當橫向擴展存儲節(jié)點可以使用 9KB 的“巨型幀”時,它們的性能會更好,這樣可以在提高吞吐量的同時降低? CPU 處理開銷。許多使用商用交換機 ASIC 構(gòu)建的數(shù)據(jù)中心交換機在處理巨型幀時表現(xiàn)不佳或不可預測。

05

低延遲

提高存儲 IOP 的方法之一是通過為基于閃存介質(zhì)中的讀/寫操作實現(xiàn)幾個數(shù)量級延遲降低。?然而,當網(wǎng)絡引入高延遲時,尤其是由于過度緩沖,這些昂貴的性能改進可能會丟失。

訓練和推理都需要足夠的數(shù)據(jù)量和高速訪問,以確保 GPU 處理器足夠快地輸入數(shù)據(jù),使其保持被充分使用。在訓練期間,所有節(jié)點都會執(zhí)行寫操作,以提高模型的準確性。這導致了突發(fā),使得交換機必須有效地處理擁塞。最后,較低的存儲延遲使 GPU 能夠更有效地處理計算任務。

為什么 ASIC 不適合存儲流量

大多數(shù)數(shù)據(jù)中心交換機都是使用商用交換機 ASIC 構(gòu)建的,這些 ASIC 針對傳統(tǒng)的數(shù)據(jù)流量模式和數(shù)據(jù)包大小進行了成本優(yōu)化。為了在實現(xiàn)帶寬目標的同時保持低成本,以太網(wǎng)交換機芯片供應商通過使用分離緩沖區(qū)架構(gòu),這犧牲了公平性。

每個交換機都有一個緩沖區(qū),用于吸收流量突發(fā),并在發(fā)生擁塞時防止數(shù)據(jù)包丟失。常見的方法是擁有一個跨多個端口共享的緩沖區(qū)。然而,并非所有共享緩沖區(qū)都是相同的——存在不同的緩沖區(qū)架構(gòu)。

商用交換機沒有完全共享的緩沖區(qū),而是使用入口共享緩沖區(qū)或出口共享緩沖區(qū)。

對于入口共享緩沖區(qū),在一組傳入端口和特定內(nèi)存切片之間存在靜態(tài)映射。這些端口只能使用分配切片中的內(nèi)存,而不能使用整個緩沖區(qū),即使緩沖區(qū)的其余部分可用并且沒有人在使用它。

對于出口共享緩沖區(qū),在一組輸出端口和特定緩沖區(qū)內(nèi)存切片之間進行映射。同樣,每組出口只能使用其分配的緩沖區(qū)切片,而不能使用整個緩沖區(qū)。

對于這兩種體系結(jié)構(gòu),保持在同一內(nèi)存切片中的流與在內(nèi)存切片之間傳輸?shù)牧鞔嬖谛袨榈牟煌H绻S多流使用具有相同緩沖區(qū)的端口,那么這些端口將面臨更高的延遲和更低的吞吐量,而使用緩沖區(qū)其他切片的流量將享受更高的性能。

存儲性能取決于存儲流量(和其他流量)使用的端口以及這些端口緩沖區(qū)切片的繁忙程度。這就是為什么使用分離緩沖區(qū)的交換機經(jīng)常遇到公平性、可預測性和微突發(fā)吸收相關的問題。

為什么深度緩沖區(qū)交換機

在存儲方面未得到優(yōu)化

深度緩沖區(qū)交換機通常指的是提供更多緩沖區(qū)(GB 而不是 MB)的交換機。深度緩沖區(qū)交換機通常被推廣用作路由器,因為如果網(wǎng)絡速度不匹配或出現(xiàn)多對一通信情況,它們可以吸收并保持大量流量突發(fā)。

但在大多數(shù)數(shù)據(jù)中心應用程序(包括橫向擴展存儲)中,深度緩沖區(qū)交換機會對性能產(chǎn)生負面影響,原因如下:

01

作業(yè)完成時間

對于并行文件系統(tǒng),響應速度最慢的存儲節(jié)點決定了獲取文件所需的時間。與具有切片的片上緩沖區(qū)的商用交換機 ASIC 不同,深度緩沖區(qū)交換機同時具有片上和片外緩沖區(qū),并且它們都是切片的,而非完全共享的緩沖區(qū)。

想象一下,在流離開交換機之前,有多少種流進入交換機的方式。它們可以保持在一個片上內(nèi)存切片內(nèi)(速度最快),在片上內(nèi)存切片間傳輸(速度較慢),或在片上和片外內(nèi)存切片間傳輸(速度非常慢)。

所有這些流的行為都會有所不同,因此會導致存儲流量的公平性和可預測性問題。由于這些問題會降低一個或多個節(jié)點的速度,因此會對作業(yè)完成時間產(chǎn)生負面影響,并降低整個分布式存儲集群的速度。

02

延遲

交換機緩沖區(qū)越大,每個數(shù)據(jù)包必須經(jīng)過的隊列就越長,延遲也就越大。深度緩沖區(qū)交換機的測試平均端口到端口延遲超過 500 微秒。與同代的完全共享緩沖區(qū)交換機相比,NVIDIA Spectrum 1 的延遲僅為 0.3 微秒。而交換/路由數(shù)據(jù)包需要的時間是納秒而不是微秒。

深度緩沖區(qū)延遲高出 1000 倍。您可能想知道,這只是發(fā)生在擁塞的時候嗎?不會。在擁塞的情況下,深度緩沖區(qū)的延遲會高得多;事實上,最高可達 20 毫秒,或高出 50000 倍。對于數(shù)據(jù)中心之間的路由器來說,500 微秒的延遲可能還可以,但在數(shù)據(jù)中心內(nèi),這意味著閃存存儲性能的不可用。

03

功率和成本

深緩沖區(qū)交換機即使在空閑時也需要數(shù)百瓦的功率才能運行,這使得其持續(xù)的運營成本更高。深度緩沖區(qū)交換機的初始購買成本也高得多。如果性能更好,這可能是合理的,但實際測試證明恰恰相反。

選擇不合適的網(wǎng)絡交換機會嚴重拖慢存儲工作負載,使昂貴的快速存儲變得像更便宜、更慢的存儲一樣。

借助 NVIDIA Spectrum 可以降低資本支出和運營支出。節(jié)省的電力還可以用于機架內(nèi)的其他用途。

NVIDIA Spectrum 交換機

針對存儲進行了優(yōu)化

使用商用交換 ASIC,流要么保持在同一個內(nèi)存切片上,要么在內(nèi)存切片之間流動。

借助 NVIDIA Spectrum 交換機,由于完全共享的緩沖區(qū),所有流的行為都是相同的。這種架構(gòu)的價值在于最大的突發(fā)吸收能力以及最佳的公平和可預測的性能。通過交換機的所有流都得到相同的處理,并且通常享有相同的良好性能,無論它們使用哪個入口和出口。

深度緩沖區(qū)交換機和

NVIDIA Spectrum 的基準測試

第一種情況使用一個通用的存儲基準 FIO 工具,在后臺流量運行時從兩個發(fā)起端發(fā)送到一個目標端的寫操作。這是一種典型的存儲場景。

該團隊測量了 FIO 工作完成所需的時間(越短越好)。使用深度緩沖區(qū)交換機,F(xiàn)IO 作業(yè)耗時 87 秒。使用 NVIDIA Spectrum 交換機,作業(yè)運行速度提高 40%,僅需 51 秒即可完成。

d8ce38b8-1b1b-11ee-962d-dac502259ad0.png

圖 1:與深度緩沖區(qū)交換機相比,NVIDIA Spectrum 交換機的存儲寫入操作快 40%

深度緩沖區(qū)交換機大大增加了延遲,從而降低了存儲速度并降低了應用程序性能。但是延遲能有多高?

對于第二種情況,該團隊采用了深度緩沖區(qū)交換機,并測試了在不同的擁塞用例下延遲是如何受到影響的。最大緩沖區(qū)占用率僅為整個緩沖區(qū)大小的 10% 左右。

d8e56e34-1b1b-11ee-962d-dac502259ad0.png

圖 2:與緩沖區(qū)大小和緩沖區(qū)占用率相比的實際和預測延遲

從圖 2 左側(cè)的圖表中可以得出兩個有意義的見解。首先,深度緩沖區(qū)交換機延遲比 Spectrum 交換機高 50000 倍(2 – 19 毫秒,而 Spectrum 僅為 300 納秒)。

其次,緩沖區(qū)占用率和延遲之間存在明顯的線性相關性。換句話說,測試證明,占用的緩沖區(qū)越大,延遲就越大。

有了這一理解,圖 2 右側(cè)的圖表顯示了每個深度緩沖區(qū) ASIC(如 Jericho 1 、Jericho 2 或 Ramon)的最大延遲。這些非常高的延遲數(shù)通常與數(shù)據(jù)中心應用程序不兼容,尤其與快速存儲解決方案不兼容。

對于第三種情況,該團隊使用了兩臺 Windows 計算機,并同時將每臺計算機中的一個文件復制到同一目標存儲中。

使用深度緩沖區(qū)交換機時,一臺 Windows 計算機的帶寬是另一臺計算機的三倍( 830MBps 與 290MBps 相比)。使用 Spectrum 交換機時,每臺計算機的帶寬均為 584 MBps(如預期的 50%)。

實際測試表明,深度緩沖區(qū)交換機對數(shù)據(jù)中心應用程序(如吸收數(shù)據(jù)包和防止數(shù)據(jù)丟失)沒有積極影響。

長距離或廣域網(wǎng)連接可能需要深度緩沖區(qū)交換機;然而,它們對于數(shù)據(jù)中心應用程序來說不是理想選擇,并且會產(chǎn)生負面影響,特別是當工作負載擴展到僅兩個節(jié)點之外時,如本用例中所示。

d901b7d8-1b1b-11ee-962d-dac502259ad0.png

圖 3 :深度緩沖區(qū)交換機為每個節(jié)點提供了不公平的帶寬(左圖),而 NVIDIA Spectrum 交換機提供了相等的帶寬(右圖)


這三個用例證明了為什么深度緩沖區(qū)交換機會對 AI/ML 和存儲工作負載產(chǎn)生不利影響,而 Spectrum 交換機則提供了最大化的性能。

總結(jié)

NVIDIA Spectrum Ethernet switches?是專為 AI/ML 和存儲工作負載而構(gòu)建的,其性能優(yōu)于具有分離緩沖區(qū)或深度緩沖區(qū)的交換機。它們可以更好地處理擁塞,防止數(shù)據(jù)包丟失,并且在處理巨型幀(首選存儲)方面表現(xiàn)出色。NVIDIA Spectrum 以太網(wǎng)交換機可以提供良好的應用程序性能,網(wǎng)絡延遲也較低。

掃描下方二維碼查看更多有關 NVIDIA Spectrum Ethernet switches 的信息。

d929fa2c-1b1b-11ee-962d-dac502259ad0.png


d93b62f8-1b1b-11ee-962d-dac502259ad0.gif ?

更多精彩內(nèi)容 使用 NVIDIA Spectrum-X 網(wǎng)絡平臺加速生成式 AI 工作負載
COMPUTEX2023 | NVIDIA 推出面向超大規(guī)模生成式 AI 的加速以太網(wǎng)平臺


原文標題:借助 NVIDIA Spectrum 以太網(wǎng)最大限度地提高存儲網(wǎng)絡性能

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    23

    文章

    4091

    瀏覽量

    99270

原文標題:借助 NVIDIA Spectrum 以太網(wǎng)最大限度地提高存儲網(wǎng)絡性能

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    以太網(wǎng)一致性測試全解析:保障高性能網(wǎng)絡的關鍵技術

    在高速網(wǎng)絡設備的設計與制造中,以太網(wǎng)一致性測試是確保產(chǎn)品性能穩(wěn)定、符合行業(yè)標準的關鍵環(huán)節(jié)。我們能夠為客戶提供從測試標準解讀到實際問題排查的全方位支持。本文將以100Base-TX和1000Base-T為例,系統(tǒng)介紹
    的頭像 發(fā)表于 01-20 17:42 ?1139次閱讀
    <b class='flag-5'>以太網(wǎng)</b>一致性測試全解析:保障高<b class='flag-5'>性能</b><b class='flag-5'>網(wǎng)絡</b>的關鍵技術

    NVIDIA Spectrum-X以太網(wǎng)硅光技術助力AI工廠網(wǎng)絡創(chuàng)新

    NVIDIA 將率先為 AI 工廠引入采用光電一體封裝 (CPO) 的優(yōu)化以太網(wǎng)網(wǎng)絡,通過 NVIDIA Spectrum-X 以太網(wǎng)硅光
    的頭像 發(fā)表于 01-14 09:06 ?642次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum</b>-X<b class='flag-5'>以太網(wǎng)</b>硅光技術助力AI工廠<b class='flag-5'>網(wǎng)絡</b>創(chuàng)新

    車載以太網(wǎng)轉(zhuǎn)換器:專業(yè)選擇指南與康謀NETLion系列深度解析

    車載以太網(wǎng)轉(zhuǎn)換器是連接車載網(wǎng)絡與標準以太網(wǎng)的關鍵工具,康謀NETLion系列提供高性能、高性價比解決方案,適用于研發(fā)、測試與數(shù)據(jù)分析。
    的頭像 發(fā)表于 12-24 15:17 ?953次閱讀
    車載<b class='flag-5'>以太網(wǎng)</b>轉(zhuǎn)換器:專業(yè)選擇指南與康謀NETLion系列深度解析

    基于以太網(wǎng)芯片的應用層方案

    在物聯(lián)網(wǎng)與智能化加速發(fā)展的今天,以太網(wǎng)作為穩(wěn)定、高速的有線通信基石,其核心——以太網(wǎng)芯片,正發(fā)揮著至關重要的作用。它不僅負責物理連接,更集成了協(xié)議處理能力,使得各類嵌入式設備能輕松融入網(wǎng)絡。本文將
    的頭像 發(fā)表于 12-09 14:47 ?532次閱讀
    基于<b class='flag-5'>以太網(wǎng)</b>芯片的應用層方案

    NVIDIA擴大與微軟合作推動AI超級工廠建設

    在 Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅(qū)動的全新 Microsoft Fairwater AI 超級工廠中部署新一代 NVIDIA
    的頭像 發(fā)表于 12-01 09:52 ?809次閱讀

    NVIDIA Spectrum-X 以太網(wǎng)交換機助力 Meta 和 Oracle 加速網(wǎng)絡性能

    超大規(guī)模企業(yè)廣泛采用 NVIDIA 網(wǎng)絡解決方案,驅(qū)動十億瓦級(Giga-Scale)高性能 AI 數(shù)據(jù)中心 Meta 推出基于 NVIDIA Sp
    的頭像 發(fā)表于 10-14 10:26 ?1846次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum</b>-X <b class='flag-5'>以太網(wǎng)</b>交換機助力 Meta 和 Oracle 加速<b class='flag-5'>網(wǎng)絡</b><b class='flag-5'>性能</b>

    移植網(wǎng)絡PHY芯片驅(qū)動,如何融入 rt-thread 的網(wǎng)絡體系,并添加新的以太網(wǎng)類型的報文?

    PHY 芯片最底層收發(fā)以太網(wǎng)報文,有可能組成 VLAN 網(wǎng)絡); 我要實現(xiàn)一個新的以太網(wǎng)類型報文(HPGP報文,以太網(wǎng)報文類型為 0x88E1),要求能在應用層收發(fā)該
    發(fā)表于 09-22 06:11

    NVIDIA推出Spectrum-XGS以太網(wǎng)技術

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太網(wǎng)。這項跨區(qū)域擴展(scale-across)技術可將多個分布式數(shù)據(jù)中心組合成一個十億瓦級 AI 超級工廠。
    的頭像 發(fā)表于 08-27 12:51 ?1350次閱讀

    車載網(wǎng)絡測試技術的進化之路#CAN #車載以太網(wǎng) #TSN #時間敏感網(wǎng)絡

    車載以太網(wǎng)
    北匯信息POLELINK
    發(fā)布于 :2025年06月26日 18:12:48

    以太網(wǎng)入門:從零開始,掌握以太網(wǎng)基礎知識!

    以太網(wǎng)作為現(xiàn)代通信技術的基石,其重要性不言而喻。無論是日常網(wǎng)絡應用,還是AI對高速大帶寬網(wǎng)絡的需求,以太網(wǎng)都扮演著不可或缺的角色。本文將從零開始,帶您了解
    的頭像 發(fā)表于 06-09 14:00 ?4117次閱讀
    <b class='flag-5'>以太網(wǎng)</b>入門:從零開始,掌握<b class='flag-5'>以太網(wǎng)</b>基礎知識!

    雙通道CAN轉(zhuǎn)以太網(wǎng)#CAN轉(zhuǎn)以太網(wǎng)#三格電子

    以太網(wǎng)
    三格電子科技
    發(fā)布于 :2025年05月12日 13:17:05

    AD9574以太網(wǎng) 千兆以太網(wǎng)時鐘發(fā)生器技術手冊

    AD9574具有多路輸出時鐘發(fā)生器功能,內(nèi)置專用鎖相環(huán)(PLL)內(nèi)核,針對以太網(wǎng)和千兆以太網(wǎng)線路卡應用進行了優(yōu)化。 整數(shù)N PLL設計基于ADI公司成熟的高性能、低抖動頻率合成器產(chǎn)品系列,確保實現(xiàn)高的
    的頭像 發(fā)表于 04-10 10:43 ?1120次閱讀
    AD9574<b class='flag-5'>以太網(wǎng)</b> 千兆<b class='flag-5'>以太網(wǎng)</b>時鐘發(fā)生器技術手冊

    廣成科技CAN轉(zhuǎn)以太網(wǎng)模塊的作用和應用

    CAN轉(zhuǎn)以太網(wǎng)模塊是一類能夠?qū)AN總線數(shù)據(jù)轉(zhuǎn)換為以太網(wǎng)數(shù)據(jù)的設備,通常用于實現(xiàn)CAN總線與以太網(wǎng)總線之間的互聯(lián)互通。在智能鎖柜和智能文件交換箱中,CAN轉(zhuǎn)以太網(wǎng)模塊可以實現(xiàn)將本地CA
    的頭像 發(fā)表于 03-20 13:58 ?1402次閱讀
    廣成科技CAN轉(zhuǎn)<b class='flag-5'>以太網(wǎng)</b>模塊的作用和應用