91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RDMA技術場景和參數優(yōu)化

智能計算芯世界 ? 來源:智能計算芯世界 ? 作者:智能計算芯世界 ? 2022-07-11 11:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RDMA是一種直接內存訪問技術,RDMA 通過網絡把資料直接傳入計算機的存儲區(qū),將數據從一個系統(tǒng)快速移動到遠程系統(tǒng)存儲器中,而不對操作系統(tǒng)造成任何影響,這樣就不需要用到多少計算機的處理功能。它消除了外部存儲器復制和文本交換操作,因而能解放內存帶寬和CPU 周期用于改進應用系統(tǒng)性能。這允許高通量、低延遲的網絡通信,尤其適合在大規(guī)模并行計算機集群中使用。

常見的 RDMA 實現包括 iWARP、RoCE 與 InfiniBand。其中,InfiniBand 是超級計算機最常用的技術,其可以做到 1ms 的延遲及超過 100Gb 每秒的傳輸速率。這對于超大規(guī)模的計算機集群是必要的。超級計算機、人工智能云計算的數據中心都會受益于 InfiniBand 的卓越效能。世界 TOP500 超級計算機(2017年 6 月排行榜)中 36%使用了 InfiniBand 技術。

Mellanox 提供從 HPC(高性能計算中心)、數據中心、WEB2.0、機器學習、云服務器等解決方案,并專門針對目前火熱的人工智能算法進行了架構優(yōu)化。其客戶包括 Facebook、Paypal、NVIDIA、百度、京東、騰訊等。

E級超算已經成為世界各國在超算領域追逐的新目標。目前,由江南計算所、國防科大和中科曙光公司根據不同技術路線研制的三臺 E 級原型系統(tǒng)已經完成并分別安裝在濟南、天津和深圳國家超級計算中心。據 Hyperion Research 公司按照系統(tǒng)驗收的時間估算,2021 至 2026 年期間,全球將建成 28~38 臺 E 級或接近 E 級的超級計算機,總價值約在 100~150 億美元。

1afa7050-00c2-11ed-ba43-dac502259ad0.png

在實現上,RDMA 實際上是一種智能網卡與軟件架構充分優(yōu)化的遠端內存直接高速訪問技術,通過將 RDMA 協(xié)議固化于硬件(即網卡)上,以及支持 Zero-copy和 Kernel bypass 這兩種途徑來達到其高性能的遠程直接數據存取的目標。其通信過程使得用戶在使用 RDMA 時具備如下優(yōu)勢:

? 零拷貝(Zero-copy) - 應用程序能夠直接執(zhí)行數據傳輸,在不涉及到網絡軟件棧的情況下。數據能夠被直接發(fā)送到緩沖區(qū)或者能夠直接從緩沖區(qū)里接收,而不需要被復制到網絡層。

? 內核旁路(Kernel bypass) - 應用程序可以直接在用戶態(tài)執(zhí)行數據傳輸,不需要在內核態(tài)與用戶態(tài)之間做上下文切換。

? 不需要 CPU 干預(No CPU involvement) - 應用程序可以訪問遠程主機內存而不消耗遠程主機中的任何 CPU。遠程主機內存能夠被讀取而不需要遠程主機上的進程(或 CPU)參與。遠程主機的 CPU 的緩存(cache)不會被訪問的內存內容所填充。

? 消息基于事務(Message based transactions) - 數據被處理為離散消息而不是流,消除了應用程序將流切割為不同消息/事務的需求。

? 支持分散/聚合條目(Scatter/gather entries support) - RDMA 原生態(tài)支持分散/聚合。也就是說,讀取多個內存緩沖區(qū)然后作為一個流發(fā)出去或者接收一個流然后寫入到多個內存緩沖區(qū)里去。

目前,RDMA 技術在超算、AI 訓練、存儲等多個高性能場景大量部署,已形成廣泛應用。但是 RDMA 技術路線也有很多,用戶及各家廠商對于 RDMA 技術路線的選擇也不盡相同。

在三種主流的 RDMA 技術中,可以劃分為兩大陣營。一個是 IB 技術, 另一個是支持 RDMA 的以太網技術(RoCE 和 iWARP)。其中,IBTA 主要聚焦 IB 和 RoCE 技術,而 iWARP 則是在 IEEE/IETF 標準化的技術。

在存儲領域,支持 RDMA 的技術早就存在,比如SRP(SCSI RDMA Protocol)和iSER(iSCSI Extensions for RDMA)。如今興起的 NVMe over Fabrics 如果使用的不是 FC 網絡的話,本質上就是 NVMeover RDMA。換句話說,NVMe over InfiniBand, NVMe over RoCE 和 NVMe over iWARP 都是 NVMe over RDMA。

1、總線級數據中心網絡技術白皮書.pdf

2、RDMA提高數據傳輸效率.pdf

3、配置 InfiniBand 和 RDMA 網絡.pdf

4、華為RDMA.pdf

5、面向AI智能無損數據中心網絡.pdf

6、面向分布式 AI智能網卡低延遲Fabric技術.pdf

7、NVMe存儲SPDK 加速前后端 IO.pdf

8、基于RDMA多播機制的分布式持久性內存文件系統(tǒng).pdf

9、云環(huán)境下分布式存儲性能優(yōu)化實踐.pdf

《RDMA技術合集(上)》

1、智能網卡低延遲Fabric技術.pdf

2、RDMA參數選擇.pdf

3、RDMA在數據中心中的應用研究.pdf

4、RDMA系統(tǒng)的挑戰(zhàn).pdf

5、RDMA網絡人工智能訓練重要硬件

6、RDMA技術白皮書(中文版)

7、RDMA技術調研

8、RDMA在數據中心中的應用研究

1b1870fa-00c2-11ed-ba43-dac502259ad0.png

1b299308-00c2-11ed-ba43-dac502259ad0.png

1b3ac83a-00c2-11ed-ba43-dac502259ad0.png

1b4b858a-00c2-11ed-ba43-dac502259ad0.png

1b6613b4-00c2-11ed-ba43-dac502259ad0.png

1b7aaa72-00c2-11ed-ba43-dac502259ad0.png

1b8e0c98-00c2-11ed-ba43-dac502259ad0.png

1b9da96e-00c2-11ed-ba43-dac502259ad0.png

1bb4e7f0-00c2-11ed-ba43-dac502259ad0.png

1bc7ba88-00c2-11ed-ba43-dac502259ad0.png

1bd7793c-00c2-11ed-ba43-dac502259ad0.png

1bec466e-00c2-11ed-ba43-dac502259ad0.png

1bfa5628-00c2-11ed-ba43-dac502259ad0.png

1c0cbd40-00c2-11ed-ba43-dac502259ad0.png

1c22b8e8-00c2-11ed-ba43-dac502259ad0.png

1c3fdacc-00c2-11ed-ba43-dac502259ad0.png

1c580d40-00c2-11ed-ba43-dac502259ad0.png

1c6e438a-00c2-11ed-ba43-dac502259ad0.png

1c8270c6-00c2-11ed-ba43-dac502259ad0.png

1c9f9688-00c2-11ed-ba43-dac502259ad0.png

1cb32734-00c2-11ed-ba43-dac502259ad0.png

1cbdb906-00c2-11ed-ba43-dac502259ad0.png

1cdaf070-00c2-11ed-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關注

    關注

    39

    文章

    7739

    瀏覽量

    171720
  • 機器學習
    +關注

    關注

    66

    文章

    8554

    瀏覽量

    136996
  • RDMA
    +關注

    關注

    0

    文章

    99

    瀏覽量

    9624

原文標題:RDMA技術場景和參數優(yōu)化

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RDMA設計35:基于 SV 的驗證平臺

    本博文主要交流設計思路,在本博客已給出相關博文100多篇,希望對初學者有用。相關博文煩請查閱本博客文章及經驗貼: 博文xianuser2012的文章_可編程邏輯,移動通信,教師 - 電子技術
    發(fā)表于 02-01 13:14

    RDMA設計4:技術需求分析2

    專注高性能存儲與傳輸,希望對初學者有用。注意這里只是拋磚引玉,切莫認為參考這就可以完成商用IP設計。若有NVME或RDMA 產品及項目需求,請看B站視頻后聯(lián)系。 根據IP適用性技術需求分析,總結
    發(fā)表于 11-24 09:09

    RDMA設計3:技術需求分析1

    在FPGA上部署RDMA IP,一般用于高速射頻信號數據采集工作。它既要滿足對于通用大數據的實時高速傳輸要求,也需要滿足對于多路信號的數據整合需求??紤]到數據采集前端數據量大、數據產生速率快、采樣
    發(fā)表于 11-21 09:02

    RDMA設計2:開發(fā)必要性之性能簡介

    RDMA 產品及項目需求,請看B站視頻后聯(lián)系。 基于本IP設計,經過優(yōu)化后得出如下性能指標及資源占用率: 1 性能指標 2 不同包模式下性能 3占用資源
    發(fā)表于 11-20 10:57

    RDMA設計1:開發(fā)必要性1之設計考慮

    解決 FPGA 系統(tǒng)存儲容量不足已成為亟待解決的問題。 遠程直接內存訪問技術RDMA) 是一種專為遠距離網絡通信設計的技術, 其通常通過光纖進行設備間連接, 提供高通量、 低延遲、 遠距離的零拷?網絡
    發(fā)表于 11-19 14:30

    RDMA over RoCE V2設計1:通用,穩(wěn)定及高性能!

    # 設計目標: RDMA技術采用無感傳輸機制,消除傳統(tǒng)網絡傳輸中需要CPU介入下的多重數據復制與內核參與環(huán)節(jié),實現直接跨主機內存訪問的機制。其設計目標為優(yōu)化分布式環(huán)境下的數據傳輸效率,降低CPU負載
    發(fā)表于 08-05 17:53

    RDMA over RoCE V2設計1:為什么要設計它?

    基于PC-PC或GPU-GPU之間RDMA設計已有較多廠商投入,雖然有的大廠投入幾年后折羽而歸,但不影響PC領域成熟應用產品的推廣。這里主要討論在FPGA上設計RDMA over RoCE V2,雖然已有xilinx的ernic應用,但是性價比以及國產化需求還是有其發(fā)展空
    的頭像 發(fā)表于 07-15 10:58 ?696次閱讀
    <b class='flag-5'>RDMA</b> over RoCE V2設計1:為什么要設計它?

    RDMA over RoCE V2設計1:通用,穩(wěn)定及高性能!

    一)設計目標: RDMA技術采用無感傳輸機制,消除傳統(tǒng)網絡傳輸中需要CPU介入下的多重數據復制與內核參與環(huán)節(jié),實現直接跨主機內存訪問的機制。其設計目標為優(yōu)化分布式環(huán)境下的數據傳輸效率,降低CPU負載
    發(fā)表于 07-15 10:54

    如何優(yōu)化可編程電源控制環(huán)路參數

    環(huán)路帶寬;若過沖過大(>8%),可增加補償電阻RCOMP?降低環(huán)路增益。 五、高級優(yōu)化技術:應對復雜場景 非線性補償 分段補償:針對不同負載范圍(如輕載、重載)設計不同的補償參數
    發(fā)表于 07-02 15:56

    RDMA簡介3之四種子協(xié)議對比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)一的RDMA API,但在具體的網絡層級實現上有所不同,如圖1所示,接下來將
    發(fā)表于 06-04 16:05

    RDMA簡介2之A技術優(yōu)勢分析

    隨著數據中心對于網絡帶寬和延遲的要求日益增長,傳統(tǒng)的TCP/IP網絡已無法滿足性能要求,RDMA網絡則憑借其高帶寬、低延時的特性脫穎而出。相較于傳統(tǒng)TCP/IP協(xié)議,RDMA具有零拷貝、不需要CPU
    發(fā)表于 06-04 11:35

    RDMA簡介1之RDMA開發(fā)必要性

    總線或高速外設部件互連總線(PCIe)上,二者均為短距離連接總線,會導致數據采集系統(tǒng)的部署位置受限 。遠程直接內存訪問技術RDMA)是一種專為遠距離網絡通信設計的技術,其通常通過光纖進行設備間連接
    發(fā)表于 06-03 14:38

    VirtualLab 應用:傾斜光柵的參數優(yōu)化及公差分析

    ,也稱為RCWA)對傾斜光柵的優(yōu)化方法。優(yōu)化后的光柵的衍射效率超過90%。此外,還研究了其對光柵的傾角偏差和圓角邊緣的影響。 建模任務 **優(yōu)化 ** 為了為傾斜光柵找到一組優(yōu)化
    發(fā)表于 05-22 08:52

    取樣示波器的技術原理和應用場景

    負責對輸入信號進行采樣和保持,采樣速率決定了示波器的帶寬。應用場景 信號處理:取樣示波器能夠精確地捕捉和分析信號的波形和參數,幫助工程師更好地理解和優(yōu)化信號處理系統(tǒng)。 通信領域:在通信系統(tǒng)中,取樣示波器
    發(fā)表于 03-12 14:34

    頻域示波器的技術原理和應用場景

    頻域示波器,其主要技術原理基于信號的傅里葉變換理論,通過快速傅里葉變換(FFT)算法將時域信號轉換為頻域信號,從而進行頻譜分析。以下是對頻域示波器的技術原理和應用場景的詳細分析:一、技術
    發(fā)表于 03-11 14:37