91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

破解RDMA網(wǎng)絡(luò)“黑盒”:輕量化會話追蹤工具

星融元Asterfusion ? 2026-02-13 14:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著高性能計算和分布式存儲的快速發(fā)展,基于RoCEv2的RDMA網(wǎng)絡(luò)技術(shù)已在人工智能訓(xùn)練與推理、NVMe-oF存儲、高性能數(shù)據(jù)庫等場景中實現(xiàn)規(guī)模化部署。然而,在享受其低延遲、高吞吐優(yōu)勢的同時,運維人員卻面臨著一個普遍難題:RDMA通信層如同一個“黑盒”,業(yè)務(wù)側(cè)難以透視其在網(wǎng)絡(luò)中的真實路徑與狀態(tài),一旦出現(xiàn)性能下降、擁塞或時延抖動等問題,故障定位往往耗時費力、成本高昂。

RDMA運維之痛:從“看不見”到“難定位”

當(dāng)前,盡管RDMA在協(xié)議棧層面具備源/目的IP、QP(Queue Pair)、通信ID(CID)等多個維度的信息標識,但運維工具往往只能獲取到離散的IP與QPN信息,無法將會話狀態(tài)與網(wǎng)絡(luò)路徑關(guān)聯(lián)。常見的交換機觀測手段,如端口計數(shù)器、PFC/ECN統(tǒng)計、抓包鏡像等,或只能反映局部端口狀態(tài),或需處理海量數(shù)據(jù)且依賴人工分析,難以直接對應(yīng)到具體的RDMA連接。而基于INT或Telemetry的硬件方案又面臨芯片支持、現(xiàn)網(wǎng)改造等諸多門檻。

在此背景下,可視化和會話級追蹤成為RDMA網(wǎng)絡(luò)運維的迫切需求。

RST工具鏈:以CM報文為線索,還原RDMA通信全貌

wKgZO2mOw1GAf_c4AAFhF9ggTc8695.png

EasyRoCE Toolkit中的RST(RDMA Session Tracer),正是為解決上述痛點而生。該工具通過無侵入、輕量化的方式,聚焦于RDMA建連階段的控制面報文——CM(Communication Management)報文,從中提取QPN、CID等關(guān)鍵信息,構(gòu)建RDMA會話的生命周期,并關(guān)聯(lián)到具體交換設(shè)備與端口,最終實現(xiàn)跨設(shè)備的路徑還原。

CM協(xié)議(Communication Management Protocol,通信管理協(xié)議),在本文語境下指的是一種建立于 Infiniband/RoCE 協(xié)議基礎(chǔ)之上的建鏈方式,它有一套專屬的報文格式、交互流程和用戶接口
CM 協(xié)議通過報文的多次往返來建立連接,類似于 TCP 協(xié)議的握手,同時也規(guī)定了斷鏈的方式。
【參考:Savir,https://zhuanlan.zhihu.com/p/494826608】

核心組成:RFT + RPT 雙模塊協(xié)同

wKgZO2mOw3OAKWsrAATv6ahYbuA328.png
  • RFT(RDMA Flow Table):以容器形式部署于每臺交換機,負責(zé)捕獲CM報文、解析會話狀態(tài)、維護流表,并通過4791端口對外提供數(shù)據(jù)。
  • RPT(RDMA Path Table):運行于獨立控制器,匯聚全網(wǎng)流表信息,進行實時路徑計算與可視化呈現(xiàn),最終通過Grafana界面向用戶開放。

部署與使用:一鍵可視,開箱即用

用戶可通過EasyRoCE-AID自動獲取交換機信息,分別安裝 RST 下的子模塊(RFT和FPT)后,即可在Grafana面板中:

  • 查看所有交換機的RFT狀態(tài)并控制啟停;
wKgZO2mOw62AYhBqAAEdP2W6qRI023.pngRST 工具首頁

RST 工具首頁可看到當(dāng)前組網(wǎng)內(nèi)的所有業(yè)務(wù)交換機的列表和功能指示開關(guān),直觀查看和修改交換機上 RFT 容器的啟用和停止狀態(tài)。

  • 查看單設(shè)備的RDMA流表與會話追蹤;
wKgZPGmOxBCAW98hAAFxaqj1IME764.pngRDMA流表信息頁

全局視角查看RDMA會話的完整轉(zhuǎn)發(fā)路徑。

當(dāng)全網(wǎng)設(shè)備都開啟 RFT 功能,點擊 RST 工具首頁左上角的流量路徑按鈕,即可進入 RDMA 流量路徑表信息頁,由此看到全網(wǎng)的 RMDA 通信會話的轉(zhuǎn)發(fā)路徑。

wKgZPGmOxC6AGXG5AADAOqy5YMU733.pngRDMA流量路徑表信息頁

不止于可視:RST的運維價值與行業(yè)意義

RST工具的推出,標志著RDMA網(wǎng)絡(luò)運維從“盲調(diào)”走向“可視”,從“被動響應(yīng)”轉(zhuǎn)向“主動洞察”。它不僅降低了故障定位的時間與人力成本,也為網(wǎng)絡(luò)性能優(yōu)化、容量規(guī)劃、拓撲調(diào)優(yōu)等提供了數(shù)據(jù)支撐。
未來,隨著AI與存儲網(wǎng)絡(luò)進一步向RDMA化演進,具備會話感知能力的網(wǎng)絡(luò)可視化工具有望成為智能運維體系的核心組件。星融元通過RST工具鏈,不僅解決了當(dāng)前運維中的實際難題,也為構(gòu)建下一代可觀測、可診斷、可自愈的高性能網(wǎng)絡(luò)奠定了基礎(chǔ)。

wKgZO2mOxFSABFzcAAIhHFRDK-k010.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    99

    瀏覽量

    9615
  • 運維
    +關(guān)注

    關(guān)注

    1

    文章

    282

    瀏覽量

    8621
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RDMA設(shè)計23:連接管理模塊設(shè)計3

    本文主要交流設(shè)計思路,在本博客已給出相關(guān)博文150多篇,希望對初學(xué)者有用。注意這里只是拋磚引玉,切莫認為參考這就可以完成商用IP設(shè)計。若有NVME或RDMA 產(chǎn)品及項目需求,請看B站視頻后聯(lián)系
    發(fā)表于 01-16 08:30

    RDMA設(shè)計22:連接管理模塊設(shè)計2

    本文主要交流設(shè)計思路,在本博客已給出相關(guān)博文一百多篇,希望對初學(xué)者有用。注意這里只是拋磚引玉,切莫認為參考這就可以完成商用IP設(shè)計。若有NVME或RDMA 產(chǎn)品及項目需求,請看B站視頻后聯(lián)系。 (1
    發(fā)表于 01-14 15:54

    利爾達超小型5G RedCap NR35模組正在重塑輕量化終端連接體驗

    //RedCap(輕量化5G)技術(shù)憑借“降本增效、精準適配”的核心優(yōu)勢,已成為智能穿戴、便攜式終端等輕量化設(shè)備實現(xiàn)5G升級的核心選擇,行業(yè)發(fā)展?jié)摿Τ掷m(xù)釋放。在此浪潮下,利爾達超小型全功能
    的頭像 發(fā)表于 11-21 14:33 ?736次閱讀
    利爾達超小型5G RedCap NR35模組正在重塑<b class='flag-5'>輕量化</b>終端連接體驗

    全IP·輕量化點燃全國現(xiàn)場|千視以實力席卷行業(yè),持續(xù)領(lǐng)跑 AV over IP 的發(fā)展

    隨著AVoverIP技術(shù)的快速普及,各行各業(yè)正邁向全IP化、輕量化的制作升級。千視電子一直走在創(chuàng)新前沿,為行業(yè)提供完整的IP解決方案,讓信號傳輸更穩(wěn)定、制作更高效、協(xié)作更靈活。這個十一月,千視電子
    的頭像 發(fā)表于 11-20 14:45 ?921次閱讀
    全IP·<b class='flag-5'>輕量化</b>點燃全國現(xiàn)場|千視以實力席卷行業(yè),持續(xù)領(lǐng)跑 AV over IP 的發(fā)展

    長城汽車榮獲2025汽車輕量化大會六項大獎

    近日,從2025(第十八屆)汽車輕量化大會傳來消息,長城汽車憑借“新一代超強高性能車身”及系列創(chuàng)新技術(shù),一舉榮獲 6 項大獎,成為同期車身會議和輕量化設(shè)計大賽的“大滿貫”獲獎廠商。
    的頭像 發(fā)表于 09-25 14:27 ?697次閱讀

    無人機飛控輕量化:合粵縮小體電容釋放空間,適配緊湊模組設(shè)計

    近年來,隨著無人機技術(shù)的快速發(fā)展,飛控系統(tǒng)的輕量化設(shè)計成為行業(yè)關(guān)注的焦點。在追求更高性能的同時,如何實現(xiàn)更小的體積、更低的功耗和更強的適應(yīng)性,成為飛控系統(tǒng)設(shè)計中的關(guān)鍵挑戰(zhàn)。合粵電子近期推出的新型飛
    的頭像 發(fā)表于 09-16 15:57 ?580次閱讀
    無人機飛控<b class='flag-5'>輕量化</b>:合粵縮小體電容釋放空間,適配緊湊模組設(shè)計

    解析DCQCN:RDMA在數(shù)據(jù)中心網(wǎng)絡(luò)的關(guān)鍵擁塞控制協(xié)議

    DCQCN ( Data Center Quantized Congestion Notification),數(shù)據(jù)中心量化擁塞通知。它是一種專門為數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)計的端到端擁塞控制協(xié)議。其核心目的是在使用RDMA(RoCEv2)
    的頭像 發(fā)表于 09-15 11:45 ?1860次閱讀
    解析DCQCN:<b class='flag-5'>RDMA</b>在數(shù)據(jù)中心<b class='flag-5'>網(wǎng)絡(luò)</b>的關(guān)鍵擁塞控制協(xié)議

    我國發(fā)布全球首款輕量化重載機器人仿生靈巧手

    8月9日,2025世界機器人大會(WRC)現(xiàn)場,深圳賽博格機器人有限公司正式發(fā)布全球首款輕量化仿生靈巧手Cyborg-H01。這款僅重500克卻能承載10公斤負載的核心部件,一舉打破重載人形機器人
    的頭像 發(fā)表于 08-11 10:08 ?1494次閱讀
    我國發(fā)布全球首款<b class='flag-5'>輕量化</b>重載機器人仿生靈巧手

    靈活、高效,Sub-GHz頻段中的輕量化組網(wǎng)方案

    RFM23A020是一款輕量化組網(wǎng)SoC芯片,支持Sub-GHz無線通信,適用于低功耗、低成本的無線網(wǎng)絡(luò)部署。
    的頭像 發(fā)表于 08-08 15:58 ?1340次閱讀
    靈活、高效,Sub-GHz頻段中的<b class='flag-5'>輕量化</b>組網(wǎng)方案

    下一波輕量化AI+AR眼鏡熱潮將至

    近期,Meta發(fā)布了今年第二季度的財報,2025 年第二季度,Meta Reality Labs共實現(xiàn)了 3.7 億美元的收入,比 2024 年第二季度的 3.53 億美元增長 5%。在這增長背后的主要原因,是輕量化的Ray-Ban Meta眼鏡銷量增長明顯。
    的頭像 發(fā)表于 08-07 17:27 ?2099次閱讀

    輕量化5G網(wǎng)關(guān)和5gredcap網(wǎng)關(guān)有什么區(qū)別

    輕量化5G網(wǎng)關(guān)與5G RedCap網(wǎng)關(guān)本質(zhì)上是同一類技術(shù)的不同表述 ,5G RedCap網(wǎng)關(guān)是輕量化5G網(wǎng)關(guān)的核心實現(xiàn)形式,而輕量化5G網(wǎng)關(guān)是RedCap技術(shù)應(yīng)用的場景化概念。以下從技術(shù)定義、核心
    的頭像 發(fā)表于 06-30 09:19 ?1202次閱讀

    RDMA簡介3之四種子協(xié)議對比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)一的RDMA API,但在具體的網(wǎng)絡(luò)層級實現(xiàn)上有所不同,如圖1所示,接下來將
    發(fā)表于 06-04 16:05

    RDMA簡介2之A技術(shù)優(yōu)勢分析

    隨著數(shù)據(jù)中心對于網(wǎng)絡(luò)帶寬和延遲的要求日益增長,傳統(tǒng)的TCP/IP網(wǎng)絡(luò)已無法滿足性能要求,RDMA網(wǎng)絡(luò)則憑借其高帶寬、低延時的特性脫穎而出。相較于傳統(tǒng)TCP/IP協(xié)議,
    發(fā)表于 06-04 11:35

    RDMA簡介1之RDMA開發(fā)必要性

    總線或高速外設(shè)部件互連總線(PCIe)上,二者均為短距離連接總線,會導(dǎo)致數(shù)據(jù)采集系統(tǒng)的部署位置受限 。遠程直接內(nèi)存訪問技術(shù)(RDMA)是一種專為遠距離網(wǎng)絡(luò)通信設(shè)計的技術(shù),其通常通過光纖進行設(shè)備間連接
    發(fā)表于 06-03 14:38

    基于 HT for Web 的輕量化 3D 數(shù)字孿生數(shù)據(jù)中心解決方案

    ,支持 PC、移動端瀏覽器直接訪問,兼容主流操作系統(tǒng)。 輕量化建模體系 : 支持 CAD、BIM 模型導(dǎo)入,通過幾何簡化、紋理壓縮等算法降低模型復(fù)雜度,適配 Web 端渲染性能。 提供參數(shù)化建模工具,可
    的頭像 發(fā)表于 05-30 14:33 ?874次閱讀
    基于 HT for Web 的<b class='flag-5'>輕量化</b> 3D 數(shù)字孿生數(shù)據(jù)中心解決方案