91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力Axio團隊打造全新DPU數據面開發(fā)框架

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-08-30 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創(chuàng)新突破。

黃昕陽、劉博文、任正行、張云軒、劉翔洲組成的 Axio 團隊在本屆黑客松中展現出卓越的技術實力,其創(chuàng)新項目“面向DPU 加速的業(yè)務的高性能數據面開發(fā)框架”,榮獲第三名。該項目通過系統化的設計原則和編程接口,有效突破了傳統數據面開發(fā)方法的性能瓶頸,顯著提升了 DPU 程序的開發(fā)效率。

DPU 數據面開發(fā)框架的創(chuàng)新設計與實現

在現代數據中心網絡中,DPU 的硬件架構為高性能數據處理提供了新的可能性,然而傳統的開發(fā)方法難以充分發(fā)揮其潛力?;谝酝?DPU 的開發(fā)經驗,Axio 團隊發(fā)現 DPU 數據面和 CPUGPU 數據面的設計原則存在顯著差異,采用傳統的數據面設計方法開發(fā) DPU 加速的應用程序會導致性能下降。基于這一問題,Axio 團隊提出了一套全新的 DPU 數據面開發(fā)框架。該框架系統化了 DPU 硬件架構的設計原則,開發(fā)出相應的編程接口和運行時框架,從而顯著提升了 DPU 加速的應用程序的性能。

從需求分析到技術實現的全過程中,Axio 團隊展現了扎實的專業(yè)知識和高效的協作能力。

攻克底層難題,實現性能提升

在開發(fā)過程中,團隊面臨的核心挑戰(zhàn)來自于底層編程庫的“無人區(qū)”。由于框架開發(fā)涉及最底層的編程庫(如 librdma 和 flexio),網絡上幾乎找不到可參考的案例,團隊遇到的每一個 bug 都像一道需要原創(chuàng)解法的高數題。

“每次遇到問題,我們都需要花費大量時間排查?!秉S昕陽解釋道。依托 DOCA 社區(qū)的幫助,團隊仔細閱讀底層代碼庫的文檔,逐步驗證每一個 API 調用的正確性。此外,團隊還編寫了一些示例來驗證 DPU 的配置的合理性。最終,成功解決了這些問題,構建出高性能的數據面框架,為后續(xù)開發(fā)防火墻、虛擬交換機等功能奠定了基礎。

對未來數據中心網絡的展望

本次項目的創(chuàng)新之處在于其系統化的設計原則和高性能的編程接口。Axio 團隊的框架不僅解決了 DPU 開發(fā)中的性能瓶頸,還為未來數據中心網絡的高效運行提供了新的可能性。展望未來,團隊計劃結合 NVIDIA DOCA 軟件框架和 NVIDIA BlueField-3 DPU 強大的硬件特性,繼續(xù)深入探索 DPU 在 AI 和云場景中的更多應用,例如加速終端內部的數據搬運和協議棧處理,實現終端負載均衡。

談及未來 DPU 領域的發(fā)展前景,黃昕陽指出:“在 AI 時代,DPU 憑借其獨特的生態(tài)位展現出巨大潛力——不僅能作為加速器優(yōu)化 GPU 間通信,還可以充當控制器實現以 AI 為中心的智能組網,這讓我對 DPU 的未來充滿信心。”

DOCA 開發(fā)者快問快答

Q

您是從哪里了解到 NVIDIA DPU 黑客松競賽的?參賽的目標是什么?

A

我們通過NVIDIA 官方微信公眾號了解到本次競賽。參賽的核心目標是與其他同行交流,聽取大家對我們項目的建議,同時提升我們在 DPU 開發(fā)領域的技術能力。

Q

賽前舉辦的 DPU 線上技術訓練營對您的備賽起到哪些幫助?

A

訓練營讓我們對 DPU 開發(fā)庫有了更全面的了解,也提供了與 NVIDIA 專家直接溝通的機會,幫助我們少走了許多彎路。

Q

參與 NVIDIA DPU 黑客松競賽有哪些收獲?

A

最大的收獲是與同行交流,解決了一些項目遺留的問題。例如,在實現 DPA 處理 RDMA 流時,我們通過交流發(fā)現并糾正了 DPU 配置中的錯誤,順利完成了后續(xù)開發(fā)。

Q

您是從什么渠道了解到 NVIDIA DOCA 的?什么契機使您成為 DOCA 開發(fā)者?

A

作為網絡研究領域的博士生,我們一直關注最新的網絡設備。DPU 是網絡研究的重要工具,而 DOCA 簡化了 DPU 開發(fā)流程,因此成為 DOCA 開發(fā)者也是一種必然。最早在 2022 年接觸 DOCA 時,我主要研究 BlueField-2 DPU 的 RDMA 可編程化應用。隨著 BlueField-3 DPU 的發(fā)布,我便轉向探索 DPU 在數據加速和 AI 負載均衡的應用,這促使我們參加黑客松以尋求更多技術交流。

Q

最初從事 DOCA 開發(fā)時,有具體明確的目標嗎?

A

最初的目標是探索 DPU 在高速網絡中的生態(tài)位,研究其能否加速 CPU/GPU 網絡 I/O。后來逐漸轉向 DPU OS 的優(yōu)化和特定應用的數據面框架開發(fā)。這些都是服務于網絡系統的研究。

Q

過往有其他成功的 DOCA 開發(fā)經歷嗎?

A

最近我們用 DPU 和 DOCA 實現了對 CPU I/O 通信中的 L3 緩存資源的優(yōu)化,也作為成果發(fā)表在 ACM SIGCOMM 中。這個項目重點使用 DPU 中的 DPA 和 Arm 核心作為網絡 I/O 通信的控制器,在網絡數據流進入 L3 緩存前預先調速,防止 L3 緩存出現溢出;并且利用 DPU 片上 DRAM 資源去預防網絡 burst 等場景。

我認為 DPU 和 DOCA 是實現學術想法的一個的理想工具,其一是 DPU 具備強大的性能支撐,可提供高達 400Gbps 的網絡帶寬;其二是 DOCA 框架大幅降低了開發(fā)門檻,特別是 DPA 核的引入使得功能開發(fā)更加完備,相比傳統 FPGA 開發(fā)方式顯著提升了效率。

Q

成為 DOCA 開發(fā)者對未來職業(yè)發(fā)展有何幫助?

A

成為 DOCA 開發(fā)者也可以參與到現在最熱門的 AI 數據中心的網絡研究中,這大大提升未來就業(yè)的競爭力。

Q

NVIDIA DOCA 中國開發(fā)者社區(qū)對你們有何幫助?

A

社區(qū)提供了豐富的技術資源和友好的交流環(huán)境,幫助我們解決了許多開發(fā)中的難題,也讓我們能夠與其他開發(fā)者分享經驗。

開發(fā)者寄語

“高性能網絡是現代數據中心的基石,也是最具挑戰(zhàn)性的領域之一。我們希望更多志同道合的朋友加入進來,成為 DOCA 開發(fā)者,共同為下一代 AI 和云數據中心的網絡技術貢獻力量。”

——Axio 團隊隊長 黃昕陽

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109725
  • 網絡
    +關注

    關注

    14

    文章

    8265

    瀏覽量

    94741
  • DPU
    DPU
    +關注

    關注

    0

    文章

    414

    瀏覽量

    26968

原文標題:開發(fā)者故事 | 構建高性能 DPU 數據面開發(fā)框架

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA全新開放物理AI模型和框架加速人形機器人開發(fā)

    本文是洞悉 Omniverse 系列文章?!岸聪?Omniverse”重點介紹開發(fā)者、3D 從業(yè)者與企業(yè)如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進展從根本上變革他們的工作流程。
    的頭像 發(fā)表于 02-06 15:36 ?476次閱讀

    NVIDIA Jetson系列開發(fā)者套件助力打造面向未來的智能機器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發(fā)者套件,助力打造面向未來的智能機器人。
    的頭像 發(fā)表于 12-13 10:20 ?3058次閱讀

    NVIDIA推出面向語言、機器人和生物學的全新開源AI技術

    NVIDIA 秉持對開源的長期承諾,推出了面向語言、機器人和生物學的全新開源 AI 技術,為構建開源生態(tài)系統做出貢獻,擴展 AI 的普及并推動創(chuàng)新。NVIDIA 正將這些模型、數據和訓
    的頭像 發(fā)表于 11-06 11:49 ?1067次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和
    的頭像 發(fā)表于 11-03 14:48 ?979次閱讀

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標是突破 NVIDIA 平臺上的推理性能瓶頸。為實現這一目標,其構建了多維度的核心實現路徑:一
    的頭像 發(fā)表于 10-21 11:04 ?1170次閱讀

    NVIDIA 利用全新開源模型與仿真庫加速機器人研發(fā)進程

    科研人員及開發(fā)打造功能更強大、適應性更強的機器人。 ? 全新NVIDIA Isaac GR00T 開源基礎模型將為機器人賦予接近人類的推理能力,使其能夠拆解復雜指令,并借助已有知
    的頭像 發(fā)表于 09-30 09:52 ?3070次閱讀
    <b class='flag-5'>NVIDIA</b> 利用<b class='flag-5'>全新</b>開源模型與仿真庫加速機器人研發(fā)進程

    基于NVIDIA BlueField DPU的5G UPF數據加速方案

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領
    的頭像 發(fā)表于 09-04 11:26 ?1213次閱讀

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個模塊化平臺,使用高級 API 和微服務來構建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應用。OpenUSD 功能強大的 3D 框架
    的頭像 發(fā)表于 08-22 15:52 ?3715次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension<b class='flag-5'>開發(fā)</b>秘籍

    利用NVIDIA DPU重塑網絡安全格局

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領
    的頭像 發(fā)表于 08-20 14:31 ?1336次閱讀

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了 NVIDIA BlueFie
    的頭像 發(fā)表于 07-04 14:27 ?1237次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點解析

    第三屆NVIDIA DPU黑客松開啟報名

    第三屆 NVIDIA DPU 中國虛擬黑客松(Hackathon)將于 6 月 28 日 - 6 月 30 日正式開啟!作為備受廣大開發(fā)者期待的年度賽事,它將提供與 NVIDIA 加速
    的頭像 發(fā)表于 05-27 10:16 ?900次閱讀

    NVIDIA推出NVLink Fusion技術

    NVIDIA 發(fā)布 NVIDIA NVLink Fusion,這款全新芯片將助力行業(yè)用戶通過全球領先且廣泛采用的計算互連架構 —— NVIDIA
    的頭像 發(fā)表于 05-22 09:59 ?880次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務就緒型基礎,助力構建能夠獨立工作或以團隊形式完成復雜
    發(fā)表于 03-19 09:31 ?390次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 AI 模型系列,<b class='flag-5'>助力</b><b class='flag-5'>開發(fā)</b>者和企業(yè)構建代理式 AI 平臺

    NVIDIA 發(fā)布全球首個開源人形機器人基礎模型 Isaac GR00T N1——并推出加速機器人開發(fā)的仿真框架

    18 日 ——NVIDIA 今日宣布推出一系列全新技術,助力人形機器人開發(fā)。其中包括全球首個開源且完全可定制的基礎模型 NVIDIA Is
    發(fā)表于 03-19 09:30 ?719次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全球首個開源人形機器人基礎模型 Isaac GR00T N1——并推出加速機器人<b class='flag-5'>開發(fā)</b>的仿真<b class='flag-5'>框架</b>

    IAR發(fā)布云端平臺,助力現代嵌入式軟件開發(fā)團隊

    該平臺為嵌入式軟件開發(fā)人員提供前所未有的自由度與靈活性,助力開發(fā)團隊在工具選擇和日常工作流中實現更高效的協作與創(chuàng)新。
    的頭像 發(fā)表于 03-12 11:56 ?810次閱讀