91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用DPDK和NVIDIA DOCA庫開發(fā)應(yīng)用程序

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Anuradha Karuppiah ? 2022-04-11 17:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在這篇文章中,我將帶您了解 FRR DOCA 數(shù)據(jù)平面插件的創(chuàng)建過程,并向您展示如何使用全新的 DOCAflow 庫卸載 PBR 規(guī)則。在上一篇文章中,您了解了使用 DPDK rte_flow 庫創(chuàng)建 FRR 數(shù)據(jù)平面插件,以加速 BlueField 上的 PBR 規(guī)則。

向 Zebra 添加 DOCA 數(shù)據(jù)平面插件

我仍然使用 DPDK API 進行硬件初始化,但隨后使用 DOCAflow API 來設(shè)置數(shù)據(jù)平面流管道。為此,我必須將 DPDK (libdpdk.pc)和 DOCAflow(doca-flow.pc)共享庫鏈接到 DOCA 數(shù)據(jù)平面插件。

root@dpu-arm:~# export PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/opt/mellanox/dpdk/lib/aarch 
64-linux-gnu/pkgconfig 
root@dpu-arm:~# pkg-config --libs doca-flow 
-ldoca_flow 
root@dpu-arm:~# pkg-config --cflags doca-flow 
-DALLOW_EXPERIMENTAL_API -include rte_config.h -mcpu=cortex-a72 -DALLOW_EXPERIMENTAL_API -I/opt/mellanox/dpdk/include/dpdk -I/opt/mellanox/dpdk/include/dpdk/../aarch64-linux-gnu/dpdk -I/opt/mellanox/dpdk/include/dpdk -I/usr/include/libnl3 
root@dpu-arm:~# 

我在 FRR makefile (configure.ac)中為 DPDK 和 DOCAflow添加了pkg check-and-define宏。

if test "$enable_dp_doca" = "yes"; then 
 PKG_CHECK_MODULES([DOCA], [libdpdk doca-flow], [ 
 AC_DEFINE([HAVE_DOCA], [1], [Enable DOCA backend]) 
 DOCA=true 
 ], [ 
 AC_MSG_ERROR([configuration specifies --enable-dp-doca but DOCA libs were not found]) 
 ]) 
fi

我將 DPDK 和 DOCAflow庫及cflags都包含在zebra-dp-doca make宏(zebra/subdir.am)中。

zebra_zebra_dplane_doca_la_CFLAGS = $(DOCA_CFLAGS) 
zebra_zebra_dplane_doca_la_LIBADD = $(DOCA_LIBS) 

使用/etc/frr/daemons啟動 FRR 服務(wù)時,可以啟用 DOCA 數(shù)據(jù)平面插件。

zebra_options= " -M dplane_doca -A 127.0.0.1"

硬件初始化和端口映射

使用 DPDK API 、rte_eal_initrte_eth_dev_info_get初始化硬件,并設(shè)置 Zebra 接口到 DPDK 端口映射。此工作流與上一節(jié)中的 DPDK 數(shù)據(jù)平面插件相同。

root@dpu-arm:~# vtysh -c "show dplane doca port" 
Total ports: 6 cores: 8 
Port Device IfName IfIndex sw,domain,port 
0 0000:03:00.0 p0 4 0000:03:00.0,0,65535 
1 0000:03:00.0 pf0hpf 6 0000:03:00.0,0,4095 
2 0000:03:00.0 pf0vf0 15 0000:03:00.0,0,4096 
3 0000:03:00.0 pf0vf1 16 0000:03:00.0,0,4097 
4 0000:03:00.1 p1 5 0000:03:00.1,1,65535 
5 0000:03:00.1 pf1hpf 7 0000:03:00.1,1,20479 
root@dpu-arm:~#

DOCAflow初始化

為了使用doca-flow編寫 PBR 規(guī)則,我必須初始化doca-flowdoca-flow-port數(shù)據(jù)庫。此初始化是在使用rte_eal_init初始化硬件后完成的。

我使用doca_flow_init通過配置流和隊列計數(shù)來初始化doca-flow庫。

struct doca_flow_cfg  flow_cfg; 

memset(&flow_cfg, 0, sizeof(flow_cfg)); 
flow_cfg.total_sessions = ZD_DOCA_FLOW_MAX; 
flow_cfg.queues = doca_ctx->nb_cores;  doca_flow_init (&flow_cfg, &err); 

當(dāng)我使用 DPDK 設(shè)置硬件端口時,我必須使用dpdk_port-id將它們安裝到doca-flow-port數(shù)據(jù)庫中。

struct doca_flow_port_cfg  port_cfg; 

 memset(&port_cfg, 0, sizeof(port_cfg)); 
port_cfg.port_id = dpdk_port_id; 
port_cfg.type = DOCA_FLOW_PORT_DPDK_BY_ID; 
snprintf(port_id_str, ZD_PORT_STR_MAX, "%u", port_cfg.port_id); 
port_cfg.devargs = port_id_str; 

doca_port =  doca_flow_port_start (&port_cfg, &err);

使用 doca-flow API 編寫 PBR 規(guī)則

通過一系列用于匹配、動作、轉(zhuǎn)發(fā)和監(jiān)控屬性的數(shù)據(jù)結(jié)構(gòu)來對 DOCA 流進行編程。

struct doca_flow_match  match, match_mask; 
struct  doca_flow_actions  actions; 
struct  doca_flow_fwd  fwd; 
struct doca_flow_monitor  monitor;

流匹配

這被指定為匹配和匹配掩碼。匹配掩碼是可選的,如果未指定,則由doca-flow庫自動填充。

memset(&match, 0, sizeof(match)); 
memset(&match_mask, 0, sizeof(match_mask));  

match.out_src_ip.type = DOCA_FLOW_IP4_ADDR; 
match.out_src_ip.ipv4_addr = src_ip; 
match_mask.out_src_ip.ipv4_addr = src_ip_mask; 

match.out_dst_ip.type = DOCA_FLOW_IP4_ADDR; 
match.out_dst_ip.ipv4_addr = dst_ip; 
match_mask.out_src_ip.ipv4_addr = dst_ip_mask; 
 
match.out_l4_type = ip_proto;  
 
match.out_src_port = RTE_BE16 (l4_src_port); 
match_mask.out_src_port = UINT16_MAX; 

match.out_dst_port = RTE_BE16 (l4_dst_port); 
match_mask.out_dst_port = UINT16_MAX; 

我跳過了填充etheth-mask等字段。這是因為doca-flow庫可以基于其他匹配字段dst_ipsrc_ip自動將此類字段填充到RTE_ETHER_TYPE_IPV4RTE_ETHER_TYPE_IPV6

流動作

為了路由數(shù)據(jù)包,我必須將目標(biāo) MAC 地址更改為網(wǎng)關(guān)( leaf2 ) MAC ,減少 TTL ,并更改源 MAC 地址。這一點最初在上一篇文章中討論,使用 NVIDIA BlueField DPU 和 DPDK 開發(fā)應(yīng)用程序.

memset(&actions, 0, sizeof(actions));   actions.dec_ttl = true; 
 memcpy(actions.mod_src_mac, uplink_mac, DOCA_ETHER_ADDR_LEN); 
 memcpy(actions.mod_dst_mac, gw_mac, DOCA_ETHER_ADDR_LEN); 

流轉(zhuǎn)發(fā)

然后,我將輸出端口設(shè)置為上行鏈路。

memset(&fwd, 0, sizeof(fwd)); 
 
fwd.type = DOCA_FLOW_FWD_PORT; 
fwd.port_id = out_port_id; 

流監(jiān)控

我設(shè)置了流量計數(shù)器進行故障排除。

memset(&monitor, 0, sizeof(monitor));  monitor.flags |= DOCA_FLOW_MONITOR_COUNT; 

DOCA流管道和入口

流程創(chuàng)建分為兩步:

創(chuàng)建流管道。

將流條目添加到流管道。

第一步是為查找階段創(chuàng)建軟件模板。第二步使用模板在硬件中的流進行編程。

當(dāng)您必須對許多類似的流進行編程時,管道非常有用。對于這種情況,可以設(shè)置單個匹配模板(管道),并指示在創(chuàng)建流條目時必須更新哪個匹配字段(例如,第 4 層目標(biāo)端口)。后續(xù)的流條目只需要 填充與管道(第 4 層目標(biāo)端口)不同的匹配字段。

對于 PBR ,每個流模式都是唯一的,所以我使用已經(jīng)填充的流屬性為每個 PBR 規(guī)則創(chuàng)建了一個單獨的管道和條目。

struct doca_flow_pipe_cfg  pipe_cfg;  

pipe_cfg.name = "pbr"; 
pipe_cfg.port = in_dport->doca_port; 
pipe_cfg.match = &match; 
pipe_cfg.match_mask = &match_mask; 
pipe_cfg.actions = &actions; 
pipe_cfg.monitor = &monitor; 
pipe_cfg.is_root = true;  

flow_pipe =  doca_flow_create_pipe (&pipe_cfg, &fwd, NULL, &err); 
flow_entry =  doca_flow_pipe_add_entry (0, flow_pipe, &match, &actions, &monitor, &fwd, &err);

流刪除

流管道和條目創(chuàng)建 API 返回管道和流指針,這些指針必須被緩存以供后續(xù)刪除。

 doca_flow_pipe_rm_entry( 0, flow_entry); 
 doca_flow_destroy_pipe (port_id, flow_pipe); 

流統(tǒng)計

在創(chuàng)建流時,我設(shè)置了DOCA_FLOW_MONITOR_COUNT標(biāo)志。我使用doca_flow_query查詢了流統(tǒng)計數(shù)據(jù)。

struct  doca_flow_query query ; 

// hit counters – query.total_pkts and query.total_bytes 
memset(&query, 0, sizeof(query)); 
 doca_flow_query (flow_entry, &query); 

驗證硬件加速

FRR-PBR 規(guī)則配置和流量生成與dpdk-plugin相同。流量按預(yù)期由 DPU 硬件轉(zhuǎn)發(fā),并可使用流計數(shù)器進行驗證。

root@dpu-arm:~# vtysh -c "show dplane doca pbr flow" 
Rules if pf0vf0 
 Seq 1 pri 300 
 SRC IP Match: 172.20.0.8/32 
 DST IP Match: 172.30.0.8/32 
 IP protocol Match: 17 
 DST Port Match: 53 
 Tableid: 10000 
 Action: nh: 192.168.20.250 intf: p0 
 Action: mac: 00:00:5e:00:01:fa 
 DOCA flow: installed 0xffff28005150 
 DOCA stats: packets 202 bytes 24644 
root@dpu-arm:~# 

還可以使用硬件條目進行驗證:

root@dpu-arm:~# ~/mlx_steering_dump/mlx_steering_dump_parser.py -p `pidof zebra` - 
f /tmp/dpdkDump 
domain 0xe294002, table 0xaaab07648b10, matcher 0xffff28012c30, rule 0xffff28014040 
 match: outer_l3_type: 0x1, outer_ip_dst_addr: 172.30.0.8, outer_l4_type: 0x2, metadata_reg_c_0: 0x00030000, outer_l4_dport: 0x0035, outer_ip_src_addr: 172.20.0.8 
 action: MODIFY_HDR(hdr(dec_ip4_ttl)), rewrite index 0x0 & VPORT, num 0xffff & CTR(hits(352), bytes(42944)), index 0x806200

通過使用doca-flow,F(xiàn)RR 現(xiàn)在具有了第二個數(shù)據(jù)平面插件,可用于 PBR 規(guī)則的硬件加速。

應(yīng)程序開發(fā)要點

在本系列文章中,您了解了如何使用rte_flow或doca_flow通過四個步驟對 DPU 網(wǎng)絡(luò)應(yīng)用程序進行硬件加速:

將 DOCA / DPDK 庫鏈接到應(yīng)用程序。

初始化硬件。

設(shè)置應(yīng)用程序到硬件端口的映射。

用于引導(dǎo)流量的流編程。

隨著越來越多的元素卸載到DPU 上,及源代碼行( SLOC )的增加,開發(fā)過程可能會變得復(fù)雜。而這正是 DOCA 抽象庫可以幫助解決的:

DOCA 附帶了幾個內(nèi)置庫,如doca-dpi、 gRPC 、 Firefly 時間同步等。這些庫支持應(yīng)用程序的快速即插即用。

DOCA 構(gòu)建(如doca_pipe)使您能夠模板化管道,消除樣板代碼并優(yōu)化流插入。

即將推出的 DOCA 庫,如硬件加速的 LPM (最長前綴匹配),使構(gòu)建交換機管道變得更容易。這與您在本系列文章中看到的示例應(yīng)用程序 FRR 尤其相關(guān), FRR 通常用于使用 BGP 構(gòu)建 LPM 路由表(或 RIB )。

借助 DOCA ,您還可以在融合加速器上的 GPU 和 DPU 上實現(xiàn)令人激動的開發(fā)體驗。

關(guān)于作者

Anuradha Karuppiah 是 NVIDIA 網(wǎng)絡(luò)的首席軟件工程師。 Anuradha 使用 FRR (自由范圍路由軟件套件)設(shè)計和實現(xiàn) EVPN 解決方案。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5598

    瀏覽量

    109811
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于NVIDIA Isaac開發(fā)的機器人調(diào)酒師ADAM亮相國際賽場

    基于 NVIDIA Isaac 開發(fā)的機器人調(diào)酒師 ADAM,為維加斯黃金騎士隊的冰球粉絲帶來了身臨其境的未來式服務(wù)體驗。
    的頭像 發(fā)表于 12-24 10:05 ?453次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助 NVIDIA Omniverse 和 Co
    的頭像 發(fā)表于 12-01 09:25 ?1165次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù)為 A
    的頭像 發(fā)表于 11-03 14:48 ?1006次閱讀

    PYQT 應(yīng)用程序框架及開發(fā)工具

    特點,已成為嵌入式領(lǐng)域的重要開發(fā)工具 PyQt 是一個創(chuàng)建 GUI 應(yīng)用程序的工具包。它是 Python 編程語言和 Qt 的成功融合。因為可用的類有很多,他們被分成幾個模塊。QtCore 模塊
    發(fā)表于 10-29 07:15

    NVIDIA 利用全新開源模型與仿真加速機器人研發(fā)進程

    ? 由 NVIDIA、Google DeepMind 以及 Disney Research 聯(lián)合開發(fā)的開源物理引擎 Newton,現(xiàn)可在 NVIDIA Isaac Lab 中使用。這一物理引擎將助力
    的頭像 發(fā)表于 09-30 09:52 ?3084次閱讀
    <b class='flag-5'>NVIDIA</b> 利用全新開源模型與仿真<b class='flag-5'>庫</b>加速機器人研發(fā)進程

    利用NVIDIA DOCA GPUNetIO技術(shù)提升MoE模型推理性能

    在第三屆 NVIDIA DPU 中國黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網(wǎng)絡(luò)技術(shù)的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡(luò)、存儲和安全等領(lǐng)域的創(chuàng)新突破。
    的頭像 發(fā)表于 09-23 15:25 ?1037次閱讀

    學(xué)生適合使用的SOLIDWORKS 云應(yīng)用程序

    隨著科技的不斷發(fā)展,計算機輔助設(shè)計(CAD)技術(shù)已經(jīng)成為現(xiàn)代工程教育的重要組成部分。SOLIDWORKS作為一款CAD軟件,其教育版云應(yīng)用程序為學(xué)生提供了強大而靈活的設(shè)計平臺。本文將探討
    的頭像 發(fā)表于 09-15 10:39 ?799次閱讀
    學(xué)生適合使用的SOLIDWORKS 云<b class='flag-5'>應(yīng)用程序</b>

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個模塊化平臺,使用高級 API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強大的 3D 框架與 NVIDIA RTX 用于視覺渲
    的頭像 發(fā)表于 08-22 15:52 ?3723次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension<b class='flag-5'>開發(fā)</b>秘籍

    NVIDIA通過全新 Omniverse、Cosmos物理AI模型及AI計算基礎(chǔ)設(shè)施,為機器人領(lǐng)域開啟新篇章

    NVIDIA 通過全新 Omniverse 、Cosmos 物理 AI 模型及 AI 計算基礎(chǔ)設(shè)施,為機器人領(lǐng)域開啟新篇章 ? ·?全新 NVIDIA Omniverse NuRec 3D
    的頭像 發(fā)表于 08-12 11:29 ?1796次閱讀
    <b class='flag-5'>NVIDIA</b>通過全新 Omniverse<b class='flag-5'>庫</b>、Cosmos物理AI模型及AI計算基礎(chǔ)設(shè)施,為機器人領(lǐng)域開啟新篇章

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了
    的頭像 發(fā)表于 07-04 14:27 ?1257次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 3.0版本的亮點解析

    借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 網(wǎng)絡(luò)架構(gòu)和交換機,以及諸如 NVIDIA cuDSS 和
    的頭像 發(fā)表于 05-27 13:59 ?1121次閱讀

    第三屆NVIDIA DPU黑客松開啟報名

    碰撞的絕佳機會。本次競賽采用開放式主題,參與者將通過 NVIDIA DOCA 軟件框架構(gòu)建創(chuàng)新的加速應(yīng)用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、網(wǎng)絡(luò)、存儲和
    的頭像 發(fā)表于 05-27 10:16 ?909次閱讀

    NVIDIA將為每家AI工廠提供網(wǎng)絡(luò)安全

    NVIDIA DOCA Argus 框架可檢測 AI 工作負(fù)載中的威脅并對之做出響應(yīng),同時與企業(yè)安全系統(tǒng)無縫集成,從而提供實時洞察。
    的頭像 發(fā)表于 05-07 15:11 ?989次閱讀
    <b class='flag-5'>NVIDIA</b>將為每家AI工廠提供網(wǎng)絡(luò)安全

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1315次閱讀

    MCP:連接AI與應(yīng)用程序的開放標(biāo)準(zhǔn)!

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 擴展AI大模型的方式有兩種,第一種是通過訓(xùn)練增強AI大模型自身的能力;第二種是讓AI大模型與其它現(xiàn)有的應(yīng)用程序(例如:數(shù)據(jù)、瀏覽器、Gmail等)相互協(xié)作
    的頭像 發(fā)表于 03-21 18:21 ?2221次閱讀
    MCP:連接AI與<b class='flag-5'>應(yīng)用程序</b>的開放標(biāo)準(zhǔn)!