91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在賽靈思FPGA SoC平臺(tái)上使用VITIS AI加速人工智能應(yīng)用

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Vaibhav Kothari ? 2022-11-22 14:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

VITIS 是一個(gè)用于開發(fā)軟件和硬件的統(tǒng)一軟件平臺(tái),將 Vivado 和其他組件用于 Xilinx FPGA SoC 平臺(tái),如 ZynqMP UltraScale+ 和 Alveo 卡。VITIS SDK的關(guān)鍵組件,VITIS AI運(yùn)行時(shí)(VART),為在邊緣和云端部署終端ML/AI應(yīng)用程序提供了一個(gè)統(tǒng)一的接口

機(jī)器學(xué)習(xí)中的推理是計(jì)算密集型的,需要高內(nèi)存帶寬和高性能計(jì)算,以滿足各種終端應(yīng)用的低延遲和高吞吐量需求。

維蒂斯人工智能工作流程

Xilinx Vitis AI 提供了一個(gè)工作流程,使用簡(jiǎn)單的流程在 Xilinx 深度學(xué)習(xí)處理單元 (DPU) 上部署深度學(xué)習(xí)推理應(yīng)用:

深度處理單元 (DPU) 是一個(gè)可配置的計(jì)算引擎,針對(duì)深度學(xué)習(xí)推理應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了優(yōu)化,并放置在可編程邏輯 (PL) 中。DPU 包含高效且可擴(kuò)展的 IP 核,可進(jìn)行定制以滿足許多不同應(yīng)用的需求。DPU 定義自己的指令集,Vitis AI 編譯器生成指令。

VITIS AI編譯器以優(yōu)化的方式安排指令,以獲得最大的效能。

在 Xilinx ZynqMP UltraScale+ SoC 平臺(tái)上運(yùn)行任何 AI 應(yīng)用程序的典型工作流程包括以下內(nèi)容:

模型量化

模型編譯

模型優(yōu)化(可選)

構(gòu)建 DPU 可執(zhí)行文件

構(gòu)建軟件應(yīng)用程序

集成 VITIS AI 統(tǒng)一 API

編譯和鏈接混合 DPU 應(yīng)用程序

在 FPGA 上部署混合 DPU 可執(zhí)行文件

人工智能量化器

AI 量化器是一種用于量化過程的壓縮工具,通過將 32 位浮點(diǎn)權(quán)重和激活轉(zhuǎn)換為定點(diǎn) INT8。它可以在不丟失模型準(zhǔn)確信息的情況下降低計(jì)算復(fù)雜性。定點(diǎn)模型需要更少的內(nèi)存,因此提供比浮點(diǎn)實(shí)現(xiàn)更快的執(zhí)行速度和更高的電源效率。

人工智能編譯器

AI 編譯器將網(wǎng)絡(luò)模型映射到高效的指令集和數(shù)據(jù)流。編譯器的輸入是量化的 8 位神經(jīng)網(wǎng)絡(luò),輸出是 DPU 內(nèi)核 - 可執(zhí)行文件將在 DPU 上運(yùn)行。在這里,不支持的層需要部署在CPU中,或者可以自定義模型來替換和刪除那些不支持的操作。它還執(zhí)行復(fù)雜的優(yōu)化,如層融合、指令調(diào)度和片上存儲(chǔ)器的重用。

一旦我們能夠執(zhí)行 DPU,我們需要使用 Vitis AI 統(tǒng)一的 API 來初始化數(shù)據(jù)結(jié)構(gòu),初始化 DPU,在 CPU 上實(shí)現(xiàn) DPU 不支持的層,并根據(jù)需要在 PL/PS 上添加預(yù)處理和后處理。

人工智能優(yōu)化器

憑借其模型壓縮技術(shù),AI 優(yōu)化器可以將模型復(fù)雜性降低 5-50 倍,同時(shí)對(duì)準(zhǔn)確性的影響最小。這種深度壓縮將推理性能提升到一個(gè)新的水平。我們可以實(shí)現(xiàn)所需的稀疏性并將運(yùn)行時(shí)間縮短 2.5 倍。

AI 分析器

AI 探查器可以幫助分析推理查找導(dǎo)致端到端管道瓶頸的注意事項(xiàng)。性能分析器為設(shè)計(jì)人員提供了 DPU/CPU/內(nèi)存的通用時(shí)間線。此過程不會(huì)更改任何代碼,并且可以跟蹤函數(shù)并進(jìn)行分析。

人工智能運(yùn)行時(shí)

VITIS AI 運(yùn)行時(shí) (VART) 允許應(yīng)用程序使用統(tǒng)一的高級(jí)運(yùn)行時(shí) API 進(jìn)行邊緣和云部署,使其無縫且高效。一些主要功能包括:

異步作業(yè)提交

異步作業(yè)收集

C++Python 實(shí)現(xiàn)

多線程和多進(jìn)程執(zhí)行

Vitis AI還提供DSight,DExplorer,DDump和DLet等,用于各種任務(wù)執(zhí)行。

DSight & DExplorer

DPU IP 為特定內(nèi)核提供了多種配置,可根據(jù)網(wǎng)絡(luò)型號(hào)進(jìn)行選擇。DSight 告訴我們每個(gè) DPU 內(nèi)核的利用率百分比。它還提供了調(diào)度程序的效率,以便我們可以調(diào)整用戶線程。還可以查看性能數(shù)字,例如每層和每個(gè)DPU節(jié)點(diǎn)的MOPS,運(yùn)行時(shí)和內(nèi)存帶寬。

Softnautics選擇 Xilinx ZynqMP UltraScale+ 平臺(tái)進(jìn)行高性能和計(jì)算部署。它提供最佳的應(yīng)用處理、高度可配置的 FPGA 加速功能,以及 VITIS SDK,以加速高性能 ML/AI 推理。我們針對(duì)的一個(gè)這樣的應(yīng)用是用于 Covid-19 篩查的口罩檢測(cè)。其目的是根據(jù)各國政府對(duì) Covid-19 預(yù)防措施指南的要求,部署多流推理,用于對(duì)戴口罩的人進(jìn)行 Covid-19 篩查并實(shí)時(shí)識(shí)別違規(guī)行為。

我們準(zhǔn)備了一個(gè)數(shù)據(jù)集并選擇了預(yù)先訓(xùn)練的權(quán)重來設(shè)計(jì)一個(gè)用于掩模檢測(cè)和篩選的模型。我們通過TensorFlow框架訓(xùn)練和修剪了我們的自定義模型。這是人臉檢測(cè)和面具檢測(cè)的兩階段部署。這樣獲得的訓(xùn)練模型是通過前面章節(jié)中介紹的VITIS AI工作流程傳遞的。我們觀察到推理時(shí)間的速度是 CPU 的 10 倍。Xilinx 提供不同的調(diào)試工具和實(shí)用程序,在初始開發(fā)和部署過程中非常有用。在初始部署階段,我們沒有檢測(cè)到掩碼和非掩碼類別。我們嘗試將基于 PC 的推理輸出與一個(gè)名為 Dexplorer 的調(diào)試實(shí)用程序之一的輸出相匹配。但是,調(diào)試模式和根導(dǎo)致問題進(jìn)一步調(diào)試。運(yùn)行量化器后,我們可以使用更大的校準(zhǔn)圖像、迭代和檢測(cè)來調(diào)整輸出,視頻饋送的準(zhǔn)確率約為 96%。我們還嘗試使用 AI 分析器識(shí)別管道中的瓶頸,然后采取糾正措施通過各種方式消除瓶頸,例如使用 HLS 加速來計(jì)算后處理中的瓶頸。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22415

    瀏覽量

    636496
  • soc
    soc
    +關(guān)注

    關(guān)注

    40

    文章

    4576

    瀏覽量

    229195
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50101

    瀏覽量

    265499
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    2025 CICAS AI Agent全球?qū)m?xiàng)半決賽達(dá)實(shí)智能大廈成功舉辦

    2026年1月5日,由中國人工智能學(xué)會(huì)主辦的第三屆全國人工智能應(yīng)用場(chǎng)景創(chuàng)新挑戰(zhàn)(簡(jiǎn)稱:CICAS)AI Agent全球?qū)m?xiàng)半決賽
    的頭像 發(fā)表于 01-07 14:17 ?444次閱讀

    2025 全國人工智能應(yīng)用場(chǎng)景創(chuàng)新挑戰(zhàn)AI Agent全球?qū)m?xiàng)線下半決賽新聞發(fā)布會(huì)在深圳召開

    12月10日下午,以“智啟未來,星耀深圳”為主題的2025全國人工智能應(yīng)用場(chǎng)景創(chuàng)新挑戰(zhàn)AI Agent 全球?qū)m?xiàng)線下半決賽新聞發(fā)布會(huì)在深圳召開。本次發(fā)布會(huì)由CICAS?
    的頭像 發(fā)表于 12-10 18:11 ?1202次閱讀
    2025 全國<b class='flag-5'>人工智能</b>應(yīng)用場(chǎng)景創(chuàng)新挑戰(zhàn)<b class='flag-5'>賽</b><b class='flag-5'>AI</b> Agent全球?qū)m?xiàng)<b class='flag-5'>賽</b>線下半決賽新聞發(fā)布會(huì)在深圳召開

    Sapphire SoC中RISC-V平臺(tái)級(jí)中斷控制器深度解析

    隨著 RISC -V處理器 FPGA 領(lǐng)域的廣泛應(yīng)用,易 FPGA 的 Sapphire RISC-V 內(nèi)核憑借軟硬核的靈活支持,為
    的頭像 發(fā)表于 11-08 09:35 ?7836次閱讀
    易<b class='flag-5'>靈</b><b class='flag-5'>思</b>Sapphire <b class='flag-5'>SoC</b>中RISC-V<b class='flag-5'>平臺(tái)</b>級(jí)中斷控制器深度解析

    AMD Vitis AI 5.1測(cè)試版現(xiàn)已開放下載

    AMD Vitis AI 5.1全新發(fā)布——新增了對(duì) AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元( NPU )的支持。Vitis A
    的頭像 發(fā)表于 11-08 09:24 ?1312次閱讀

    AMD Vitis AI 5.1測(cè)試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對(duì) AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元 (NPU) 的支持。Vitis A
    的頭像 發(fā)表于 10-31 12:46 ?799次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    我們所有的 SoC 都能用于邊緣人工智能。例子包括: 預(yù)測(cè)性維護(hù)和樓宇自動(dòng)化系統(tǒng) 每個(gè)節(jié)點(diǎn)上進(jìn)行本地?cái)?shù)據(jù)分析的智能傳感器網(wǎng)絡(luò) 遙控器和可穿戴設(shè)備的動(dòng)作和手勢(shì)識(shí)別 用于
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    ,技術(shù)自主可控 如今這個(gè)科技競(jìng)爭(zhēng)激烈的時(shí)代,國產(chǎn)化硬件的重要性不言而喻。比鄰星人工智能綜合實(shí)驗(yàn)箱就做到了這一點(diǎn),采用國產(chǎn)化硬件,積極推進(jìn)全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國產(chǎn)化進(jìn)程,把國產(chǎn)自主可控的軟硬件平臺(tái)
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    ,技術(shù)自主可控 如今這個(gè)科技競(jìng)爭(zhēng)激烈的時(shí)代,國產(chǎn)化硬件的重要性不言而喻。比鄰星人工智能綜合實(shí)驗(yàn)箱就做到了這一點(diǎn),采用國產(chǎn)化硬件,積極推進(jìn)全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國產(chǎn)化進(jìn)程,把國產(chǎn)自主可控的軟硬件平臺(tái)
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    深瞳亮相AICon 2025全球人工智能開發(fā)與應(yīng)用大會(huì)

    此前,6月27-28日,由極客邦科技旗下InfoQ中國主辦的“AICon全球人工智能開發(fā)與應(yīng)用大會(huì)”北京舉辦。作為行業(yè)領(lǐng)先的視覺AI公司,格深瞳受邀參會(huì)。
    的頭像 發(fā)表于 07-05 16:15 ?1476次閱讀

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    示例和支持,方便開發(fā)者 Nordic 的各類芯片上實(shí)現(xiàn)高效的邊緣 AI 應(yīng)用; 如果對(duì)這個(gè)AI人工智能應(yīng)用感興趣,請(qǐng)?jiān)u論區(qū)聯(lián)系我們.
    發(fā)表于 06-28 14:18

    開售RK3576 高性能人工智能主板

    芯片讓產(chǎn)品變得更加完美,被廣 泛的應(yīng)用到 AI 服務(wù)器、人臉支付設(shè)備、安防、醫(yī)療、交通、金融、工控、智慧教育、智能零售等 等 AI 智能領(lǐng)域。由于其硬件
    發(fā)表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用 Cognizant將在關(guān)鍵增長(zhǎng)領(lǐng)域提供解決方案,包括企業(yè)級(jí)AI
    的頭像 發(fā)表于 03-26 14:42 ?746次閱讀
    Cognizant將與NVIDIA合作部署神經(jīng)<b class='flag-5'>人工智能</b><b class='flag-5'>平臺(tái)</b>,<b class='flag-5'>加速</b>企業(yè)<b class='flag-5'>人工智能</b>應(yīng)用

    AI人工智能隱私保護(hù)怎么樣

    在當(dāng)今科技飛速發(fā)展的時(shí)代,AI人工智能已經(jīng)深入到我們生活的方方面面,從醫(yī)療診斷到交通調(diào)度,從教育輔助到娛樂互動(dòng),其影響力無處不在。然而,隨著AI人工智能的廣泛應(yīng)用,其安全性問題也備受關(guān)
    的頭像 發(fā)表于 03-11 09:46 ?1213次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>人工智能</b>隱私保護(hù)怎么樣