91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計算機視覺中識別出的類別有什么用途

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達 ? 2021-08-25 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計算機視覺的應(yīng)用中,“識別”只是一個相當入門的技術(shù),相信很多人在執(zhí)行深度學習推理應(yīng)用中,經(jīng)常產(chǎn)生的質(zhì)疑就是“識別出的類別,有什么用途呢”?

確認每一幀圖像中有多少個我們想要識別的種類,以及他們在圖像中的位置,只是整個應(yīng)用的第一步而已,如果缺乏“目標追蹤(tracking)”的能力,就很難提供視頻分析的基礎(chǔ)功能。

在標準 OpenCV 體系里有 8 種主流的目標追蹤算法,有興趣的可以在網(wǎng)上搜索并自行研究。

算法的基本邏輯就是需要對視頻的相鄰幀進行“類別”與“位置”的比對,因此這部分的計算還是相當消耗計算資源的,也就是當視頻分析軟件“開啟”目標追蹤功能時,其識別性能必定有所下降,大家必須先有這樣的認知。

DeepStream 的定位就是針對“視頻分析”的應(yīng)用,因此“目標追蹤”是其最基本的功能之一。

在前面使用的 myNano.txt 配置文件中,只需要調(diào)整一個設(shè)定值就能開啟或關(guān)閉這個追蹤功能,非常簡單。

DeepStream 支持 IOU、KLT 與 NVDCF 三種目標追蹤算法(如下圖),其中 IOU 的性能最好,在 Jetson Nano 2GB 上的總體大約能到 200FPS;NVDCF 的精確度最高,但目前性能大約只能到 56FPS;KLT 算法目前在性能與精確度的平衡比較好,總體性也能到 160FPS,因此通常都選擇 KLT 追蹤器做演示。

算法的細節(jié)不多做解釋,請自行尋找相關(guān)技術(shù)文件學習,這里就直接進入實驗的過程。還是以前一篇文章中的 myNano.txt 配置文件為主,如果不知道的話,就用 source8_1080p_dec_infer-resnet_tracker_tiled_display_fp16_nano.txt 復(fù)制一份出來就可以,透過修改里面的參數(shù),讓大家體驗一下 DeepStream 目標追蹤的功能。

01

目標追蹤功能的開關(guān)

在 myNano.txt 最下方,可以看到[tracker]的設(shè)定組,下面有個“enable=1”的參數(shù),就是目標追蹤的功能。

現(xiàn)在先執(zhí)行一次啟動追蹤功能,如下圖可以看到每個識別出的物件除了類別、標框之外,旁邊還有個編號,這個編號會一直跟著該物件,這樣就形成“追蹤”的功能。

此時的識別性能如下圖,總性能(8 個數(shù)字相加)大約 160FPS。

如果將[trakcer]下面改成“enable=0”,再執(zhí)行看看結(jié)果如何?下圖中能識別出物件的類別與標框位置,但是已經(jīng)沒有編號。

關(guān)閉追蹤功能之后的識別性能如下圖,總識別性能可以達到 250FPS 左右。

02

切換追蹤器

前面說過,目前 DeepStream 5.0 支持三種追蹤器,那么要如何選擇呢?同樣在[tracker]參數(shù)組下方,有這樣的三行參數(shù):

#ll-lib-file=/opt/nvidia/deepstream/deepstream-5.0/lib/libnvds_mot_iou.so

#ll-lib-file=/opt/nvidia/deepstream/deepstream-5.0/lib/libnvds_nvdcf.so

ll-lib-file=/opt/nvidia/deepstream/deepstream-5.0/lib/libnvds_mot_klt.so

前面加上“#”號的就是處于關(guān)閉的狀況,請先將[tracker]切回“enable=1”的開啟狀態(tài),接下來請自行加減“#”的位置以切換追蹤器的選擇,分別測試這三個追蹤器的不同之處,包括識別性能與追蹤能力。

這部分必須直接在視頻中體驗,因此就不截屏顯示。測試結(jié)果可以感受到 IOU 追蹤器的性能最好,可達到 200FPS 左右,但是同一物件的編號并不是太穩(wěn)定,而 NVDCF 追蹤器的編號最為穩(wěn)定,但性能大概只有 IOU 的 1/4,最多只能承受 2 路視頻的實時分析。

KLT 算法總體性能可達到 160FPS,可以支持到8路以內(nèi)的實時識別,追蹤能力也比 IOU 好不少,不過這個算法對 CPU 的占用率比較高,是這個算法的主要缺點。該如何選擇需要看實際的場景與計算設(shè)備的資源而定。

03

獲取追蹤數(shù)據(jù)

前面打開目標追蹤功能的目的,并不只是為了在顯示器上看看而已,而是用這些數(shù)據(jù)做更有價值的應(yīng)用,而這些數(shù)據(jù)要從什么地方得到呢?通常都需要透過 PythonC++從 DeepStream 提供的接口去獲取。

這里提供一個無需了解 DeepStream 接口就能獲取目標追蹤數(shù)據(jù)的方法,只要我們在 myNano.txt 里面的[application]參數(shù)組,添加一條“kitti-track-output-dir=《PATH》”的路徑指向就可以,這里假設(shè)要將數(shù)據(jù)存入“/home/nvidia/track”路徑下,在 myNano.txt 里添加一行參數(shù)即可:

[application]

kitti-track-output-dir=/home/nvidia/track

執(zhí)行“deepstream -c myNano.txt”之后,就可以看到/home/nvidia/track目錄下產(chǎn)生非常多的文件,如下截屏:

每個文件存放“一幀”的目標追蹤結(jié)果,例如我們測試的 sample_1080p_h264.mp4 視頻有 48 秒,每秒有 30 幀圖像,就會生成 1440 個文件。

前面 6 位數(shù)“00_000”代表視頻源的編號,從“0”開始,如果有 4 路視頻源就會有“00_000”~“00_003”的編號,后面 6 位則是流水號,例如這個測試視頻就會生成“000000.txt”~“001440.txt”,由這兩部分組合而成文件名。

這是 KITTI 格式的數(shù)據(jù),第一欄位是該物件的類別,第二欄是該物件的“追蹤編號”,后面數(shù)據(jù)所代表的意義,請自行參考 KITTI 的格式定義。

現(xiàn)在我們就可以依序讀入這些追蹤文件,或者將這些文件回傳給控制中心,進行文件解析與信息提取,這樣是不是很方便?相信這些內(nèi)容對于開發(fā)會很有幫助。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5597

    瀏覽量

    109784
  • 機器視覺
    +關(guān)注

    關(guān)注

    165

    文章

    4799

    瀏覽量

    126090

原文標題:NVIDIA Jetson Nano 2GB 系列文章(29): DeepStream 目標追蹤功能

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    視覺自動駕駛能識別出高透明玻璃墻嗎?

    [首發(fā)于智駕最前沿微信公眾號]最近在和大家聊純視覺自動駕駛能否識別3D圖像時,有小伙伴提問,純視覺自動駕駛能否識別出高透明玻璃墻,今天智駕最前沿就和大家簡單聊聊相關(guān)內(nèi)容。 當然,在開始
    的頭像 發(fā)表于 02-18 08:49 ?1.1w次閱讀
    純<b class='flag-5'>視覺</b>自動駕駛能<b class='flag-5'>識別出</b>高透明玻璃墻嗎?

    【上海晶珩睿莓 1 單板計算機】人臉識別

    ,\'NumPy:\',numpy.__version__)\" 輸出版本號 詳見:OpenCV . 人臉識別 OpenCV 作為計算機視覺領(lǐng)域的核心庫,其 Python 接口提供了高效的人
    發(fā)表于 01-04 20:22

    上海計算機視覺企業(yè)行學術(shù)沙龍走進西井科技

    12月5日,由中國圖象圖形學學會青年工作委員會(下簡稱“青工委”)、上海市計算機學會計算機視覺專委會(下簡稱“專委會”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發(fā)表于 12-16 15:39 ?591次閱讀

    使用代理式AI激活傳統(tǒng)計算機視覺系統(tǒng)的三種方法

    當前的計算機視覺系統(tǒng)擅長于識別物理空間與流程的事件,卻難以詮釋場景細節(jié)及其意義,也無法推理后續(xù)可能發(fā)生的情況。
    的頭像 發(fā)表于 12-01 09:44 ?648次閱讀

    STM32計算機視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    STMicroelectronics用于 STM32開發(fā)板的B-CAMS-IMX攝像頭模塊提供強大的硬件集,可處理多種計算機視覺場景和用例。該模塊具有高分辨率500萬像素IMX335LQN
    的頭像 發(fā)表于 10-20 09:46 ?1294次閱讀
    STM32<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    【作品合集】賽昉科技VisionFive 2單板計算機開發(fā)板測評

    【VisionFive 2單板計算機試用體驗】人臉識別1——交叉編譯環(huán)境搭建 作者:voidpbq【VisionFive 2單板計算機試用體驗】1. 環(huán)境搭建與代碼整編【VisionFive 2單板
    發(fā)表于 09-04 09:08

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1223次閱讀

    工業(yè)計算機的重要性

    工業(yè)計算機對某些行業(yè)至關(guān)重要。我們將在下面詳細解釋這些行業(yè)的工業(yè)計算機應(yīng)用。1.制造與工業(yè)自動化工業(yè)級計算機非常適合制造工廠,特別是那些想要自動化裝配過程的工廠。在這樣的環(huán)境
    的頭像 發(fā)表于 07-28 16:07 ?580次閱讀
    工業(yè)<b class='flag-5'>計算機</b>的重要性

    自動化計算機經(jīng)過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機的一些好處。1.溫度范圍寬自動化計算機經(jīng)過工程設(shè)計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠在各種不同的極端環(huán)境運行。自動化
    的頭像 發(fā)表于 07-21 16:44 ?628次閱讀
    自動化<b class='flag-5'>計算機</b>經(jīng)過加固后有什么好處?

    自動化計算機的功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境的流程、機器人和機械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?747次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與<b class='flag-5'>用途</b>

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機是一種專為工廠和工業(yè)環(huán)境設(shè)計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對惡劣環(huán)境下的自動化、制造和機器人操作。其特點包括無風扇散熱技術(shù)、無電纜連接和防塵防水設(shè)計,使其在各種工業(yè)自動化場景
    的頭像 發(fā)表于 07-10 16:36 ?753次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)<b class='flag-5'>別有</b>哪些

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    手寫數(shù)字識別是一種經(jīng)典的模式識別和圖像處理問題,旨在通過計算機自動識別用戶手寫的數(shù)字。本文將教會你如何使用基于RV1106的LockAI視覺
    的頭像 發(fā)表于 06-30 15:44 ?1121次閱讀
    基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:手寫數(shù)字<b class='flag-5'>識別</b>

    # 基于LockAI視覺識別模塊:C++尋找色塊

    在傳統(tǒng)計算機視覺場景,顏色識別是目標檢測和分割的重要手段之一。通過識別特定顏色的色塊,可以在相對純凈的背景下快速定位目標區(qū)域。本實驗提供了
    的頭像 發(fā)表于 05-12 14:27 ?715次閱讀
    # 基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:C++尋找色塊

    基于LockAI視覺識別模塊:C++圖像的基本運算

    在圖像處理,理解圖像的基本操作是掌握計算機視覺技術(shù)的關(guān)鍵。本文章將介紹基于LockAI視覺識別模塊下OpenCV
    的頭像 發(fā)表于 05-06 16:20 ?718次閱讀
    基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:C++圖像的基本運算

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當前對音頻、雷達和其他時間序列信號數(shù)據(jù)的支持范圍。在增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺模型。這將給諸多應(yīng)用領(lǐng)域的機器學習開發(fā)人員帶來極大的便利,例如工廠可以借此實現(xiàn)對零件的
    的頭像 發(fā)表于 03-11 15:11 ?818次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的支持