近日,中國科學院自動化研究所智能感知與計算研究中心研究員張兆翔及其團隊借鑒腦神經(jīng)機制與視覺認知機理,在視覺物體檢測模型與方法上取得一系列進展,共有5篇文章被ICCV2019錄用,1篇文章被NeurIPS2019錄用,1篇文章被JMLR 期刊收錄。本次著重介紹基于三叉戟網(wǎng)絡(Trident Networks)的物體檢測。
物體檢測是計算機視覺與模式識別領域的核心問題,一直以來受到學術界與工業(yè)界的廣泛關注。當前物體檢測最大的難點是如何對場景中多種尺度的物體進行有效表征,進而進行更為高效、更為準確、更為魯棒的物體檢測。
在二維透視成像中,近大遠小是一個常見的現(xiàn)象,如圖1所示。這一透視關系,幫助人類視覺系統(tǒng)形成對三維空間的感知。但對于基于二維圖像的視覺感知任務而言,近大遠小會導致相同真實大小的物體根據(jù)遠近不同,因而在成像平面上形成不同尺度的物體。這將對視覺感知任務提出挑戰(zhàn)。具體來說:(1)這會導致信息的衰減,二維圖像捕獲的信息隨距離二次衰減,因而30米外的物體在圖片上可能只有15米外相同物體1/4的像素;(2)卷積神經(jīng)網(wǎng)絡具有局限性。由于卷積操作在二維平面上采用相同大小的滑動窗口進行計算,同一卷積操作無法同時對尺度差異較大的物體進行響應。
針對傳統(tǒng)卷積神經(jīng)網(wǎng)絡的局限,張兆翔及其團隊首次提出 Trident 網(wǎng)絡結構。首先通過不同膨脹系數(shù)的卷積支路實現(xiàn)對不同尺度的物體的識別,然后通過權重共享實現(xiàn)對不同尺度相同物體的一致性刻畫。研究人員還提出了一種在測試階段只需要一條卷積支路的快速 Trident 網(wǎng)絡,快速 Trident 網(wǎng)絡保持了與傳統(tǒng)檢測器骨干網(wǎng)絡相同的計算量,大幅提升了該方法的實用性。
該Trident方法可以與不同基礎網(wǎng)絡結構結合,并在 COCO 數(shù)據(jù)集上取得大幅度提升。該文作為Oral文章在ICCV2019發(fā)表。
據(jù)悉,ICCV2019近期在韓國首爾召開。ICCV的全稱是國際計算機視覺大會,是計算機視覺與模式識別領域的頂級會議。本次會議,張兆翔及其團隊共有5篇論文被接收,其中2篇為oral;3篇為poster。
-
自動化
+關注
關注
31文章
5937瀏覽量
90283 -
計算機視覺
+關注
關注
9文章
1715瀏覽量
47636 -
數(shù)據(jù)集
+關注
關注
4文章
1236瀏覽量
26202
原文標題:自動化所在視覺物體檢測與識別領域取得系列進展
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
嵌入式視覺技術賦能工業(yè)自動化領域變革
激光漫反射光電開關傳感器:工業(yè)自動化領域的“智慧之眼”
羅克韋爾自動化邀您共赴2025年自動化博覽會
機器視覺檢測PIN針
iTOF技術,多樣化的3D視覺應用
冠坤鋁電解電容的 “自動化產(chǎn)線”:AI 視覺檢測 + 激光打標,參數(shù)精度達 ±2%
自動駕駛汽車如何準確識別小物體?
貿(mào)澤推出全新自動化資源中心
圓柱電池自動分選機:全流程自動化檢測的革新之路
【嘉楠堪智K230開發(fā)板試用體驗】01 Studio K230開發(fā)板Test2——手掌,手勢檢測,字符檢測
EtherCAT科普系列(8):EtherCAT技術在機器視覺領域的應用
行業(yè)首創(chuàng):基于深度學習視覺平臺的AI驅(qū)動輪胎檢測自動化
自動化所在視覺物體檢測與識別領域取得系列進展
評論