近期,特斯拉自動(dòng)駕駛事故被頻頻報(bào)道,同時(shí)華為“自動(dòng)駕駛”技術(shù)驚艷亮相,被廣大網(wǎng)友認(rèn)為其已經(jīng)達(dá)到了L4的自動(dòng)駕駛水平,這使得關(guān)于汽車輔助駕駛系統(tǒng)的討論再度熱鬧了起來。其中最關(guān)鍵的核心就是有關(guān)汽車視覺的感知系統(tǒng)。
事實(shí)上,隨著AR+AI時(shí)代的到來,AI視覺作為實(shí)現(xiàn)工業(yè)自動(dòng)化和智能化的關(guān)鍵核心技術(shù),正成為人工智能發(fā)展最快的一個(gè)分支。當(dāng)機(jī)器可以“看懂這個(gè)世界”時(shí),它將如眼睛之于人類的價(jià)值一般,不僅會(huì)改變我們的出行方式,還將改變我們的娛樂、學(xué)習(xí)等等與生活有關(guān)的一切。
一直以來,亮亮視野都在AR和AI上投入了巨大的精力,在為行業(yè)提供支撐企業(yè)數(shù)字化轉(zhuǎn)型的硬件和平臺(tái)的同時(shí),與中科院自動(dòng)化所建立聯(lián)合實(shí)驗(yàn)室,通過對(duì)算法協(xié)同、多模態(tài)任務(wù)、環(huán)境測(cè)試等多方面進(jìn)行綜合研究,努力實(shí)現(xiàn)AI多模態(tài)感知融合。近期,其多項(xiàng)研究成果成功入選計(jì)算機(jī)視覺世界的頂級(jí)會(huì)議。
“基于結(jié)構(gòu)信息保持的弱監(jiān)督目標(biāo)定位”
入選CVPR2021
Unveiling the Potential of Structure-Preserving for Weakly Supervised Object Localization. CVPR 2021.
CVPR2021是計(jì)算機(jī)視覺世界三大頂會(huì)之一!本次大會(huì)收到來自全球共7015篇有效投稿,最終有1663篇突出重圍被錄取,錄用率僅為23.7%。
本論文研究的是弱監(jiān)督目標(biāo)定位(WSOL)能力,這是當(dāng)下仍富有挑戰(zhàn)的計(jì)算機(jī)視覺任務(wù),雖然現(xiàn)有的工作通過利用空間正則化策略可以明顯提高目標(biāo)定位精度,但往往忽略了如何從訓(xùn)練好的分類網(wǎng)絡(luò)中提取目標(biāo)結(jié)構(gòu)信息,使得性能和效率還有大幅提高的空間。
本次研究提出了一種兩階段的方法“結(jié)構(gòu)保持激活(SPA)”,以充分利用WSOL卷積特征中包含的結(jié)構(gòu)信息。在包括CUB-200-2011和ILSVRC在內(nèi)的兩個(gè)公開基準(zhǔn)上進(jìn)行的大量實(shí)驗(yàn)表明,與基準(zhǔn)方法相比,本文提出的SPA方法取得了顯著的性能提升。
分析并提醒行進(jìn)中存在的警示和風(fēng)險(xiǎn)
而這種提升就可以在汽車駕駛時(shí),對(duì)感知系統(tǒng)下的更多物體實(shí)現(xiàn)更為精準(zhǔn)的檢測(cè)與判定,降低事故發(fā)生率。
“SiamCPN:基于孿生中心預(yù)測(cè)網(wǎng)絡(luò)的視覺跟蹤”
入選CVM 2021
SiamCPN: Visual tracking with the Siamese center-prediction network. CVM 2021.
CVM是亞洲圖形學(xué)學(xué)會(huì)(ASIA Graphics Association)旗下的三大系列會(huì)議之一,由清華大學(xué)圖形學(xué)實(shí)驗(yàn)室于2012年在北京創(chuàng)辦,發(fā)展至今,已經(jīng)在國(guó)際上形成較大影響力。此次入選CVM2021的論文也同步入選SCI索引源。
本論文主要針對(duì)的是目標(biāo)跟蹤問題,通過一種anchor-free的孿生網(wǎng)絡(luò)SiamCPN,給定初始幀中的參考追蹤對(duì)象,可直接預(yù)測(cè)后續(xù)幀中對(duì)象的中心點(diǎn)和大小。相比其它先進(jìn)的孿生網(wǎng)絡(luò)算法,該方法GOT-10K、UAV123數(shù)據(jù)集上取得了更好的結(jié)果,推理速度也有1.5-2.0倍的提升。
這一成果可應(yīng)用于互動(dòng)游戲之中,可以讓虛擬的場(chǎng)景與現(xiàn)實(shí)自然融合,讓虛擬創(chuàng)造的NPC更真實(shí)的與玩家互動(dòng),從而讓玩家獲得更具沉浸感的增強(qiáng)現(xiàn)實(shí)游戲體驗(yàn)。
讓虛擬NPC始終坐在人物肩膀上
其實(shí)不止于這些場(chǎng)景,這兩項(xiàng)科研成果還可以應(yīng)用于更多領(lǐng)域。目前,亮亮視野正將這些技術(shù)帶到工業(yè)巡檢領(lǐng)域,從而促進(jìn)技術(shù)快速成熟,更快更好的服務(wù)國(guó)民用戶的普通生活之中。
例如,“基于結(jié)構(gòu)信息保持的弱監(jiān)督目標(biāo)定位”現(xiàn)正應(yīng)用于電力、制造、能源等領(lǐng)域的生產(chǎn)車間中,通過將技術(shù)賦予AVG機(jī)器人之中,機(jī)器人可以在復(fù)雜的環(huán)境中實(shí)現(xiàn)自主行走、避障等,從而提升機(jī)器人搬運(yùn)、分揀等效率。此外,將該技術(shù)植入進(jìn)AR智能眼鏡中,可以為現(xiàn)場(chǎng)人員提供實(shí)景導(dǎo)航、安全提示等,從而提高生產(chǎn)安全性。
而“基于孿生中心預(yù)測(cè)網(wǎng)絡(luò)的視覺跟蹤”技術(shù)則可以將數(shù)字孿生技術(shù)、三維建模技術(shù)更好的應(yīng)用起來,工作人員可更方便的查看設(shè)備圖紙、操作設(shè)備虛擬三維模型,提高生產(chǎn)、運(yùn)維、遠(yuǎn)程培訓(xùn)的效率。
AI是進(jìn)入未來世界的關(guān)鍵,是成就改變世界夢(mèng)想的鑰匙。截至目前,亮亮視野已經(jīng)有數(shù)篇AI科研成果登陸世界頂級(jí)會(huì)議,并將這些技術(shù)產(chǎn)業(yè)化,為不同行業(yè)帶去智能化的解決方案。未來,亮亮?xí)^續(xù)加大AI領(lǐng)域的研究工作,通過人工智能與增強(qiáng)現(xiàn)實(shí)技術(shù),以第一視角交互讓人與人、人與機(jī)器、人與數(shù)據(jù)的溝通變得更自然高效。
原文標(biāo)題:AI視覺研究持續(xù)亮劍 亮亮視野成果入選世界頂級(jí)會(huì)議
文章出處:【微信公眾號(hào):亮亮視野】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
Ar
+關(guān)注
關(guān)注
25文章
5287瀏覽量
176458 -
AI
+關(guān)注
關(guān)注
91文章
40201瀏覽量
301844 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
794文章
14918瀏覽量
180393
原文標(biāo)題:AI視覺研究持續(xù)亮劍 亮亮視野成果入選世界頂級(jí)會(huì)議
文章出處:【微信號(hào):glxss-life,微信公眾號(hào):亮亮視野LLVISION】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
亮亮視野AR翻譯眼鏡斬獲CES 2026多項(xiàng)大獎(jiǎng)
北京祥龍公司領(lǐng)導(dǎo)蒞臨亮亮視野調(diào)研指導(dǎo)
亮亮視野AR翻譯眼鏡閃耀2025進(jìn)博會(huì)國(guó)際論壇
亮亮視野AR翻譯眼鏡亮相HICOOL 2025全球創(chuàng)業(yè)者峰會(huì)
亮亮視野榮登2025中國(guó)VR50強(qiáng)企業(yè)榜單
亮亮視野AR翻譯眼鏡亮相2025北京文化論壇
亮亮視野AR翻譯眼鏡亮相IFA 2025
易控智駕榮獲計(jì)算機(jī)視覺頂會(huì)CVPR 2025認(rèn)可
思必馳與上海交大聯(lián)合實(shí)驗(yàn)室研究成果入選兩大頂級(jí)會(huì)議
格靈深瞳六篇論文入選ICCV 2025
Nullmax端到端自動(dòng)駕駛最新研究成果入選ICCV 2025
亮亮視野多項(xiàng)研究成果成功入選計(jì)算機(jī)視覺世界頂級(jí)會(huì)議
評(píng)論