91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OA-SLAM:在視覺SLAM中利用對象進(jìn)行相機(jī)重新定位

3D視覺工坊 ? 來源:3D視覺工坊 ? 作者:魚肖濃@知乎 ? 2022-12-20 14:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Motivations:

用粗略模型(長方體或橢球體)表示的對象可能不夠精確,無法改善相機(jī)的位姿跟蹤。

目前SOTA目標(biāo)檢測器對視角和光照變化具有很強(qiáng)的魯棒性,這對于從大量不同視角恢復(fù)相機(jī)姿態(tài)非常有利。

缺乏用于構(gòu)建面向?qū)ο蟮貓D的全自動系統(tǒng),都有著一定的假設(shè)。

Contributions:

結(jié)合對象和點的優(yōu)點,提出了一種改進(jìn)的重定位方法,能夠從大量不同的視角中估計相機(jī)位姿。

提出了一種全自動的SLAM系統(tǒng),能夠在飛行中識別、跟蹤和重建對象。

Background and Related Works:

1. 對象建圖

Crocco使用簡化相機(jī)模型,提出了一種封閉形式的公式來估計來自多視圖目標(biāo)檢測的對偶二次曲面。Rubino將其拓展到針孔相機(jī)模型。Chen等人解決了前向移動中初始化對象估計問題。

2. 基于對象的定位

Weinzaepfel等人利用查詢圖像中出現(xiàn)的對象與參考圖像中出現(xiàn)的對象之間的稠密2D-3D對應(yīng)關(guān)系來計算相機(jī)的位姿,但該方法僅限于平面對象。

一些工作使用了更通用的對象,用橢球表示。然而這些方法僅從對象估計相機(jī)姿態(tài),并假設(shè)一個預(yù)構(gòu)建的對象地圖。[11]只估計相機(jī)的位置,假設(shè)方向已知。[38]專注于3D感知橢圓對象檢測。

3. 基于對象的SLAM

Bao等人在定位和建圖中引入了對象,在一個SfM框架中識別和定位對象。McCormac等人和Sünderhauf等人將RGB-D SLAM和語義分割和對象檢測相融合,獲得具有語義注釋的稠密點云。

QuadricSLAM使用對偶二次曲面作為3D地標(biāo),共同估計相機(jī)位姿和對偶二次曲面參數(shù)。EAO-SLAM在半稠密的SLAM中集成對象,利用不同的統(tǒng)計信息來提高數(shù)據(jù)關(guān)聯(lián)的魯棒性。Hosseinzadeh將點、平面和二次曲面聯(lián)合為基于因子圖的SLAM。SO-SLAM中,Liao等人使用手工提取的平面為對象添加支撐約束,以及語義尺度先驗和對象約束。ROSHAN利用邊界框檢測、圖像紋理、語義知識和對象形狀先驗來推斷橢球模型,并解決前向平移車輛運(yùn)動下的可觀察性問題。CubeSLAM使用長方體來表示對象,使用2D邊界框和消失點采樣從單圖中生成對象候選。Frost等人用球體建模對象,并使用它們解決SLAM中的尺度不確定和漂移問題。

4. 基于對象的SLAM重定位

只有Dudek等人利用SLAM中的語義地圖進(jìn)行重定位。Mahattansin等人利用對象檢測改進(jìn)了視覺SLAM的重定位,但對象檢測知識用來更好地篩選候選關(guān)鍵幀,相機(jī)位姿仍使用與最相似的關(guān)鍵幀的點匹配估計得到。

Methodology:

04d6f2e4-7ff2-11ed-8abf-dac502259ad0.png

1. 橢球體對象表示

9DoF表示,3DoF表示軸長,3DoF表示方向,3DoF表示位置。其方程可以用對偶空間的封閉形式表示。橢球體定義為4×4矩陣Q*,橢圓定義為3×3矩陣C*。

04fa0f40-7ff2-11ed-8abf-dac502259ad0.png

2. 目標(biāo)檢測與關(guān)聯(lián)

目標(biāo)檢測器:YOLO (只考慮評分高于0.5的檢測)

2.1 基于box的對象追蹤

在重建之前,基于邊界框重疊和標(biāo)簽一致性在2D幀中跟蹤對象在兩幀之間的運(yùn)動相對較小和平滑時短期有效。

考慮3D重建來獲得長期的跟蹤,將其橢球模型投影到當(dāng)前幀中,并利用該幀中與目標(biāo)檢測的重疊來尋找關(guān)聯(lián)。

結(jié)合以上兩種情況,使用匈牙利算法找到最優(yōu)關(guān)聯(lián),該最大化匹配總分,以便在N次檢測和M個對象之間找到最佳的可能分配。

0506a606-7ff2-11ed-8abf-dac502259ad0.png

2.2 基于點的對象追蹤

在相機(jī)位姿估計過程中,將圖像關(guān)鍵點與地圖地標(biāo)進(jìn)行魯棒匹配,這些匹配可以用于鏈接檢測框和對象橢球:

1)在圖像中,如果一個關(guān)鍵點位于邊界框內(nèi),它就與一個檢測相鏈接

2)在地圖中,如果一個點地標(biāo)位于橢球體內(nèi),則與該對象相鏈接

如果檢測和地圖對象之間至少存在τ個基于點的匹配,則關(guān)聯(lián)。

3. 初始對象重建

當(dāng)通過相機(jī)中心的光線與對象檢測中心的光線之間的角度變化為10°以上時,創(chuàng)建其3D橢球的初始估計。為了盡快地獲得對象的3D估計,對象最初被重建為球體,然后隨著視角的增加,細(xì)化為橢球體的形式。

球體的位置是從邊界框的中心進(jìn)行三角測量,半徑被確定為邊界框的平均大小。

05111546-7ff2-11ed-8abf-dac502259ad0.png

其中,為在第i個相機(jī)坐標(biāo)系中的對象中心z坐標(biāo),和為第i幀檢測框的寬度和高度,和為相機(jī)內(nèi)參,n為對象被追蹤到的幀數(shù)。

然后將該球體細(xì)化為橢球體,更新其軸長和位姿,以最小化重投影誤差的形式進(jìn)行改進(jìn)。當(dāng)經(jīng)過足夠幀數(shù)(通常為40幀)重構(gòu)和細(xì)化對象,3D IoU超過閾值時,將對象集成到地圖中。

4. 局部對象建圖

4.1 對象優(yōu)化

與ORB-SLAM2的局部束調(diào)節(jié)類似,對象模型也會定期進(jìn)行優(yōu)化,每當(dāng)一個新的關(guān)鍵幀觀察到地圖中存在的對象時,就會通過最小化重投影誤差來優(yōu)化對象。

05236d68-7ff2-11ed-8abf-dac502259ad0.png

05445960-7ff2-11ed-8abf-dac502259ad0.png

0559f072-7ff2-11ed-8abf-dac502259ad0.png

其中,為第j次檢測框的內(nèi)切橢圓, 為第i個對象的對偶矩陣,為第j個關(guān)鍵幀的投影矩陣,為第j個關(guān)鍵幀的目標(biāo)檢測評分,N為對象觀測數(shù)量。

4.2 對象合并

系統(tǒng)定期檢查重復(fù)的對象,如果它們的3D IoU超過0.2,并且一個橢球體的中心位于另一個橢球體的內(nèi)部或者共享超過 個3D點,則合并這兩個對象。

對關(guān)鍵幀中的兩個對象跟蹤的檢測框進(jìn)行組合,并初始化一個新的橢球。

5. 使用對象重定位

當(dāng)重構(gòu)地圖上的點與關(guān)鍵幀顯著不同時,基于BoW的方法經(jīng)常失敗。因此采用基于對象的方法增強(qiáng)重定位,對視角改變更加魯棒。

由于PnP計算出的位姿比從對象對應(yīng)關(guān)系中得到的位姿更準(zhǔn)確,主要思想是引導(dǎo)點與從對象對應(yīng)關(guān)系中計算出的姿態(tài)進(jìn)行匹配。然后采用點對應(yīng)關(guān)系使用PnP進(jìn)行定位。

基于對象的方法:根據(jù)橢圓-橢球的類別建立了橢圓-橢球?qū)?,每次迭代至少選擇三對組合,在中心使用P3P算法計算相機(jī)位姿。對于P3P解出的四種解,橢球體被投影并且基于重疊關(guān)聯(lián)檢測,代價計算為每個關(guān)聯(lián)對的(1-IoU)之和,選擇四種解中代價最小的相機(jī)位姿。

然后將基于對象方法得到的位姿通過ORB-SLAM2的局部匹配步驟來識別關(guān)鍵點-地標(biāo)對應(yīng)關(guān)系,選擇最小代價且超過30個關(guān)鍵點-地標(biāo)匹配的位姿,在點上進(jìn)行優(yōu)化。

Experiments:

1. 對象建圖

056424fc-7ff2-11ed-8abf-dac502259ad0.png

059eba0e-7ff2-11ed-8abf-dac502259ad0.png

與EAO-SLAM的對比

05c731aa-7ff2-11ed-8abf-dac502259ad0.png

2. 對象vs點

2.1 重定位

05e1cdda-7ff2-11ed-8abf-dac502259ad0.png

061b9934-7ff2-11ed-8abf-dac502259ad0.png

06494b68-7ff2-11ed-8abf-dac502259ad0.png

2.2 在束調(diào)整中集成對象

066630ca-7ff2-11ed-8abf-dac502259ad0.png

069430e2-7ff2-11ed-8abf-dac502259ad0.png

3. AR應(yīng)用

3.1 重新初始化3D追蹤

06b46218-7ff2-11ed-8abf-dac502259ad0.png

06e1915c-7ff2-11ed-8abf-dac502259ad0.png

3.2 SLAM恢復(fù)

071124ee-7ff2-11ed-8abf-dac502259ad0.png

1-4)在3D中跟蹤相機(jī),并建立點和對象的地圖

5-6)由于相機(jī)的突然運(yùn)動,跟蹤丟失了

7-9)當(dāng)重構(gòu)的場景再次可見時,重定位模塊從對象中估計相機(jī)姿態(tài),建立點匹配,并使跟蹤和建圖繼續(xù)進(jìn)行。

4. 按部分建模

074ce042-7ff2-11ed-8abf-dac502259ad0.png

相機(jī)重定位需要足夠數(shù)量的對象(3),當(dāng)相機(jī)靠近時,可能只有一到兩個對象可見。解決方法:微調(diào)檢測器網(wǎng)絡(luò),以檢測對象的可區(qū)分部分。

近距離情況下,雕像的部分(頭、肩膀和底部)被用于重新定位,當(dāng)遠(yuǎn)距離情況下,只使用完整的對象檢測。

Discussion and Future work:

考慮將基于對象的推理與靜態(tài)/動態(tài)識別相結(jié)合。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    938

    瀏覽量

    49971
  • 相機(jī)
    +關(guān)注

    關(guān)注

    5

    文章

    1586

    瀏覽量

    55850
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    458

    瀏覽量

    33341

原文標(biāo)題:OA-SLAM:在視覺SLAM中利用對象進(jìn)行相機(jī)重新定位

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ROS2 SLAM建圖與導(dǎo)航實戰(zhàn)--基于米爾RK3576開發(fā)板

    ? ROS2生態(tài)SLAM(同時定位與建圖)與導(dǎo)航(Navigation)是機(jī)器人自主移動的核心技術(shù)。SLAM Toolbox由Stev
    發(fā)表于 03-12 17:55

    Ubuntu 23.10 -> 錯誤:重新定位溢出怎么解決?

    程序并完成安裝。 但是,啟動安裝的后續(xù)步驟,我收到此錯誤:錯誤:重新定位溢出。 我按照文檔運(yùn)行以下步驟: PCI 枚舉 NVMe 掃描 efidebug boot add -b 0001
    發(fā)表于 02-10 08:21

    什么是激光雷達(dá) 3D SLAM技術(shù)?

    (SimultaneousLocalizationandMapping)即時定位與建圖,通俗來講,就是讓智能設(shè)備未知環(huán)境同步完成自身位置測算與周邊環(huán)境地圖構(gòu)建。這兩個過程互為支撐,既是機(jī)器人自主
    的頭像 發(fā)表于 12-02 19:23 ?625次閱讀
    什么是激光雷達(dá) 3D <b class='flag-5'>SLAM</b>技術(shù)?

    FPGA和GPU加速的視覺SLAM系統(tǒng)特征檢測器研究

    特征檢測是SLAM系統(tǒng)中常見但耗時的模塊,隨著SLAM技術(shù)日益廣泛應(yīng)用于無人機(jī)等功耗受限平臺,其效率優(yōu)化尤為重要。本文首次針對視覺SLAM流程開展硬件加速特征檢測器的對比研究,通過對比
    的頭像 發(fā)表于 10-31 09:30 ?690次閱讀
    FPGA和GPU加速的<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)<b class='flag-5'>中</b>特征檢測器研究

    自動駕駛如何將稀疏地圖與視覺SLAM相結(jié)合?

    通過相機(jī)估計自身位置,一邊在未知環(huán)境構(gòu)建或更新地圖。將兩者結(jié)合的目的其實非常明確,利用預(yù)先構(gòu)建好的稀疏地圖作為先驗信息,讓在線運(yùn)行的視覺SLAM
    的頭像 發(fā)表于 10-28 09:07 ?701次閱讀
    自動駕駛<b class='flag-5'>中</b>如何將稀疏地圖與<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>相結(jié)合?

    全新輕量級ViSTA-SLAM系統(tǒng)介紹

    無需相機(jī)內(nèi)參、極致輕量的前端(前端模型大小僅為同類35%),實時單目視覺SLAM,ViSTA-SLAM。與現(xiàn)有方法相比,ViSTA-SLAM
    的頭像 發(fā)表于 09-22 15:53 ?953次閱讀
    全新輕量級ViSTA-<b class='flag-5'>SLAM</b>系統(tǒng)介紹

    一種適用于動態(tài)環(huán)境的自適應(yīng)先驗場景-對象SLAM框架

    由于傳統(tǒng)視覺SLAM動態(tài)場景容易會出現(xiàn)嚴(yán)重的定位漂移,本文提出了一種新穎的基于場景-對象的可
    的頭像 發(fā)表于 08-19 14:17 ?889次閱讀
    一種適用于動態(tài)環(huán)境的自適應(yīng)先驗場景-<b class='flag-5'>對象</b><b class='flag-5'>SLAM</b>框架

    解析尋跡智行3D SLAM無人叉車的&quot;智慧&quot;從何而來?(本文純干貨)

    尋跡智行率先研發(fā)成功3D SLAM激光導(dǎo)航技術(shù)無人叉車領(lǐng)域應(yīng)用并實現(xiàn)規(guī)?;慨a(chǎn),成功突破高精度環(huán)境感知與自主決策的技術(shù)瓶頸,重新定義倉儲物流的智能化標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 07-22 11:53 ?570次閱讀
    解析尋跡智行3D <b class='flag-5'>SLAM</b>無人叉車的&quot;智慧&quot;從何而來?(本文純干貨)

    基于深度學(xué)習(xí)的增強(qiáng)版ORB-SLAM3詳解

    ORB-SLAM3雖是當(dāng)前最先進(jìn)的SLAM之一,但由于使用傳統(tǒng)的ORB(定向FAST和旋轉(zhuǎn)BRIEF)特征,尺度、旋轉(zhuǎn)和光照發(fā)生顯著變化時可能會表現(xiàn)出局限性。
    的頭像 發(fā)表于 07-14 17:21 ?1744次閱讀
    基于深度學(xué)習(xí)的增強(qiáng)版ORB-<b class='flag-5'>SLAM</b>3詳解

    自動駕駛汽車隧道、山區(qū)如何精準(zhǔn)定位?

    系統(tǒng)(GNSS,如GPS/北斗)、慣性測量單元(IMU)、激光雷達(dá)(LiDAR)、攝像頭(視覺SLAM)以及高精地圖匹配等。每種技術(shù)各有優(yōu)劣,GNSS能提供全球坐標(biāo)但在隧道或山區(qū)容易信號丟失,IMU不依賴外界信號但會隨時間累積誤差,激光雷達(dá)和
    的頭像 發(fā)表于 07-13 11:30 ?1223次閱讀
    自動駕駛汽車<b class='flag-5'>在</b>隧道、山區(qū)如何精準(zhǔn)<b class='flag-5'>定位</b>?

    一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

    近期用于視覺SLAM的3D高斯?jié)姙R(3DGS)技術(shù)在跟蹤和高保真建圖方面取得了顯著進(jìn)展。然而,其順序優(yōu)化框架以及對動態(tài)物體的敏感性限制了其現(xiàn)實場景的實時性能和魯棒性。為此,我們提出
    的頭像 發(fā)表于 07-04 15:14 ?1312次閱讀
    一種適用于動態(tài)環(huán)境的實時RGB-D <b class='flag-5'>SLAM</b>系統(tǒng)

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    仍未得到探索。本文提出一種基于立體相機(jī)的三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)LSG-SLAM。通過EuRoC數(shù)據(jù)集上的廣泛評估,LSG-
    的頭像 發(fā)表于 05-27 14:13 ?1594次閱讀
    三維高斯?jié)姙R大規(guī)模<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)解析

    【「# ROS 2智能機(jī)器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    相機(jī)標(biāo)定是視覺系統(tǒng)的基石,直接影響后續(xù)圖像處理的精度。書中詳細(xì)介紹了單目和雙目相機(jī)的標(biāo)定流程,包括標(biāo)定板的使用、參數(shù)優(yōu)化以及標(biāo)定文件的應(yīng)用。 實際應(yīng)用,標(biāo)定誤差可能導(dǎo)致機(jī)器人
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實踐」閱讀體驗】+ROS2應(yīng)用案例

    SLAM(Simultaneous Localization and Mapping)技術(shù)是地圖構(gòu)建中的核心,它允許機(jī)器人在未知環(huán)境構(gòu)建地圖的同時進(jìn)行自我定位。書中詳細(xì)介紹了
    發(fā)表于 04-27 11:42

    一種基于點、線和消失點特征的單目SLAM系統(tǒng)設(shè)計

    本文提出了一種穩(wěn)健的單目視覺SLAM系統(tǒng),該系統(tǒng)同時利用點、線和消失點特征來進(jìn)行精確的相機(jī)位姿估計和地圖構(gòu)建,有效解決了傳統(tǒng)基于點特征的
    的頭像 發(fā)表于 03-21 17:07 ?1066次閱讀
    一種基于點、線和消失點特征的單目<b class='flag-5'>SLAM</b>系統(tǒng)設(shè)計