91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于視覺SLAM直接法的介紹

3D視覺工坊 ? 來源:深藍(lán)AI ? 作者:專注于人工智能的 ? 2022-11-30 09:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本次內(nèi)容包括三個部分,分別是三維幾何學(xué)的基礎(chǔ)和特征點法和直接法的對比,直接法的代表工作以及對于未來發(fā)展的展望。

三維幾何學(xué)基礎(chǔ)知識

關(guān)于基礎(chǔ)知識,首先要了解的是剛體運(yùn)動的基本屬性。三維空間的剛體運(yùn)動通常包括六個自由度,對應(yīng)的轉(zhuǎn)換矩陣的表達(dá)方式在不同的文獻(xiàn)中有不同的方式,而在學(xué)術(shù)寫作的時候,不管用哪一種,重要的是一定要保持格式的統(tǒng)一和連貫。此外,轉(zhuǎn)換矩陣所描述的不是某種運(yùn)動,而是點在不同坐標(biāo)系的轉(zhuǎn)換。第二個比較重要的基礎(chǔ)知識是本質(zhì)矩陣和對極幾何。

考慮下列場景:我們用兩個攝像頭可以同時觀測到一個特征點,利用匹配的特征點,我們將可以建立對極約束,當(dāng)匹配的特征點足夠多時,我們將可以求解本質(zhì)矩陣,比如使用常用的八點法,當(dāng)求解完成后,我們就可以從本質(zhì)矩陣中分解得到兩個相機(jī)位置相對的位移和旋轉(zhuǎn)。值得注意的是本質(zhì)矩陣的自由度是5,因為在位移上,我們丟失了一個自由度的尺度信息。

b70e93ba-703c-11ed-8abf-dac502259ad0.png

圖1:多視覺幾何基礎(chǔ)

而關(guān)于SLAM,它是英文“同時定位與建圖”的縮寫。而有時候,我們還會聽到VO,SfM等概念,而因此容易混淆。對于這些概念,我的理解是,sfm用于基于圖像的三維重建,過程可以是在線或者離線,圖像的順序可以是連續(xù)的,也可以是亂序的;視覺slam一般處理的圖像是連續(xù)的,并且過程也是在線的;視覺里程計中有局部地圖生成的模式其實就是slam,而沒有地圖的模式就是單獨(dú)的里程計。雖然我們接觸到的大部分視覺里程計都是有對應(yīng)的地圖,但是,也有些情況,比如現(xiàn)在的一些深度網(wǎng)絡(luò)可以通過兩張圖片直接訓(xùn)練輸出相對位姿,這就是單獨(dú)的里程計信息。

b731305a-703c-11ed-8abf-dac502259ad0.png

圖2:SLAM相關(guān)概念的關(guān)系圖

接下來我們來看看特征點法和直接法直接的對比。關(guān)于特征點法,通常我們在兩張圖片上找到特征點以及對應(yīng)的匹配特征點,從而求兩幀圖像之間的相對位姿以及特征點的三維位置。當(dāng)有一個初始的相對位姿估計時,我們可以計算特征投影到另一幀圖像的位置,從而可以建立重投影誤差。

相比于使用兩張圖片,當(dāng)使用多張圖片時,重投影誤差則包括所有特征點在所有可被觀測到的幀上的誤差。而針對直接法,我們所關(guān)注的誤差稱為光度誤差。如果說特征點法關(guān)注的是像素的位置差,那么,直接法關(guān)注的則是像素的顏色差。

總結(jié)一下,特征點法通常會把圖像抽象成特征點的集合,然后去縮小特征點之間的重投影誤差;而直接法則通過warp function直接計算像素點在另一張圖像上的顏色差,這樣就省去了特征提取的步驟。

b775bee6-703c-11ed-8abf-dac502259ad0.png

圖3:直接法和特征點法流程對比

直接法的應(yīng)用

關(guān)于直接法的應(yīng)用,主要介紹的是DSO和大范圍DSO。首先關(guān)于直接圖像對齊(direct image alignment),針對每一個圖像的每一個點,我們需要計算像素點顏色的變化,對應(yīng)點的尋找需要利用warp function,就是將一個點通過相機(jī)的內(nèi)外參數(shù)轉(zhuǎn)換到另一個相機(jī)的坐標(biāo)系中,更周全的考慮還需要將兩張圖的亮度進(jìn)行一致化處理。然而單目相機(jī)還是需要面對一個很棘手的問題,那就是無法恢復(fù)尺度信息,并且往往會出現(xiàn)尺度漂移的現(xiàn)象。

為了解決這個問題,一種方式是采用雙目攝像頭,對此我們需要使用新的能量函數(shù),添加的優(yōu)化量就是雙目相機(jī)另一個攝像頭投影到它上面的誤差,值得注意的是,雙目攝像頭的相對位置需要已知,并且,通過雙目項的添加,會自然的得到尺度的約束。

而實際上,隨著雙目相機(jī)和對尺度約束的引入,相比于ORB-SLAM2和深度LSD,大范圍DSO在KITTI等室外場景具備了更好的里程計效果,而經(jīng)過反思,我們認(rèn)為通過將雙目相機(jī)用“聰明”的方式加以利用,我們確實可以得到正確的尺度信息。除了支持里程計信息的獲取,雙目DSO還能很好的支持三維重建。

b7a33024-703c-11ed-8abf-dac502259ad0.png

圖4:雙目DSO三維重建效果

在實現(xiàn)了比較好的三維重建后,接下來值得繼續(xù)研究的方向之一就是語義重建?;谝曈XSLAM的語義重建的流程包括實現(xiàn)定位和地圖后,通過點云信息來進(jìn)行語義分割,基于分割好的點云,我們將進(jìn)一步參數(shù)化,抽象化。

總之,我們希望實現(xiàn)對于點云比較簡潔的參數(shù)化描述。

我們接下來的一個工作是試圖從輸入的圖像直接得到想要的語義信息。對應(yīng)的輸入包括雙目相機(jī)獲取的左右圖像,初始的位姿和形狀估計,以及物體的語義分割結(jié)果。而誤差的計算則包括兩張圖片光度投影的誤差,和將物體估計的形狀投影到圖像上的誤差,以及關(guān)于車的形狀和位置的先驗知識。利用構(gòu)建的誤差,我們可以通過高斯牛頓法進(jìn)行優(yōu)化。

而這里,涉及到的問題包括構(gòu)建車輛的模型來進(jìn)行參數(shù)化表達(dá),一種方式是利用有效距離場對于形狀以高維度向量的形式進(jìn)行描述,然后采用PCA模型進(jìn)行降維壓縮。而在利用能量函數(shù)建立優(yōu)化問題后,我們需要計算雅可比進(jìn)行二階優(yōu)化,由于待優(yōu)化的變量較多,所以雅可比推導(dǎo)很復(fù)雜,不過在我們的論文 DirectShape: Direct Photometric Alignment of Shape Priors for Visual Vehicle Pose and Shape Estimation中,對于所有優(yōu)化變量的雅可比的求解都進(jìn)行了推導(dǎo),從而提供了優(yōu)化問題的閉環(huán)解,感興趣的同學(xué)可以自行閱讀。而實驗效果也實現(xiàn)了很好的場景描述效果,包括在物體被部分遮擋的情況下。

b7c3f318-703c-11ed-8abf-dac502259ad0.png

圖5:語義重建的輸入信息

接下來一個主題是關(guān)于特征點法和直接法的結(jié)合,第一個工作是結(jié)合特征點實現(xiàn)的相機(jī)的在線光度標(biāo)定。要理解光度標(biāo)定,就要理解數(shù)碼攝像機(jī)的成像過程,首先光源發(fā)射到物體上的光會反射到鏡片上,經(jīng)過鏡頭后,光亮?xí)l(fā)生變化,然后打到傳感器上,一定時間內(nèi)形成能量積累,經(jīng)過響應(yīng)函數(shù)的處理從而得到對應(yīng)的光照強(qiáng)度。

從物體表面反射的光通常稱為輻射亮度(radiance),而發(fā)射到傳感器上的光通常稱為輻射照度(irradiance)。這一過程涉及到三個參數(shù),包括是鏡頭的暗角V,曝光時間E,鏡頭的響應(yīng)函數(shù)f。

b7f42db2-703c-11ed-8abf-dac502259ad0.png

圖6:數(shù)碼相機(jī)的成像過程

而相機(jī)的光度標(biāo)定的目標(biāo)就是求得相機(jī)的三個參數(shù),并利用這三個參數(shù)對于圖像進(jìn)行矯正,從而確保輸出圖像的光度一致性。

為什么我們要進(jìn)行光度標(biāo)定呢?因為直接法SLAM的假設(shè)就是光度的一致性,即對應(yīng)的點在不同的圖像中顏色要一致。已有的方法在進(jìn)行光度標(biāo)定時,我們需要至少10分鐘的時間完成全部的復(fù)雜操作。而當(dāng)相機(jī)安裝在無人機(jī)上,或者曝光時間無法控制時,操作將更加復(fù)雜。我們所提出的在線光度標(biāo)定的方法是基于特征點在不同圖片中對應(yīng)的觀察,能量函數(shù)是所有的點在所有圖像中的實際顏色與模型估計出的顏色的誤差和。在定義了能量函數(shù)后,我們需要怎樣進(jìn)行建模呢?

首先對于響應(yīng)函數(shù)的建模還是利用主成分分析,我們收集一百個相機(jī)的響應(yīng)函數(shù)進(jìn)行PCA,任意一個相機(jī)的響應(yīng)函數(shù)都可以用四個主成分的線性組合來進(jìn)行描述。對于暗角的建模是基于暗角是完全對稱的假設(shè),并用四階多項式來描述。在對能量函數(shù)進(jìn)行參數(shù)化后,我們就可以進(jìn)行優(yōu)化求解。而實際的效果也證明優(yōu)化參數(shù)可以很快收斂成真值。在進(jìn)行光度標(biāo)定后,DSO在Euroc等數(shù)據(jù)集上也實現(xiàn)了更好的定位和建圖效果。

b817f8b4-703c-11ed-8abf-dac502259ad0.png

圖7:光度標(biāo)定后的成像效果

最后一個分享的課題是:如何在采用直接法的同時進(jìn)行回環(huán)檢測?直接法中因為沒有描述子,所以很難利用進(jìn)行數(shù)據(jù)關(guān)聯(lián)和回環(huán)檢測,一種思路就是對部分采樣的點添加描述子,在高翔博士的工作LDSO:Direct sparse odmetry with loop closure中,我們把采樣的點一部分換成角點,對于角點我們會建立描述子,從而得到整個圖像的描述子,然后就可以檢測回環(huán),進(jìn)行全局的位姿圖優(yōu)化。

而實際效果說明,特征的替換并不會影響DSO的效果,并且還增加了新的回環(huán)檢測的功能。此外,還有一種思路是通過直接法得到的點云進(jìn)行三維特征點的檢測,并且抽取局部特征點的描述子,從而合并成全局特征點的描述子。

未來的工作方向

而關(guān)于直接法的局限性,我認(rèn)為直接法做全局的優(yōu)化是很有挑戰(zhàn)性的,因為沒有描述子,做回環(huán)檢測和地圖的重定位不是很直觀。而且在極端的光照條件下,它的魯棒性沒有保證,還有一點就是目前的直接法采樣點都是隨機(jī)采樣,這就意味著采樣沒有決定性,這就會為之后的重定位引入誤差。

此外,直接法得到的點云如何得到更具備實際意義的表述形式?因為目前得到的點云還是無法直接使用的。直接法需不需要存儲歷史圖像?特征點法只需要保留特征點和描述子,而直接法如果需要全局優(yōu)化,那么就需要存儲圖像與歷史信息進(jìn)行對照,而一旦存儲圖像,就會導(dǎo)致存儲數(shù)據(jù)的增加,那么這個問題該如何解決?

關(guān)于直接法未來的研究方向,一個可行的工作是增加點的描述性,如果能將之前不具備描述性的圖像的顏色信息,換成具備描述性的描述子信息,那么將可以開展很多新工作。有了這些東西,我們就可以進(jìn)行跨季節(jié),跨時間,跨天氣的回環(huán)檢測。

此外,直接法獲取的點云質(zhì)量通常較高,但現(xiàn)在依舊沒有充分挖掘這些點云信息的潛力,所以未來如果能夠提取這些點云的描述子,并且和圖像的描述子結(jié)合,那么就可以對場景實現(xiàn)更好的描述性,點云還有可能的潛在用途就是提供簡潔的場景描述。此外,目前點的采樣具有隨機(jī)性,而未來,是否可以實現(xiàn)具有確定性的點的采樣?從而實現(xiàn)更準(zhǔn)確的重定位?還有就是直接法的全局地圖該如何更新和維護(hù),現(xiàn)在還沒有解決。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DSO
    DSO
    +關(guān)注

    關(guān)注

    0

    文章

    30

    瀏覽量

    23843
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    457

    瀏覽量

    33336
  • orb
    orb
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    10186

原文標(biāo)題:視覺SLAM直接法及未來發(fā)展

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    電解電容正負(fù)極接法的詳細(xì)介紹

    電解電容是一種具有極性的電容器,其正負(fù)極接法至關(guān)重要,接反可能導(dǎo)致電容損壞、漏液、爆炸,甚至引發(fā)電路故障或安全事故。以下是電解電容正負(fù)極接法的詳細(xì)介紹: 一、電解電容正負(fù)極的識別方法 1、外觀標(biāo)識
    的頭像 發(fā)表于 03-05 17:45 ?1027次閱讀
    電解電容正負(fù)極<b class='flag-5'>接法</b>的詳細(xì)<b class='flag-5'>介紹</b>

    關(guān)于MT6901的直線DEMO介紹

    關(guān)于MT6901的直線DEMO介紹
    的頭像 發(fā)表于 01-30 10:54 ?419次閱讀
    <b class='flag-5'>關(guān)于</b>MT6901的直線DEMO<b class='flag-5'>介紹</b>

    關(guān)于電機(jī)接法詳解

    電機(jī)作為現(xiàn)代工業(yè)的核心動力源,其接線方式的正確與否直接關(guān)系到設(shè)備的運(yùn)行效率、安全性和使用壽命。不同類型的電機(jī)有著截然不同的接線方法,掌握這些技巧不僅能避免燒毀電機(jī)的風(fēng)險,還能充分發(fā)揮電機(jī)的性能潛力
    的頭像 發(fā)表于 12-08 07:35 ?2782次閱讀
    <b class='flag-5'>關(guān)于</b>電機(jī)<b class='flag-5'>接法</b>詳解

    關(guān)于NFC鎳鋅鐵氧體片的介紹

    關(guān)于NFC鎳鋅鐵氧體片的介紹
    的頭像 發(fā)表于 12-04 10:52 ?416次閱讀
    <b class='flag-5'>關(guān)于</b>NFC鎳鋅鐵氧體片的<b class='flag-5'>介紹</b>

    FPGA和GPU加速的視覺SLAM系統(tǒng)中特征檢測器研究

    特征檢測是SLAM系統(tǒng)中常見但耗時的模塊,隨著SLAM技術(shù)日益廣泛應(yīng)用于無人機(jī)等功耗受限平臺,其效率優(yōu)化尤為重要。本文首次針對視覺SLAM流程開展硬件加速特征檢測器的對比研究,通過對比
    的頭像 發(fā)表于 10-31 09:30 ?672次閱讀
    FPGA和GPU加速的<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)中特征檢測器研究

    關(guān)于系統(tǒng)鏈接腳本的介紹

    一、隊伍介紹 本篇為蜂鳥E203系列分享第四篇,本篇介紹的內(nèi)容是系統(tǒng)鏈接腳本。 二、如何實現(xiàn)不同的下載模式? 實現(xiàn)三種不同的程序運(yùn)行方式,可通過makefile的命令行指定不同的鏈接腳本,從而實現(xiàn)
    發(fā)表于 10-30 08:26

    自動駕駛中如何將稀疏地圖與視覺SLAM相結(jié)合?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛場景中,稀疏地圖通常是由一系列關(guān)鍵幀和若干三維稀疏特征點構(gòu)成的地圖,每個特征點包含三維坐標(biāo)和描述外觀的描述子;而視覺SLAM是運(yùn)行在車輛上的實時算法,它一邊
    的頭像 發(fā)表于 10-28 09:07 ?691次閱讀
    自動駕駛中如何將稀疏地圖與<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>相結(jié)合?

    全新輕量級ViSTA-SLAM系統(tǒng)介紹

    無需相機(jī)內(nèi)參、極致輕量的前端(前端模型大小僅為同類35%),實時單目視覺SLAM,ViSTA-SLAM。與現(xiàn)有方法相比,ViSTA-SLAM不僅更輕、更快,在相機(jī)跟蹤和密集3D重建質(zhì)量
    的頭像 發(fā)表于 09-22 15:53 ?928次閱讀
    全新輕量級ViSTA-<b class='flag-5'>SLAM</b>系統(tǒng)<b class='flag-5'>介紹</b>

    一種適用于動態(tài)環(huán)境的自適應(yīng)先驗場景-對象SLAM框架

    由于傳統(tǒng)視覺SLAM在動態(tài)場景中容易會出現(xiàn)嚴(yán)重的定位漂移,本文提出了一種新穎的基于場景-對象的可靠性評估框架,該框架通過當(dāng)前幀質(zhì)量指標(biāo)以及相對于可靠參考幀的場景變化,全面評估SLAM的穩(wěn)定性。
    的頭像 發(fā)表于 08-19 14:17 ?882次閱讀
    一種適用于動態(tài)環(huán)境的自適應(yīng)先驗場景-對象<b class='flag-5'>SLAM</b>框架

    基于深度學(xué)習(xí)的增強(qiáng)版ORB-SLAM3詳解

    ORB-SLAM3雖是當(dāng)前最先進(jìn)的SLAM之一,但由于使用傳統(tǒng)的ORB(定向FAST和旋轉(zhuǎn)BRIEF)特征,在尺度、旋轉(zhuǎn)和光照發(fā)生顯著變化時可能會表現(xiàn)出局限性。
    的頭像 發(fā)表于 07-14 17:21 ?1720次閱讀
    基于深度學(xué)習(xí)的增強(qiáng)版ORB-<b class='flag-5'>SLAM</b>3詳解

    一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

    近期用于視覺SLAM的3D高斯?jié)姙R(3DGS)技術(shù)在跟蹤和高保真建圖方面取得了顯著進(jìn)展。然而,其順序優(yōu)化框架以及對動態(tài)物體的敏感性限制了其在現(xiàn)實場景中的實時性能和魯棒性。為此,我們提出
    的頭像 發(fā)表于 07-04 15:14 ?1296次閱讀
    一種適用于動態(tài)環(huán)境的實時RGB-D <b class='flag-5'>SLAM</b>系統(tǒng)

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    近期興起的神經(jīng)輻射場(NeRF)與三維高斯?jié)姙R(3DGS)技術(shù)在視覺SLAM中展現(xiàn)出令人鼓舞的突破性成果。然而,當(dāng)前主流方法多依賴RGBD傳感器,并且僅適用于室內(nèi)環(huán)境。在大規(guī)模室外場景中的重建魯棒性
    的頭像 發(fā)表于 05-27 14:13 ?1581次閱讀
    三維高斯?jié)姙R大規(guī)模<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)解析

    【「# ROS 2智能機(jī)器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    相機(jī)標(biāo)定是視覺系統(tǒng)的基石,直接影響后續(xù)圖像處理的精度。書中詳細(xì)介紹了單目和雙目相機(jī)的標(biāo)定流程,包括標(biāo)定板的使用、參數(shù)優(yōu)化以及標(biāo)定文件的應(yīng)用。 實際應(yīng)用中,標(biāo)定誤差可能導(dǎo)致機(jī)器人定位偏差,因此標(biāo)定過程
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實踐」閱讀體驗】+ROS2應(yīng)用案例

    地圖構(gòu)建,包括算法原理介紹、安裝與配置方法、仿真環(huán)境中的SLAM以及真實機(jī)器人上的SLAM。 這一過程不僅涉及到計算機(jī)視覺和機(jī)器人學(xué)的知識,還需要對ROS 2的節(jié)點管理和數(shù)據(jù)處理有一定
    發(fā)表于 04-27 11:42

    一種基于點、線和消失點特征的單目SLAM系統(tǒng)設(shè)計

    本文提出了一種穩(wěn)健的單目視覺SLAM系統(tǒng),該系統(tǒng)同時利用點、線和消失點特征來進(jìn)行精確的相機(jī)位姿估計和地圖構(gòu)建,有效解決了傳統(tǒng)基于點特征的SLAM的局限性。
    的頭像 發(fā)表于 03-21 17:07 ?1055次閱讀
    一種基于點、線和消失點特征的單目<b class='flag-5'>SLAM</b>系統(tǒng)設(shè)計