91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛中常提的“深度估計”是個啥?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-02-16 13:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]當我們看一張照片時,可以通過肉眼自然地判斷照片中的物體遠近,這種對于空間和距離的感知,對于人類來說是本能,是從幼兒時期開始就形成的一種能力。

對于自動駕駛汽車來說,為了能更好地辨別路況,也需要類似的能力。

wKgZO2mRVxWATleBAAAQo00DEvw731.jpg

什么是深度估計?

自動駕駛汽車必須理解環(huán)境中物體距離它有多遠,需要能快速辨別前面是行人還是車?那個車到底是在十米開外還是一兩百米遠?

深度估計就是讓機器從感知到的圖像或傳感器數(shù)據(jù)中估計出物體到自身的距離,給計算機一個可以理解的“空間感”。

這種能力在計算機視覺領域里被稱為深度估計(Depth Estimation),是自動駕駛感知系統(tǒng)的基礎一環(huán)。

深度估計的結果表現(xiàn)為“深度圖”,這張深度圖和普通照片不一樣,照片上的每個像素表示顏色,而深度圖上的每個像素代表的是這個像素點對應的真實世界深度值,簡單理解就是圖片中的物體離我有多遠。

有了深度圖,車載系統(tǒng)就能把二維畫面轉(zhuǎn)化為三維空間的感覺,這對路徑規(guī)劃、避障、速度控制等任務來說非常重要。

wKgZO2mRVxaALdkbAAAR42n7O-I013.jpg

為什么自動駕駛要進行深度估計

如果只給自動駕駛系統(tǒng)提供一張照片,是無法讓它直接判斷距離的。這跟人類看照片的本能不同,機器只看到數(shù)字和像素點。

沒有深度信息的話,計算機只能判斷物體的大致形狀、顏色和類別,但不知道它在空間中的實際位置。

舉個例子,一輛車可能看起來很大很清晰,但它到底在十米還是一百米之外,是深度信息才能回答的問題。

傳統(tǒng)的深度感知方式是用激光雷達(LiDAR)這樣的感知硬件,利用激光直接測量距離,成像效果會非常好,也正因如此,現(xiàn)在很多自動駕駛系統(tǒng)都依托激光雷達來獲取深度信息。

但是激光雷達成本高、算力要求高,也有安裝和維護等各種后續(xù)問題。

深度估計作為計算機視覺的一種技術,就是希望用廉價的攝像頭和算法來補充或者替代一些昂貴的傳感硬件。

也就是說,深度估計技術是讓自動駕駛車輛能從攝像頭拍攝的普通圖像中預測出每一處的距離。

比方說前方有個行人,機器不僅要知道這是個人,還要知道這個人距離車有多少米,這就是深度估計提供的數(shù)據(jù)。

沒有這樣的三維感知,即便能識別物體類別,也無法安全地制定行駛策略。

wKgZO2mRVxeALQ7GAAASG3BOmsQ165.jpg

如何實現(xiàn)深度估計?

深度估計本質(zhì)上是從圖像推斷空間距離的過程,由于單張圖像本身并不包含真實的深度信息,這一過程需要復雜的處理流程。

僅憑平面像素及色彩去推測三維空間中的距離,是一個典型的“欠定問題”,機器無法僅從一張圖片確定真實距離,而必須結合幾何原理、先驗知識以及大量數(shù)據(jù)來輔助推斷。

目前,主流的深度估計方法可分為兩類。

一種是多視圖方法,通過兩個或多個不同視角的攝像頭同時觀察同一個場景,然后用傳統(tǒng)的立體視覺算法去匹配、計算視差(就是確定同一個物體在不同視角中像素的偏移量),再根據(jù)視差轉(zhuǎn)換成深度信息。

這其實跟我們雙眼看到立體圖像類似,左右眼看到的是有輕微偏差的畫面,通過這種視差差異,我們的大腦能判斷深度。

類似的原理也可以在自動駕駛系統(tǒng)里用兩個攝像頭實現(xiàn)簡單的深度估計。

還有一種更常見的方法是單目深度估計,也就是只用一臺攝像頭實現(xiàn)深度估計。

由于單張圖像本身沒有視差信息,但是通過大量的數(shù)據(jù)和深度學習模型的訓練,計算機還是可以學到一些圖像里固有的深度線索。

像是路面變得模糊、物體變小、遮擋關系等都是跟深度有關的視覺信號。

深度學習模型通過卷積神經(jīng)網(wǎng)絡、特征提取等手段,把這些線索編碼起來,然后預測每個像素的深度。

單目深度估計在技術層面有一些難點,真實世界物體的尺度有很大變化,而且同樣的像素在不同場景下可能對應完全不同的距離,因此算法需要在大規(guī)模標注數(shù)據(jù)上訓練,讓模型學習到一般性的深度規(guī)律。

這個過程就像讓模型讀書一樣,通過成千上萬張有深度標注的圖像讓它明白每種視覺特征對應什么樣的深度分布。

訓練出的模型在看到新圖像時,就能給出合理的深度預測。

wKgZO2mRVxiAZe2KAAASAJELks8975.jpg

深度估計在自動駕駛中的具體作用

對于自動駕駛汽車而言,深度估計不僅意味著通過圖像識別距離,更重要的是能以較低成本實現(xiàn)更高階的自動駕駛功能。

沒有深度信息,車輛雖能“看見”周圍環(huán)境,卻無法準確判斷物體遠近;而有了深度信息,自動駕駛系統(tǒng)的“思考”才能真正從二維提升到三維空間,深度估計的直接作用包括。

碰撞預警:知道前方物體到底有多遠,從而判斷是否需要剎車或避讓。

路徑規(guī)劃:基于三維空間關系計算最佳行駛路線,而不僅僅是圖像中的像素路徑。

跟車距離控制:估計前車距離,決定加速或減速。

動態(tài)障礙物預測:結合機器學習追蹤其他車輛、行人的運動,并預測它們的未來位置。

所有這些功能都離不開準確的深度預測。若缺少可靠的深度信息,后續(xù)的路徑規(guī)劃與控制決策便失去了空間依據(jù)。

在自動駕駛系統(tǒng)中,深度估計的結果并非依賴單一來源,而是與激光雷達、毫米波雷達等其他傳感器數(shù)據(jù)進行融合(即“傳感器融合”)。

這種方式既能充分利用視覺數(shù)據(jù)所蘊含的豐富信息,也能彌補單一傳感器的局限性。

wKgZO2mRVx6AWAK8AAARwcz1hbg554.jpg

最后的話

把深度估計看成自動駕駛系統(tǒng)中的一個模塊,其實有點低估它的價值。它不是簡單的圖像變換,而是把二維視覺轉(zhuǎn)化成三維空間認知的橋梁。

它讓機器不僅看到世界,還能理解世界的結構和遠近關系。沒有準確的深度估計,自動駕駛車輛就缺乏最基本的空間感覺。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關注

    關注

    793

    文章

    14876

    瀏覽量

    179729
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自動駕駛中常的卷積神經(jīng)網(wǎng)絡是

    自動駕駛領域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡技術。卷積神經(jīng)網(wǎng)絡,簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像素排列成的二維網(wǎng)格。
    的頭像 發(fā)表于 11-19 18:15 ?2068次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的卷積神經(jīng)網(wǎng)絡是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“強化學習”是?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學習(Reinforcement Learning,簡稱RL)”,強化學習是一類讓機器通過試錯來學會做決策的技術。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?654次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“強化學習”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的ToF是?

    ToF。ToF輸出的是物理意義上的“距離”,不是通過圖像推理出來的估計值。這一點決定了它在很多應用里會被當作一很直接、可靠的深度來源。 ToF常被應用到能輸出“深度圖”的相機,或者做
    的頭像 發(fā)表于 10-10 09:58 ?977次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ToF是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“專家數(shù)據(jù)”是?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,經(jīng)常會聽到一概念,那便是“專家數(shù)據(jù)”。專家數(shù)據(jù),說白了就是“按理應該這么做”的那類示范數(shù)據(jù)。它不是隨機抓來的日志,也不是隨便標注的標簽,而是來源可靠
    的頭像 發(fā)表于 10-09 09:33 ?584次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“專家數(shù)據(jù)”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的ODD是?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛中,經(jīng)常會聽到一概念,那就是ODD。所謂ODD,全稱為Operational Design Domain,中文常譯為“運行設計域”或者“作業(yè)域”。直觀一點
    的頭像 發(fā)表于 09-22 09:04 ?897次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ODD是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的硬件在環(huán)是?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛技術時,經(jīng)常會提及一技術,那就是硬件在環(huán),所謂的硬件在環(huán)是?對于自動駕駛來說有
    的頭像 發(fā)表于 08-14 08:54 ?1230次閱讀

    自動駕駛中常的RTK是

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛關鍵技術時,經(jīng)常會聽到一技術,那就是RTK,很多人看到RTK后一定會想,這到底是技術?為啥這個技術很少在發(fā)布會上看到,但對于
    的頭像 發(fā)表于 08-10 10:35 ?1115次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的RTK是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的慣性導航系統(tǒng)是?可以不用嗎?

    每次提到自動駕駛硬件時,大家可能第一反應想到的是激光雷達、車載攝像頭、毫米波雷達等,但想要讓自動駕駛車輛實際落地,有一硬件也非常重要,那就是慣性導航系統(tǒng)。在很多討論自動駕駛技術的內(nèi)容
    的頭像 發(fā)表于 07-24 18:12 ?1917次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的慣性導航系統(tǒng)是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?可以不用嗎?

    自動駕駛中常的“時序”是?有作用?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛技術的發(fā)展,不僅依賴于感知算法的精度和決策規(guī)劃的智能,還深深植根于系統(tǒng)內(nèi)部對“時序”這一概念的精準把控。所謂時序,簡單來講,就是系統(tǒng)在不同模塊之間、不同傳感器
    的頭像 發(fā)表于 07-17 09:07 ?1046次閱讀

    自動駕駛中常的高精度地圖是?有何審查要求?

    不僅在空間分辨率和數(shù)據(jù)豐富度上有質(zhì)的飛躍,還在數(shù)據(jù)處理與安全管理方面提出了更嚴格的規(guī)范。那高精度地圖到底是?是否有什么具體需求? 高精度地圖,顧名思義,是一種面向自動駕駛的高分辨率、結構化道路環(huán)境數(shù)據(jù)集。它不僅包含道路的幾何
    的頭像 發(fā)表于 07-03 19:29 ?922次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的高精度地圖是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?有何審查要求?

    自動駕駛中常的世界模型是?

    對外部環(huán)境進行抽象和建模的技術,讓自動駕駛系統(tǒng)在一簡潔的內(nèi)部“縮影”里,對真實世界進行描述與預測,從而為感知、決策和規(guī)劃等關鍵環(huán)節(jié)提供有力支持。 什么是世界模型? 我們不妨先把“世界模型”想象成一種“數(shù)字化的地
    的頭像 發(fā)表于 06-24 08:53 ?1121次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的世界模型是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的HMI是?

    控”的過程中,人機交互界面擔負著承上啟下、溝通信息與建立信任的重任。此外,這一領域也是可以給駕駛員和乘客帶來最直觀感知的一項技術,因此對于很多車企來說,這也是最值得深度研究的一部分。那HMI到底是
    的頭像 發(fā)表于 06-22 13:21 ?2340次閱讀

    自動駕駛中常的“點云”是?

    ?對自動駕駛有何影響? 點云是? 點云(Point Cloud)是一種在三維空間中由大量離散點組成的數(shù)據(jù)集合,每個點包含自身的笛卡爾坐標(X、Y、Z),并可附帶顏色、強度、時間戳
    的頭像 發(fā)表于 05-21 09:04 ?1115次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“點云”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“NOA”是?

    近年來,自動駕駛技術發(fā)展迅速,業(yè)界不斷探索如何在復雜交通場景中實現(xiàn)真正的無人駕駛。城市NOA作為自動駕駛的一項前沿技術,正成為各大廠商相互爭奪的關鍵技術。 何為NOA? NOA,全稱
    的頭像 發(fā)表于 04-09 09:03 ?3043次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛大模型中常的Token是?對自動駕駛有何影響?

    、多模態(tài)傳感器數(shù)據(jù)的實時處理與決策。在這一過程中,大模型以其強大的特征提取、信息融合和預測能力為自動駕駛系統(tǒng)提供了有力支持。而在大模型的中,有一“Token”的概念,有些人看到后或許會問: Token是
    的頭像 發(fā)表于 03-28 09:16 ?1332次閱讀