91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

端到端是怎么讓自動駕駛更像老司機的?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-01-21 09:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]如果將自動駕駛的發(fā)展史比作人類的學習歷程,那么在過去很長一段時間里,這個“學生”其實一直都在背誦極其繁瑣的教條。這一階段的自動駕駛系統(tǒng)使用的是模塊化架構,它的運行高度依賴于手寫的成千上萬條邏輯規(guī)則。比如如果遇到行人過馬路,你就剎車;如果前面的車打左轉向燈,你就稍微減速;如果看到黃燈閃爍,你就判斷距離是否足夠停車。這種方式在邏輯簡單的封閉園區(qū)或是結構化程度極高的高速公路上或許管用,但在充滿隨機性的城市鬧市區(qū),這套系統(tǒng)就會有些吃力。

自動駕駛行業(yè)之所以在近兩年集體轉向“端到端”架構,本質上是因為大家終于意識到,真實世界的復雜程度是不可能通過人工窮舉來覆蓋的。端到端架構的核心在于它實現(xiàn)了一種從“信號輸入”到“控制輸出”的直接映射。用通俗的話說,它讓汽車不再是按照指令執(zhí)行程序的機器,而是變成了一個擁有“駕駛直覺”的智能體。

這種駕駛直覺是一行行敲出來的代碼決定的,而是神經(jīng)網(wǎng)絡通過觀察數(shù)百萬小時的人類駕駛視頻,自己悟出來的肌肉記憶。特斯拉的FSD v12版本通過用一個統(tǒng)一的神經(jīng)網(wǎng)絡替換掉之前三十多萬行復雜的C++代碼,徹底打破了傳統(tǒng)算法的上限,讓智駕表現(xiàn)出了前所未有的絲滑感。

wKgZO2lwK--AfYbAAAAQo00DEvw035.jpg

傳統(tǒng)架構與端到端的區(qū)別

要理解端到端到底解決了什么,我們得先知道傳統(tǒng)架構具體有什么問題。在傳統(tǒng)架構中,感知模塊就像是汽車的“眼睛”,它盯著畫面看,然后把看到的障礙物轉化成一個個簡單的幾何體,并給出一組坐標,再傳給規(guī)控模塊。

但這種方式有個致命的問題,一旦感知模塊認定前方是一個“矩形框”,它會把這個物體背后的很多細節(jié)信息都給抹掉。比如看到一個行人正回頭看車,或者正準備加速奔跑,這些細微的動態(tài)在被簡化成坐標的過程中就消失了。規(guī)控模塊拿到的只會是這些干巴巴的、甚至可能帶有錯誤的抽象數(shù)據(jù),這就像是一個人蒙著眼睛聽別人轉述路況,聽到的還是經(jīng)過劣質翻譯后的信息,決策起來自然畏手畏腳。

在端到端架構下,數(shù)據(jù)在神經(jīng)網(wǎng)絡內(nèi)部是以高維特征的形式流動的,沒有任何信息會被強行“翻譯”或“截斷”。這意味著系統(tǒng)能直接感知到那些難以用語言定義的微妙環(huán)境,像是夕陽照在路面上的反光、積水倒映出的虛影,或者是前方車輛剎車燈亮起的瞬間等都可以直接轉化成決策控制的依據(jù)。

wKgZPGlwK_CAK73PAAB0E39pPWU240.jpg

模塊化與端到端自動駕駛區(qū)別,圖片源自:網(wǎng)絡

這種“感知-決策”一體化的設計,使自動駕駛系統(tǒng)在訓練時不再是各個模塊自掃門前雪,而是會朝著一個終極目標,也就是“像人類一樣平穩(wěn)安全地開車”,并進行全局優(yōu)化。

這種全局優(yōu)化的邏輯帶來的提升是顛覆性的。在傳統(tǒng)架構中,感知模塊報錯可能僅僅是因為某個目標的識別率掉了百分之二,但這百分之二的錯誤傳到規(guī)控模塊可能就觸發(fā)一次急剎。但在端到端架構里,系統(tǒng)具備了極強的容錯和“自我修復”能力,它在學習時就理解了哪些視覺特征是對駕駛結果至關重要的,哪些是可以忽略的噪聲。

以UniAD模型為例,它在一個統(tǒng)一的Transformer框架下,將目標檢測、軌跡跟蹤、建圖和規(guī)劃等任務全整合在一起。大家在同一個BEV(鳥瞰圖)特征空間里交流,預測模塊在推算別人的路線時,會同時參考自車正打算往哪兒開,這使得自動駕駛感知與決策過程極其高效,可以讓智駕系統(tǒng)在處理復雜的變道擠入、無保護左轉等場景時,表現(xiàn)得更像一個經(jīng)驗豐富的老司機。

架構對比維度 傳統(tǒng)模塊化架構(Modular System) 端到端神經(jīng)網(wǎng)絡架構(End-to-End System)
邏輯基礎 基于“If-Then”的人工硬編碼規(guī)則 基于大規(guī)模人類駕駛數(shù)據(jù)的神經(jīng)網(wǎng)絡自學習
信息損耗 模塊間通過定義接口傳輸(如坐標、標簽),信息丟失大 全局特征向量流動,保留了原始傳感器的細微語義
長尾場景處理 嚴重依賴補丁代碼,難以覆蓋邊緣案例 具備跨場景的泛化能力,能處理未見過的異常工況
優(yōu)化策略 局部優(yōu)化,各模塊目標不一致甚至沖突 以軌跡規(guī)劃為唯一終極目標進行全局聯(lián)合優(yōu)化
更新速度 極其緩慢,需人工調試參數(shù)并驗證邏輯鏈條 極快,通過增加高質量數(shù)據(jù)和算力自動進化
響應時延 模塊串行處理,疊加時延高且不穩(wěn)定 單次推理周期固定,響應時間通常在毫秒級

傳統(tǒng)架構與端到端的區(qū)別

wKgZO2lwK_GAHCZPAAAR42n7O-I309.jpg

端到端賦予機器物理直覺

如果端到端只是簡單地模仿人類的操作,那它還算不上完全的智能。想要成為真正的老司機,那一定是要能夠“預判”未來,也就是在腦子里模擬未來幾秒鐘可能發(fā)生的所有情景。在端到端技術的發(fā)展路徑中,世界模型(World Models)的加入相當于給系統(tǒng)裝上了一個“大腦模擬器”。

這種模型不再死記硬背路面長什么樣,而是通過觀察海量的視頻數(shù)據(jù),學會現(xiàn)實世界的物理規(guī)律。它知道一個球滾出來之后大概率會有個孩子跟上來,也知道在雨天剎車距離會變長。世界模型的本質是一種生成式的人工智能,它能夠根據(jù)當前的畫面,預測并生成出未來各種可能的演化路徑。

這種預測能力對于解決自動駕駛最頭疼的“長尾場景”至關重要。傳統(tǒng)的算法在遇到從未見過的施工工地或者奇形怪狀的交通事故現(xiàn)場時,會因為沒有對應的代碼指令而直接“罷工”或是亂開。但具備世界模型的端到端系統(tǒng),能夠基于它對物理世界的常識性理解,推斷出那些障礙物是不可逾越的。

wKgZPGlwK_GALqDYAAadZZ1MXyI918.jpg

圖片源自:網(wǎng)絡

更有意思的是,世界模型不僅能輔助決策,它還是一個極其強大的“數(shù)據(jù)模擬器”。在現(xiàn)實中采集極端的危險場景成本極高且非常危險,但在神經(jīng)網(wǎng)絡內(nèi)部,世界模型可以憑空創(chuàng)造出成千上萬個符合邏輯的險情場景,讓端到端模型在這些創(chuàng)造出的場景中瘋狂演練。這種從真實中提煉規(guī)律,再用規(guī)律反哺虛擬訓練的閉環(huán),使得自動駕駛的進化速度比以前單純靠實車跑里程要快上百倍。

與世界模型相輔相成的是3D占用網(wǎng)絡(Occupancy Network)。這是端到端架構在空間感知上的另一大利器。以前的自動駕駛系統(tǒng)習慣于把世界看成是一個個如車、人、樹等特定種類的“物體”。但這種思維方式太狹隘了,如果在路上遇到一個形狀怪異的雕塑,或者是從卡車上掉落的一個大木箱,系統(tǒng)可能因為認不出它是什么而選擇無視它。

3D占用網(wǎng)絡則粗暴且有效地解決了這個問題,它不管障礙物到底是什么,它只會把空間切碎成無數(shù)個微小的體素(Voxel),然后判斷每一個格子里到底有沒有東西。這就賦予了汽車一種“幾何直覺”,只要那個空間被占用了,無論它是什么東西,系統(tǒng)都會繞著走。這種不依賴語義標簽的避障方式,極大地增強了端到端系統(tǒng)的安全底線,讓自動駕駛汽車在面對千奇百怪的城市場景時,依然能保持良好的行駛表現(xiàn)。

wKgZO2lwK_GAExuCAAASG3BOmsQ393.jpg

端到端不得不面對的黑盒問題

雖然端到端系統(tǒng)可以展現(xiàn)出老司機的“車感”,但它有一個不得不面對的問題,那就是不可解釋的“黑盒”。如果傳統(tǒng)的模塊化系統(tǒng)出了事故,可以翻看日志,精準地定位到故障點。但在一個擁有數(shù)億參數(shù)的神經(jīng)網(wǎng)絡里,方向盤往左轉一度,可能是受到多個因素的影響,沒人能說得清到底為什么。這種“不可解釋性”是端到端落地的最大攔路虎。

wKgZPGlwK_KAdGvcAABdQcngJ-Q652.jpg

圖片源自:網(wǎng)絡

為了解決這個問題,有技術嘗試引入一種擬人的架構設計,那就是借鑒諾貝爾獎得主丹尼爾·卡尼曼提出的“快慢系統(tǒng)”理論。在這種架構里,端到端神經(jīng)網(wǎng)絡充當?shù)氖恰跋到y(tǒng)1”,負責毫秒級的直覺反應。而為了制衡這種直覺,又在外面套上了一個“系統(tǒng)2”,也就是基于視覺語言模型(VLM)或者是硬編碼規(guī)則的安全防御層。

系統(tǒng)2就像是一個坐在副駕駛的教練,它不僅能理解“別闖紅燈”、“單行道不能進入”這些明確的符號規(guī)則,還能通過邏輯推理來判斷系統(tǒng)1的操作是否符合規(guī)范。如果端到端模型因為某些特征誤導做出危險的動作,系統(tǒng)2就會通過預設的物理安全規(guī)則強制切斷控制權,并做出安全的動作或緊急剎停。這種“神經(jīng)網(wǎng)絡負責上限,傳統(tǒng)規(guī)則負責下限”的策略,是目前端到端技術量產(chǎn)落地的最優(yōu)解。

順著這個邏輯看下去,端到端的進化也正在重塑整個汽車產(chǎn)業(yè)。以前自動駕駛團隊里最多的是寫邏輯代碼的C++工程師,但現(xiàn)在,最核心的角色變成了數(shù)據(jù)和算力運維專家。自動駕駛系統(tǒng)的強弱不再取決于誰寫的代碼更精妙,而取決于誰能更高效地篩選出高質量的駕駛視頻,誰能搭建出規(guī)模更大的GPU訓練集群。這種轉變,讓自動駕駛的競爭徹底變成了一場資源的較量。只有那些擁有百萬級裝機量、能形成閉環(huán)數(shù)據(jù)流的企業(yè),才能通過不斷的迭代,讓系統(tǒng)在每一次版本更新中變得越來越像一名“老司機”。

wKgZO2lwK_KAZRr5AAASAJELks8170.jpg

端到端落地會帶來哪些挑戰(zhàn)?

當我們從更高維度俯瞰自動駕駛的發(fā)展,我們就會發(fā)現(xiàn)端到端架構其實是在嘗試解決人工智能的一個終極難題,那就是如何讓機器理解常識。像是看到路邊有皮球滾過要小心有小孩、雨天不能離大貨車太近等在人類看來是常識的場景,以前是需要工程師絞盡腦汁去設計邏輯條件的。

而端到端通過對海量真實數(shù)據(jù)的學習,在神經(jīng)網(wǎng)絡中沉淀出了一種“物理世界的常識”。當這種常識積累到一定程度,系統(tǒng)就會表現(xiàn)類人的智能,它會知道應如何禮讓行人,如何在復雜的并線中尋找空隙。這種進化是不受人工編程限制的,它唯一的邊界就是數(shù)據(jù)的豐富度和算力的天花板。

wKgZPGlwK_OAYZFuAEASN_5zzys529.jpg

圖片源自:網(wǎng)絡

當然,端到端架構對數(shù)據(jù)質量的要求近乎苛刻,如果喂給它的是大量平庸甚至沒有借鑒性的駕駛視頻,訓練出來的模型也只會是一個“平庸的司機”。此外,為了支撐這種超大規(guī)模模型的推理,車載芯片的內(nèi)存帶寬和算力開銷也成了必須面對的硬成本。

尤其是當系統(tǒng)變得越來越像人時,人類社會該如何構建一套全新的評估和定責標準?當一個黑盒模型做出了違規(guī)操作,我們該如何對其進行精準的修正而又不產(chǎn)生副作用?這些問題目前都還在探索之中。

但不可否認的是,端到端架構已經(jīng)為自動駕駛指明了通往更高階智能的方向。它通過消除模塊間的信息壁壘,利用全局優(yōu)化打破了人類邏輯的上限。隨著世界模型、大語言模型與端到端架構的進一步深度融合,未來的智駕系統(tǒng)將不僅能看清路,更能“讀懂”這個復雜多變的人類世界。這種從“機器駕駛”向“類人智能駕駛”的跨越,正是端到端技術帶給我們的核心答案。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 端到端
    +關注

    關注

    0

    文章

    49

    瀏覽量

    10833
  • 自動駕駛
    +關注

    關注

    793

    文章

    14879

    瀏覽量

    179783
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自動駕駛為什么會出現(xiàn)黑盒現(xiàn)象?

    自動駕駛領域,(End-to-End)是指從感知環(huán)境的原始數(shù)據(jù)車輛實際控制指令,全部交給一個統(tǒng)一的深度學習模型來完成。這和傳統(tǒng)的模
    的頭像 發(fā)表于 02-20 09:25 ?9232次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>為什么會出現(xiàn)黑盒現(xiàn)象?

    如何訓練好自動駕駛模型?

    [首發(fā)于智駕最前沿微信公眾號]最近有位小伙伴在后臺留言提問:算法是怎樣訓練的?是模仿學習、強化學習和離線強化學習這三類嗎?其實
    的頭像 發(fā)表于 12-08 16:31 ?1427次閱讀
    如何訓練好<b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型?

    自動駕駛仿真與基于規(guī)則的仿真有什么區(qū)別?

    自動駕駛領域,“仿真”指的是將感知控制的整個決策鏈條視為一個整體,從而進行訓練和驗證的思路。
    的頭像 發(fā)表于 11-02 11:33 ?1701次閱讀

    自動駕駛中“一段式”和“二段式”有什么區(qū)別?

    [首發(fā)于智駕最前沿微信公眾號]最近有小伙伴提問,一段式和二段式有什么區(qū)別。其實說到
    的頭像 發(fā)表于 10-24 09:03 ?1161次閱讀
    <b class='flag-5'>自動駕駛</b>中“一段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”和“二段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”有什么區(qū)別?

    西井科技自動駕駛模型獲得國際認可

    近日,西井科技AI創(chuàng)研團隊在國際權威自動駕駛算法榜單NAVSIM v2中脫穎而出,憑借創(chuàng)新的自動駕駛模型,以綜合得分48.759的成績
    的頭像 發(fā)表于 10-15 17:20 ?1279次閱讀

    一文讀懂特斯拉自動駕駛FSD從輔助的演進

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛行業(yè)發(fā)展至今,特斯拉一直被很多企業(yè)對標,其FSD系統(tǒng)的每一次更新,都會獲得非常多人的關注。早期自動駕駛是一個分層的、由多模塊組成的系統(tǒng),感知、定位、預測、規(guī)劃
    的頭像 發(fā)表于 10-11 09:13 ?804次閱讀
    一文讀懂特斯拉<b class='flag-5'>自動駕駛</b>FSD從輔助<b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的演進

    自動駕駛大模型為什么會有不確定性?

    。為了能讓自動駕駛汽車做出正確、安全且符合邏輯的行駛動作,大模型被提了出來。
    的頭像 發(fā)表于 09-28 09:20 ?867次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型為什么會有不確定性?

    自動駕駛相較傳統(tǒng)自動駕駛到底有何提升?

    各自專業(yè)模塊獨立承擔,再通過預定的接口協(xié)議將信息有序傳遞。與之相對照,“”(end-to-end)自動駕駛以統(tǒng)一的大規(guī)模神經(jīng)網(wǎng)絡為核心,將從攝像頭、雷達、激光雷達等傳感器采集
    的頭像 發(fā)表于 09-02 09:09 ?822次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動駕駛</b>相較傳統(tǒng)<b class='flag-5'>自動駕駛</b>到底有何提升?

    Nullmax自動駕駛最新研究成果入選ICCV 2025

    近日,國際計算機視覺大會 ICCV 2025 正式公布論文錄用結果,Nullmax 感知團隊在自動駕駛方向的最新研究成果《HiP-AD: Hierarchical
    的頭像 發(fā)表于 07-05 15:40 ?1801次閱讀
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動駕駛</b>最新研究成果入選ICCV 2025

    為什么自動駕駛大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術落地,(End-to-End)大模型也成為行業(yè)研究與應用的熱門方向。相較于傳統(tǒng)自動駕駛
    的頭像 發(fā)表于 07-04 16:50 ?881次閱讀
    為什么<b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有黑盒特性?

    數(shù)據(jù)標注方案在自動駕駛領域的應用優(yōu)勢

    10-20TB,其中需要標注的數(shù)據(jù)占比超過60%。在這樣的背景下,數(shù)據(jù)標注方案應運而生,正在重塑自動駕駛的數(shù)據(jù)生產(chǎn)范式。
    的頭像 發(fā)表于 06-23 17:27 ?998次閱讀

    一文帶你厘清自動駕駛架構差異

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術飛速發(fā)展,智能駕駛系統(tǒng)的設計思路也經(jīng)歷了從傳統(tǒng)模塊化架構
    的頭像 發(fā)表于 05-08 09:07 ?1027次閱讀
    一文帶你厘清<b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架構差異

    自動駕駛中基于規(guī)則的決策和大模型有何區(qū)別?

    自動駕駛架構的選擇上,也經(jīng)歷了從感知、決策控制、執(zhí)行的三段式架構到現(xiàn)在火熱的大模型,尤其是在2024年特斯拉推出FSD V12后,各車企更是陸續(xù)推出自家的
    的頭像 發(fā)表于 04-13 09:38 ?3732次閱讀
    <b class='flag-5'>自動駕駛</b>中基于規(guī)則的決策和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有何區(qū)別?

    東風汽車推出自動駕駛開源數(shù)據(jù)集

    近日,智能網(wǎng)聯(lián)汽車智駕數(shù)據(jù)空間構建研討會暨中汽協(xié)會智能網(wǎng)聯(lián)汽車分會、數(shù)據(jù)分會2024年度會議在上海舉辦。會上,東風汽車發(fā)布行業(yè)規(guī)模最大、涵蓋125萬組高質量數(shù)據(jù)的自動駕駛開源數(shù)據(jù)
    的頭像 發(fā)表于 04-01 14:54 ?1229次閱讀

    動量感知規(guī)劃的自動駕駛框架MomAD解析

    自動駕駛框架實現(xiàn)了感知與規(guī)劃的無縫集成,但通常依賴于一次性軌跡預測,這可能導致控制不穩(wěn)定,并且對單頓感知中的遮擋問題較為敏感。為解決這一問題,我們提出了動量感知
    的頭像 發(fā)表于 03-18 09:31 ?1691次閱讀
    動量感知規(guī)劃的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動駕駛</b>框架MomAD解析