91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何構(gòu)建適合自動(dòng)駕駛的世界模型?

智駕最前沿 ? 來(lái)源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-02-18 08:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷了系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車(chē)上,還是近幾年才提出的。那世界模型是自動(dòng)駕駛落地的正解嗎?

wKgZO2mVBEyAGVAHAAAQo00DEvw332.jpg

什么是世界模型?

世界模型對(duì)于自動(dòng)駕駛汽車(chē)來(lái)說(shuō),更像是給汽車(chē)大腦里繪制一張地圖,可以將環(huán)境的現(xiàn)狀和未來(lái)可能的演變都表示出來(lái),讓自動(dòng)駕駛系統(tǒng)不只是“看見(jiàn)當(dāng)下”,還能“想一想接下來(lái)可能發(fā)生什么”。

簡(jiǎn)單理解就是,世界模型不僅可以讓自動(dòng)駕駛汽車(chē)知道哪里有車(chē)道、紅綠燈和障礙物,更可以預(yù)測(cè)這些障礙物的未來(lái)變化,這對(duì)于確保自動(dòng)駕駛系統(tǒng)安全,是非常重要的。

世界模型能夠?qū)?a target="_blank">傳感器(如攝像頭、雷達(dá)、激光雷達(dá)和車(chē)載定位系統(tǒng)等)采集的原始觀測(cè)數(shù)據(jù),轉(zhuǎn)化為一種低維、抽象的“隱狀態(tài)”(latent state)作為內(nèi)部表示。

模型學(xué)習(xí)該隱狀態(tài)隨時(shí)間演變的規(guī)律(即動(dòng)力學(xué)),并基于此進(jìn)行預(yù)測(cè)或規(guī)劃。世界模型可以是顯式的物理模型或概率模型,也可以是基于學(xué)習(xí)得到的神經(jīng)網(wǎng)絡(luò)模型;它不僅可以用于直接回放未來(lái)場(chǎng)景(仿真模擬),也可以?xún)H生成下一時(shí)刻的概率分布以輔助決策。

wKgZO2mVBE2AV74VAAAR42n7O-I562.jpg

世界模型在自動(dòng)駕駛中的核心作用

對(duì)于自動(dòng)駕駛系統(tǒng)來(lái)說(shuō),世界模型可以應(yīng)用在預(yù)測(cè)、規(guī)劃與驗(yàn)證等三個(gè)方面。預(yù)測(cè)是世界模型最直觀的用途,傳統(tǒng)感知可以把周?chē)矬w識(shí)別出來(lái)并定位,但這只是“靜態(tài)”信息。

世界模型通過(guò)學(xué)習(xí)交通參與者的行為模式和場(chǎng)景的動(dòng)力學(xué),能夠給出更長(zhǎng)時(shí)域的、多步的預(yù)測(cè)。如可以在十幾秒的時(shí)間尺度上,判斷騎著自行車(chē)的如是否會(huì)靠近路口,或一輛并線(xiàn)的車(chē)是否會(huì)與本車(chē)發(fā)生交叉軌跡等。

這樣的預(yù)測(cè)不是簡(jiǎn)單的勻速延伸,而是包含了對(duì)意圖、交互和環(huán)境約束的理解。

規(guī)劃需要評(píng)估不同動(dòng)作的后果,選擇既安全又舒適的軌跡,是規(guī)劃的主要目的。世界模型可以依托內(nèi)置的“模擬環(huán)境”,把候選軌跡在模型里“演練”幾次,比較它們?cè)谖磥?lái)幾秒內(nèi)的風(fēng)險(xiǎn)和收益。

比起只靠規(guī)則或短時(shí)預(yù)測(cè),這種基于世界模型的規(guī)劃更能處理如窄路會(huì)車(chē)、密集并線(xiàn)或不守規(guī)則的交通參與者等復(fù)雜的多主體交互場(chǎng)景。它還能幫助車(chē)輛做出更保守或更激進(jìn)的策略選擇,并把不確定性帶進(jìn)決策中。

訓(xùn)練和驗(yàn)證自動(dòng)駕駛系統(tǒng)需要大量場(chǎng)景、尤其是罕見(jiàn)或危險(xiǎn)場(chǎng)景。真實(shí)世界里采集這些場(chǎng)景不僅昂貴而且很危險(xiǎn)。

世界模型可以生成高質(zhì)量的合成場(chǎng)景或作為數(shù)字孿生的一部分,用來(lái)做大規(guī)模的虛擬測(cè)試。通過(guò)在模型中反復(fù)模擬,就可以發(fā)現(xiàn)自動(dòng)駕駛系統(tǒng)在長(zhǎng)尾場(chǎng)景下的弱點(diǎn),避免把危險(xiǎn)行為部署到實(shí)車(chē)。

wKgZO2mVBE2AMU71AAASG3BOmsQ261.jpg

世界模型如何被構(gòu)建?

要讓模型有“想象未來(lái)”的能力,一定要喂給它大量合適的數(shù)據(jù)。自動(dòng)駕駛的世界模型可以依托攝像頭提供豐富的視覺(jué)細(xì)節(jié),激光雷達(dá)給出精確的三維幾何信息,毫米波雷達(dá)對(duì)惡劣天氣更魯棒,車(chē)載定位和CAN總線(xiàn)送來(lái)車(chē)輛自身狀態(tài)等數(shù)據(jù)進(jìn)行學(xué)習(xí)。

把這些數(shù)據(jù)融合后,模型要學(xué)會(huì)抽取有用的表示,這一步叫表示學(xué)習(xí)。一個(gè)好的表示不僅可以保留對(duì)決策重要的細(xì)節(jié)(例如相對(duì)速度、可通過(guò)空間),還能壓縮冗余信息,方便后續(xù)預(yù)測(cè)和規(guī)劃使用。

表示之后是要進(jìn)行動(dòng)力學(xué)建模,也就是學(xué)習(xí)隱狀態(tài)如何隨時(shí)間變化。這里有兩類(lèi)主流做法。

一類(lèi)是基于物理或圖模型的顯式方法,通過(guò)寫(xiě)出規(guī)則或物理方程來(lái)描述車(chē)輛與行人的運(yùn)動(dòng),再把觀測(cè)通過(guò)濾波器或貝葉斯推斷與這些模型結(jié)合。顯式方法好處是可解釋、易于驗(yàn)證,但面對(duì)復(fù)雜的人類(lèi)行為時(shí)往往力不從心。

另一類(lèi)是端到端學(xué)習(xí)的方式,使用循環(huán)神經(jīng)網(wǎng)絡(luò)、變分自編碼器或近期流行的時(shí)序Transformer來(lái)直接學(xué)習(xí)從過(guò)去觀測(cè)到未來(lái)隱狀態(tài)的映射。學(xué)習(xí)型方法在復(fù)雜交互上更有表現(xiàn)力,但需要大量訓(xùn)練數(shù)據(jù)和注意不確定性的表達(dá)。

但無(wú)論采用哪種架構(gòu),不確定性建模都非常關(guān)鍵。

世界不是確定的,行人會(huì)猶豫、司機(jī)會(huì)突然變道。把預(yù)測(cè)做成帶概率的形式(例如把未來(lái)位置用概率分布表示,或生成若干可能的未來(lái)軌跡并給出置信度)能讓決策器更穩(wěn)健。把因果推理或意圖推斷融入世界模型,不僅可以預(yù)測(cè)位置,還能推斷“為什么會(huì)這樣”,這對(duì)處理前所未有的情況很重要。

wKgZO2mVBE6AC0eNAAASAJELks8717.jpg

實(shí)際應(yīng)用中的幾個(gè)典型場(chǎng)景

一直都說(shuō)概念,那世界模型對(duì)于自動(dòng)駕駛的具體應(yīng)用場(chǎng)景有哪些?可以想象一下,若車(chē)輛右側(cè)有一輛停著的貨車(chē),貨車(chē)后面可能有行人準(zhǔn)備穿行。

單純靠感知可能看不到那名行人,但世界模型可以結(jié)合道路環(huán)境、過(guò)往行人出現(xiàn)的位置規(guī)律以及路邊停放車(chē)輛的用途,給出“可能有人從后面出來(lái)”的預(yù)測(cè),從而促使決策器放慢速度并給出預(yù)留空間。

在高速并道時(shí),兩輛車(chē)互相示意并線(xiàn)的行為充滿(mǎn)著博弈意味。世界模型這時(shí)候就能觀察雙方的速度與加速度變化、轉(zhuǎn)向幅度等,估計(jì)對(duì)方的意圖并預(yù)測(cè)多個(gè)可能的并線(xiàn)結(jié)果,從而選擇一種在時(shí)間和空間上更安全的并線(xiàn)策略,或者選擇先放慢再并線(xiàn)。

在施工、臨時(shí)交通指引或其他異常標(biāo)志的情況下,規(guī)則驅(qū)動(dòng)的系統(tǒng)容易出錯(cuò)。世界模型可以把臨時(shí)的交通錐、施工車(chē)與交通參與者的行為模式聯(lián)系起來(lái),判斷這是一個(gè)臨時(shí)改道的道路,并在短時(shí)內(nèi)學(xué)習(xí)到新的可行策略,而不是盲目遵循過(guò)往的規(guī)則。

wKgZO2mVBE6ASWmvAAARwcz1hbg131.jpg

最后的話(huà)

把世界模型放在自動(dòng)駕駛的全局來(lái)理解,它的核心價(jià)值是把現(xiàn)時(shí)感知和未來(lái)決策連接起來(lái)。其不是簡(jiǎn)單的把感知結(jié)果當(dāng)作事實(shí),而是在內(nèi)心(模型)里構(gòu)建一個(gè)短期可運(yùn)行的“虛擬世界”,并在這個(gè)虛擬世界里反復(fù)試錯(cuò)、評(píng)估風(fēng)險(xiǎn)、選擇動(dòng)作。這樣做能顯著提升系統(tǒng)對(duì)復(fù)雜交互場(chǎng)景、遮擋、長(zhǎng)尾事件的處理能力,也能為離線(xiàn)的大規(guī)模驗(yàn)證提供重要工具。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14882

    瀏覽量

    179813
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    2026年,3DGS和世界模型,在自動(dòng)駕駛仿真中的組合應(yīng)用

    寫(xiě)在前面:作為自動(dòng)駕駛仿真的核心支撐,3DGS與世界模型的技術(shù)落地一直備受關(guān)注。我們看到了車(chē)路漫漫的一篇文章,探討了3DGS與世界模型的路線(xiàn)
    的頭像 發(fā)表于 02-03 17:32 ?3204次閱讀
    2026年,3DGS和<b class='flag-5'>世界</b><b class='flag-5'>模型</b>,在<b class='flag-5'>自動(dòng)駕駛</b>仿真中的組合應(yīng)用

    Transformer如何讓自動(dòng)駕駛模型獲得思考能力?

    在談及自動(dòng)駕駛時(shí),Transformer一直是非常關(guān)鍵的技術(shù),為何Transformer在自動(dòng)駕駛行業(yè)一直被提及?
    的頭像 發(fā)表于 02-01 09:15 ?4156次閱讀

    自動(dòng)駕駛中常提的模仿學(xué)習(xí)是什么?

    當(dāng)談及自動(dòng)駕駛模型學(xué)習(xí)時(shí),經(jīng)常會(huì)提到模仿學(xué)習(xí)的概念。所謂模仿學(xué)習(xí),就是模型先看別人怎么做,然后學(xué)著去做。自動(dòng)駕駛中的模仿學(xué)習(xí),就是把人類(lèi)司機(jī)在各種路況下的行為做成范例,記錄下看到了什么
    的頭像 發(fā)表于 01-16 16:41 ?1993次閱讀

    黃仁勛:未來(lái)十年很多汽車(chē)是自動(dòng)駕駛 英偉達(dá)發(fā)布Alpamayo汽車(chē)大模型平臺(tái)

    最看好的AI落地場(chǎng)景就是自動(dòng)駕駛。在演講中黃仁勛提到,未來(lái)十年,世界上很大一部分汽車(chē)將是自動(dòng)駕駛或高度自動(dòng)駕駛的。你期待嗎? 英偉達(dá)發(fā)布Alpamayo汽車(chē)大
    的頭像 發(fā)表于 01-06 11:45 ?1086次閱讀

    自動(dòng)駕駛中常提的世界模型是什么?

    在很多廠家的技術(shù)方案中,會(huì)提到世界模型的介紹。世界模型,就是自動(dòng)駕駛系統(tǒng)內(nèi)部用來(lái)表示外部世界并預(yù)
    的頭像 發(fā)表于 01-05 16:23 ?903次閱讀

    世界模型是讓自動(dòng)駕駛汽車(chē)?yán)斫?b class='flag-5'>世界還是預(yù)測(cè)未來(lái)?

    ? [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型自動(dòng)駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對(duì)自動(dòng)駕駛的作用時(shí),難免會(huì)出現(xiàn)分歧。它到底是讓自動(dòng)駕駛汽車(chē)
    的頭像 發(fā)表于 12-16 09:27 ?868次閱讀
    <b class='flag-5'>世界</b><b class='flag-5'>模型</b>是讓<b class='flag-5'>自動(dòng)駕駛</b>汽車(chē)?yán)斫?b class='flag-5'>世界</b>還是預(yù)測(cè)未來(lái)?

    VLA能解決自動(dòng)駕駛中的哪些問(wèn)題?

    、語(yǔ)言表達(dá)和動(dòng)作控制這三者整合到一個(gè)統(tǒng)一的模型框架中。 與傳統(tǒng)自動(dòng)駕駛系統(tǒng)將感知、預(yù)測(cè)、規(guī)劃、控制拆解為多個(gè)獨(dú)立模塊的做法不同,VLA可以縮短“看見(jiàn)什么”和“如何行動(dòng)”之間的鴻溝,構(gòu)建一個(gè)能直接將視覺(jué)輸入和語(yǔ)言描述映射到具體動(dòng)作
    的頭像 發(fā)表于 11-25 08:53 ?488次閱讀
    VLA能解決<b class='flag-5'>自動(dòng)駕駛</b>中的哪些問(wèn)題?

    模型中常提的快慢思考會(huì)對(duì)自動(dòng)駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車(chē)發(fā)布的基于端到端模型、VLM視覺(jué)語(yǔ)言模型世界模型的全新自動(dòng)駕駛技術(shù)架構(gòu)標(biāo)志著其全棧自研的智能
    的頭像 發(fā)表于 11-22 10:59 ?2499次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會(huì)對(duì)<b class='flag-5'>自動(dòng)駕駛</b>產(chǎn)生什么影響?

    VLA和世界模型,誰(shuí)才是自動(dòng)駕駛的最優(yōu)解?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)發(fā)展,其實(shí)現(xiàn)路徑也呈現(xiàn)出兩種趨勢(shì),一邊是以理想、小鵬、小米為代表的VLA(視覺(jué)—語(yǔ)言—行動(dòng))模型路線(xiàn);另一邊則是以華為、蔚來(lái)為主導(dǎo)的世界模型
    的頭像 發(fā)表于 11-05 08:55 ?783次閱讀
    VLA和<b class='flag-5'>世界</b><b class='flag-5'>模型</b>,誰(shuí)才是<b class='flag-5'>自動(dòng)駕駛</b>的最優(yōu)解?

    為什么自動(dòng)駕駛端到端大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)落地,端到端(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門(mén)方向。相較于傳統(tǒng)自動(dòng)駕駛系統(tǒng)中的模塊化結(jié)構(gòu),端到端模型嘗試直接從感知輸
    的頭像 發(fā)表于 07-04 16:50 ?882次閱讀
    為什么<b class='flag-5'>自動(dòng)駕駛</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    自動(dòng)駕駛中常提的世界模型是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)的不斷成熟,車(chē)輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見(jiàn)”周?chē)?b class='flag-5'>世界,還要能“理解”和“推測(cè)”未來(lái)的變化。世界模型
    的頭像 發(fā)表于 06-24 08:53 ?1125次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個(gè)啥?

    新能源車(chē)軟件單元測(cè)試深度解析:自動(dòng)駕駛系統(tǒng)視角

    焦點(diǎn)是否落在目標(biāo)物體上。某自動(dòng)駕駛公司借此發(fā)現(xiàn)模型在夜間過(guò)度關(guān)注路燈而非行人。 ? 實(shí)時(shí)性保障: ?時(shí)間感知測(cè)試框架(TAF)注入時(shí)間戳探針,監(jiān)控函數(shù)執(zhí)行耗時(shí)。例如,某路徑規(guī)劃算法因內(nèi)存泄漏導(dǎo)致響應(yīng)
    發(fā)表于 05-12 15:59

    模型如何推動(dòng)自動(dòng)駕駛技術(shù)革新?

    [首發(fā)于智駕最前沿微信公眾號(hào)]近年來(lái),人工智能技術(shù)正以前所未有的速度在各個(gè)領(lǐng)域滲透與應(yīng)用,而大模型(大語(yǔ)言模型和多模態(tài)大模型)的迅猛發(fā)展為自動(dòng)駕駛技術(shù)帶來(lái)了新的機(jī)遇。傳統(tǒng)的
    的頭像 發(fā)表于 04-20 13:16 ?1020次閱讀
    大<b class='flag-5'>模型</b>如何推動(dòng)<b class='flag-5'>自動(dòng)駕駛</b>技術(shù)革新?

    自動(dòng)駕駛模型中常提的Token是個(gè)啥?對(duì)自動(dòng)駕駛有何影響?

    近年來(lái),人工智能技術(shù)迅速發(fā)展,大規(guī)模深度學(xué)習(xí)模型(即大模型)在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別以及自動(dòng)駕駛等多個(gè)領(lǐng)域取得了突破性進(jìn)展。自動(dòng)駕駛作為未來(lái)智能交通的重要方向,其核心技術(shù)之
    的頭像 發(fā)表于 03-28 09:16 ?1336次閱讀