91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動(dòng)駕駛從模塊化到One Model的進(jìn)階之路

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-11-23 09:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]如果將自動(dòng)駕駛汽車看作是一臺懂得“看、想、做”的機(jī)器,它首先要做的就是借助傳感器全面感知周圍環(huán)境,然后對這些信息進(jìn)行“思考”,并做出預(yù)測與決策,預(yù)測決策結(jié)果最終可以轉(zhuǎn)化為具體的控制指令并執(zhí)行。自動(dòng)駕駛的工作邏輯已經(jīng)非常清晰,但技術(shù)實(shí)現(xiàn)路徑卻一直在迭代,并沿著一條清晰的軌跡演進(jìn)。從專注“理解”的感知模型化,到賦予“思維”的規(guī)控模型化,再到協(xié)同增效的多模塊端到端,最終一定會(huì)走向One Model端到端。

wKgZO2kiZ8aAfN2aAAAQo00DEvw727.jpg

感知模型化,專注“理解清楚”

自動(dòng)駕駛的第一階段,主要是做好理解清楚世界這件事。在這個(gè)階段,感知系統(tǒng)非常重要,其實(shí)現(xiàn)路徑高度依賴于多傳感器(攝像頭、毫米波雷達(dá)、激光雷達(dá))的前端融合,而BEV(鳥瞰視角)空間與Transformer架構(gòu),因其能統(tǒng)一處理不同來源的特征并建立全局關(guān)聯(lián),成為實(shí)現(xiàn)這一目標(biāo)的主要工具,通過硬件與軟件的融合,可顯著提升目標(biāo)檢測、地圖分割與軌跡跟蹤的可靠性。在這一階段,需要考慮感知精度、低誤報(bào)率、對光照和天氣變化的魯棒性等,同時(shí)也要保證實(shí)時(shí)性與可部署性。

這一階段,自動(dòng)駕駛模塊邊界清晰,工程責(zé)任明確,便于驗(yàn)證和上線。感知模塊輸出的是明確的如目標(biāo)的2D/3D框、車道線、語義地圖等中間結(jié)果,上層預(yù)測與規(guī)劃模塊也可以直接讀取這些結(jié)果,更容易做安全檢查和異常處理。

獨(dú)立的感知模塊使得數(shù)據(jù)標(biāo)注和訓(xùn)練流程相對可控,但也正因如此,系統(tǒng)存在模塊間信息離散、有損傳遞等問題。那些經(jīng)人為接口(如目標(biāo)類別、邊界框)抽象后的結(jié)果,也無法保留傳感器原始數(shù)據(jù)中的全部細(xì)節(jié)。這種信息損失在多數(shù)情況下尚可接受,但在需要細(xì)粒度環(huán)境理解、長時(shí)序依賴分析或跨模態(tài)信息融合的復(fù)雜場景中,就會(huì)嚴(yán)重阻礙系統(tǒng)做出最佳決策,從而限制其性能上限。

wKgZO2kiZ8eAIixYAAAR42n7O-I337.jpg

規(guī)控模型化,讓“思考”與“行動(dòng)”也神經(jīng)化

在規(guī)控模型化階段,預(yù)測、決策、規(guī)劃等“規(guī)控”功能開始用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),但系統(tǒng)仍保留“感知”與“規(guī)控”兩個(gè)相對獨(dú)立的模型。也就是說,系統(tǒng)的感知部分可以產(chǎn)出的是一個(gè)清晰、可解釋的語義世界圖,而規(guī)控部分的預(yù)測和規(guī)劃任務(wù),則交給了深度學(xué)習(xí)網(wǎng)絡(luò)來完成,不再依賴傳統(tǒng)的規(guī)則或優(yōu)化器。這種架構(gòu)將學(xué)習(xí)能力延伸至更高層,使行為策略能夠從數(shù)據(jù)中學(xué)習(xí)更復(fù)雜的模式,同時(shí)也保留了模塊化帶來的可控性。

規(guī)控模型化的確可以讓自動(dòng)駕駛汽車變得更聰明,因?yàn)楦兄鸵?guī)控是兩個(gè)獨(dú)立的模塊,出了問題也容易定位和調(diào)試。但也正因?yàn)閮烧呤欠珠_的,兩個(gè)模塊之間傳遞信息,就像在傳紙條,總會(huì)有細(xì)節(jié)丟失??赡芨兄K看到的一個(gè)細(xì)微動(dòng)作對決策至關(guān)重要,但傳過去時(shí)卻被壓縮或丟棄了,這就導(dǎo)致決策模型無法充利用全部信息。而且兩個(gè)模塊各練各的,即便感知練到滿分,也不代表它給規(guī)控的信息就是最有利于最終決策的,這樣反而無法提升自動(dòng)駕駛的整體性能。

這一階段其實(shí)是自動(dòng)駕駛發(fā)展過程中一個(gè)折中的階段,由于希望上層更智能,又不愿放棄模塊化帶來的可解釋性與驗(yàn)證便利,只能做這種選擇。很多頭部公司也正嘗試在規(guī)控端引入更多學(xué)習(xí)能力,同時(shí)通過設(shè)計(jì)更豐富的感知中間表達(dá)和更緊密的特征接口,來緩解信息損失的問題。

wKgZO2kiZ8iAQ_mUAAASG3BOmsQ024.jpg

多模塊端到端,打通關(guān)節(jié),信息傳遞更完整

多模塊端到端的關(guān)鍵在于接口形式的改變,感知與規(guī)劃之間不再通過人為設(shè)計(jì)的語義標(biāo)簽或邊界框傳遞信息,而是使用隱式的特征向量進(jìn)行連接。也就是說,系統(tǒng)在邏輯上仍保留如感知、預(yù)測、規(guī)劃的“模塊化”劃分,但這些模塊之間傳遞的是高維連續(xù)特征,允許梯度跨模塊反向傳播。這樣一來,訓(xùn)練過程可以同時(shí)影響所有模塊,實(shí)現(xiàn)跨模塊聯(lián)合優(yōu)化,從而可以實(shí)現(xiàn)全局最優(yōu)解。UniAD等架構(gòu)就是這一方案的典型代表,將檢測、跟蹤、預(yù)測、規(guī)劃等任務(wù)置于同一框架下聯(lián)合訓(xùn)練,各任務(wù)共享特征表示,從而互相促進(jìn)。

多模塊端到端的好處是信息保留更完整,網(wǎng)絡(luò)可以不依賴人類預(yù)設(shè)的格式,就學(xué)到對下游任務(wù)最有價(jià)值的中間表達(dá)。因?yàn)槟K依然存在,可以在部署時(shí)保留一定邊界,便于逐步替換或回退,降低了風(fēng)險(xiǎn)。這種架構(gòu)更是讓訓(xùn)練效率顯著提升,通過共享特征和聯(lián)合損失函數(shù),模型能更充分地利用數(shù)據(jù),即使是稀缺場景,也能通過聯(lián)合訓(xùn)練獲得更好的泛化能力。

引入多模塊端到端設(shè)計(jì)后,系統(tǒng)復(fù)雜度也明顯上升,這不僅意味著訓(xùn)練需要消耗更多的數(shù)據(jù)與算力,也使得整個(gè)流程對超參數(shù)和損失權(quán)重的設(shè)置更加敏感。隨之而來的還有模型可解釋性的降低,當(dāng)不同任務(wù)(如檢測與規(guī)劃)的學(xué)習(xí)目標(biāo)不一致時(shí),調(diào)試難度會(huì)大幅增加。由于各模塊深度集成,若系統(tǒng)在某個(gè)場景失效,將很難快速定位到具體的原因,這極大地拖慢了認(rèn)證進(jìn)程。此外,盡管梯度能夠跨模塊流動(dòng)以尋求全局最優(yōu),但也同時(shí)引入了訓(xùn)練不穩(wěn)定和梯度沖突的風(fēng)險(xiǎn),這必須依靠專門的訓(xùn)練策略和平衡機(jī)制來維持穩(wěn)定。

wKgZO2kiZ8mAX4wBAAASAJELks8063.jpg

One Model端到端,自動(dòng)駕駛完美方案

One Model端到端,是一種更徹底的端到端思路,該架構(gòu)的目標(biāo)是從原始傳感器信號(如圖像像素、雷達(dá)點(diǎn)云)到最終控制指令或軌跡,全部由一個(gè)統(tǒng)一的深度學(xué)習(xí)模型完成。這里不再有傳統(tǒng)意義上的感知、預(yù)測、規(guī)劃等模塊劃分,模型內(nèi)部通過自學(xué)形成完成任務(wù)所需的全部中間表達(dá)和處理路徑。這種架構(gòu)能完整利用傳感器的每一分信息,避免人為接口造成的信息瓶頸,從而在復(fù)雜場景中實(shí)現(xiàn)更高的性能與更好的泛化能力。

wKgZPGkiZ8qAZ4oiAABk5aNzvp4152.jpg

圖片源自:網(wǎng)絡(luò)

One Model端到端需要極大的數(shù)據(jù)與算力支撐,以覆蓋足夠多的駕駛場景與邊界情況。模型容量、訓(xùn)練樣本覆蓋面以及監(jiān)督信號的設(shè)計(jì)(如行為克隆、逆強(qiáng)化學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等混合策略)都會(huì)直接影響最終性能。由于這類模型更接近“大模型”范式,可借鑒自然語言處理或視覺大模型中的預(yù)訓(xùn)練-微調(diào)策略,先利用海量無標(biāo)簽或弱標(biāo)簽數(shù)據(jù)預(yù)訓(xùn)練,再用少量高質(zhì)量決策數(shù)據(jù)進(jìn)行微調(diào)。

該架構(gòu)中,由于模型一體化,可解釋性與可驗(yàn)證性問題也出現(xiàn)了,當(dāng)系統(tǒng)內(nèi)部沒有清晰的模塊邊界,如何構(gòu)建安全論證、通過法規(guī)或行業(yè)認(rèn)證就成了難題。自動(dòng)駕駛模型想合規(guī)利用,需要解釋系統(tǒng)在特定情境下為何做出某個(gè)行為,而“一體化”的黑箱模型很難滿足這一要求。這一方案的魯棒性與可控性也是需要考慮的問題,若系統(tǒng)在稀有場景出錯(cuò)時(shí),如何快速定位、修復(fù)與回滾?傳統(tǒng)模塊化可以只替換一個(gè)模塊,而“大模型”可能需要重新訓(xùn)練或大幅微調(diào)。在安全關(guān)鍵系統(tǒng)中,冗余設(shè)計(jì)(如雙通道獨(dú)立感知鏈路)是常態(tài),但“一體化”模型如何設(shè)計(jì)冗余、如何在部分傳感器失效時(shí)降級,是必須解決的難問題。

雖然很多人將One Model端到端視為自動(dòng)駕駛的“終極形態(tài)”,但短期內(nèi)它更可能作為研究前沿或特定場景(如封閉園區(qū)、低速環(huán)境)的試驗(yàn)方案,想真正將其落地,還需很長一段路要走。

wKgZO2kiZ8qAJ3U3AAARwcz1hbg088.jpg

最后的話

將上述四個(gè)階段放在一起看,可以將自動(dòng)駕駛系統(tǒng)理解為一條從“可解釋、可控”逐步走向“信息完整、潛在性能更強(qiáng)”的技術(shù)演進(jìn)路徑,感知模型化適合將“看清楚”做到極致;規(guī)控模型化讓“思考”與“行動(dòng)”更智能;多模塊端到端在效率與完整性之間找到平衡;One Model端到端雖代表理論上的性能上限,卻伴隨驗(yàn)證、解釋與部署上的巨大挑戰(zhàn)。無論選擇哪種架構(gòu),自動(dòng)駕駛的最終目的還是服務(wù)于人,只有在確保安全的前提下將技術(shù)用到極致,才是真正有用的技術(shù)架構(gòu)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14887

    瀏覽量

    179961
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    為什么一段式端自動(dòng)駕駛很難落地?

    [首發(fā)于智駕最前沿微信公眾號]自動(dòng)駕駛技術(shù)在過去十年中經(jīng)歷了基礎(chǔ)輔助駕駛高度自動(dòng)化系統(tǒng)的快速演進(jìn)。在這一進(jìn)程中,技術(shù)架構(gòu)的選擇始終是決定
    的頭像 發(fā)表于 03-08 09:44 ?1539次閱讀
    為什么一段式端<b class='flag-5'>到</b>端<b class='flag-5'>自動(dòng)駕駛</b>很難落地?

    自動(dòng)駕駛端為什么會(huì)出現(xiàn)黑盒現(xiàn)象?

    自動(dòng)駕駛領(lǐng)域,端端(End-to-End)是指感知環(huán)境的原始數(shù)據(jù)車輛實(shí)際控制指令,全部交給一個(gè)統(tǒng)一的深度學(xué)習(xí)模型來完成。這和傳統(tǒng)的模塊化
    的頭像 發(fā)表于 02-20 09:25 ?9279次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>端<b class='flag-5'>到</b>端為什么會(huì)出現(xiàn)黑盒現(xiàn)象?

    已有VLM,自動(dòng)駕駛為什么還要探索VLA?

    [首發(fā)于智駕最前沿微信公眾號]自動(dòng)駕駛技術(shù)正處于發(fā)展的轉(zhuǎn)折點(diǎn)。過去十幾年間,行業(yè)長期依賴模塊化的技術(shù)路徑,即將駕駛任務(wù)拆解為感知、預(yù)測、規(guī)劃和控制四個(gè)獨(dú)立環(huán)節(jié)。這種結(jié)構(gòu)雖然清晰,但在面對突發(fā)狀況
    的頭像 發(fā)表于 02-03 09:04 ?208次閱讀
    已有VLM,<b class='flag-5'>自動(dòng)駕駛</b>為什么還要探索VLA?

    端與模塊化自動(dòng)駕駛的數(shù)據(jù)標(biāo)注要求有何不同?

    [首發(fā)于智駕最前沿微信公眾號]自動(dòng)駕駛技術(shù)路徑的每一次技術(shù)轉(zhuǎn)向,都伴隨著底層數(shù)據(jù)處理邏輯的徹底重構(gòu)。過去,智駕系統(tǒng)普遍依賴模塊化設(shè)計(jì),將駕駛任務(wù)拆解為感知、預(yù)測、規(guī)控等獨(dú)立環(huán)節(jié);而今,以端
    的頭像 發(fā)表于 01-27 09:48 ?931次閱讀
    端<b class='flag-5'>到</b>端與<b class='flag-5'>模塊化</b><b class='flag-5'>自動(dòng)駕駛</b>的數(shù)據(jù)標(biāo)注要求有何不同?

    端是怎么讓自動(dòng)駕駛更像老司機(jī)的?

    [首發(fā)于智駕最前沿微信公眾號]如果將自動(dòng)駕駛的發(fā)展史比作人類的學(xué)習(xí)歷程,那么在過去很長一段時(shí)間里,這個(gè)“學(xué)生”其實(shí)一直都在背誦極其繁瑣的教條。這一階段的自動(dòng)駕駛系統(tǒng)使用的是模塊化架構(gòu),它的運(yùn)行高度
    的頭像 發(fā)表于 01-21 09:29 ?214次閱讀
    端<b class='flag-5'>到</b>端是怎么讓<b class='flag-5'>自動(dòng)駕駛</b>更像老司機(jī)的?

    消費(fèi)電子EMC整改:助被動(dòng)修復(fù)主動(dòng)防御的進(jìn)階之路

    消費(fèi)電子EMC整改:助被動(dòng)修復(fù)主動(dòng)防御的進(jìn)階之路|南柯電子
    的頭像 發(fā)表于 12-03 09:52 ?525次閱讀

    一文讀懂特斯拉自動(dòng)駕駛FSD輔助端的演進(jìn)

    [首發(fā)于智駕最前沿微信公眾號]自動(dòng)駕駛行業(yè)發(fā)展至今,特斯拉一直被很多企業(yè)對標(biāo),其FSD系統(tǒng)的每一次更新,都會(huì)獲得非常多人的關(guān)注。早期自動(dòng)駕駛是一個(gè)分層的、由多模塊組成的系統(tǒng),感知、定位、預(yù)測、規(guī)劃
    的頭像 發(fā)表于 10-11 09:13 ?811次閱讀
    一文讀懂特斯拉<b class='flag-5'>自動(dòng)駕駛</b>FSD<b class='flag-5'>從</b>輔助<b class='flag-5'>到</b>端<b class='flag-5'>到</b>端的演進(jìn)

    自動(dòng)駕駛相較傳統(tǒng)自動(dòng)駕駛到底有何提升?

    [首發(fā)于智駕最前沿微信公眾號]自動(dòng)駕駛技術(shù)自誕生以來,便承載了人類對安全、高效、智能出行的美好憧憬。傳統(tǒng)自動(dòng)駕駛系統(tǒng)以層次、模塊化的架構(gòu)為主,將感知、定位、規(guī)劃與決策、控制四大核心功
    的頭像 發(fā)表于 09-02 09:09 ?840次閱讀
    端<b class='flag-5'>到</b>端<b class='flag-5'>自動(dòng)駕駛</b>相較傳統(tǒng)<b class='flag-5'>自動(dòng)駕駛</b>到底有何提升?

    為什么自動(dòng)駕駛端大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動(dòng)駕駛技術(shù)落地,端端(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門方向。相較于傳統(tǒng)自動(dòng)駕駛系統(tǒng)中的模塊化結(jié)構(gòu),端
    的頭像 發(fā)表于 07-04 16:50 ?887次閱讀
    為什么<b class='flag-5'>自動(dòng)駕駛</b>端<b class='flag-5'>到</b>端大模型有黑盒特性?

    新能源車軟件單元測試深度解析:自動(dòng)駕駛系統(tǒng)視角

    、道路塌陷)的測試用例庫,通過虛擬仿真和真實(shí)路測數(shù)據(jù)回灌驗(yàn)證算法的魯棒性。 ?第二部分:自動(dòng)駕駛軟件單元測試技術(shù)體系****? ?測試對象分類與測試策略? ? 數(shù)據(jù)驅(qū)動(dòng)型模塊(如傳感器融合
    發(fā)表于 05-12 15:59

    一文帶你厘清自動(dòng)駕駛端架構(gòu)差異

    [首發(fā)于智駕最前沿微信公眾號]隨著自動(dòng)駕駛技術(shù)飛速發(fā)展,智能駕駛系統(tǒng)的設(shè)計(jì)思路也經(jīng)歷了傳統(tǒng)模塊化架構(gòu)
    的頭像 發(fā)表于 05-08 09:07 ?1036次閱讀
    一文帶你厘清<b class='flag-5'>自動(dòng)駕駛</b>端<b class='flag-5'>到</b>端架構(gòu)差異

    AI將如何改變自動(dòng)駕駛?

    自動(dòng)駕駛帶來哪些變化?其實(shí)AI可以改變自動(dòng)駕駛技術(shù)的各個(gè)環(huán)節(jié),感知能力的提升到?jīng)Q策框架的優(yōu)化,安全性能的增強(qiáng)到測試驗(yàn)證的加速,AI可以讓自動(dòng)駕駛
    的頭像 發(fā)表于 05-04 09:58 ?847次閱讀

    自動(dòng)駕駛經(jīng)歷了哪些技術(shù)拐點(diǎn)?

    ,如今以AI為核心驅(qū)動(dòng)的自動(dòng)駕駛系統(tǒng),各大車企都在不斷加碼研發(fā)投入,試圖在未來市場中占據(jù)制高點(diǎn)。那自動(dòng)駕駛發(fā)展至今,經(jīng)歷了哪些技術(shù)拐點(diǎn)呢? 自動(dòng)駕駛系統(tǒng)的發(fā)展歷程
    的頭像 發(fā)表于 04-27 15:54 ?860次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>經(jīng)歷了哪些技術(shù)拐點(diǎn)?

    L0L5自動(dòng)駕駛技術(shù)的演進(jìn)階

    高盛(Goldman Sachs)估計(jì),2030年,L3級自動(dòng)駕駛汽車或占全球新車銷量的10%。自動(dòng)駕駛汽車需要經(jīng)過多達(dá)6個(gè)層級的技術(shù)演進(jìn),才能最終實(shí)現(xiàn)上路自主駕駛。
    的頭像 發(fā)表于 04-24 10:42 ?1463次閱讀

    NVIDIA Halos自動(dòng)駕駛汽車安全系統(tǒng)發(fā)布

    NVIDIA 整合了云端車端的安全自動(dòng)駕駛開發(fā)技術(shù)套件,涵蓋車輛架構(gòu) AI 模型,包括芯片、軟件、工具和服務(wù)。 物理 AI 正在為自動(dòng)駕駛
    的頭像 發(fā)表于 03-25 14:51 ?1186次閱讀