91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Transformer在端到端自動(dòng)駕駛架構(gòu)中是何定位?

智駕最前沿 ? 來(lái)源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-08-03 11:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛系統(tǒng)從模塊化走向端到端,Transformer正逐漸被引入到端到端架構(gòu)中,試圖解決傳統(tǒng)模型在復(fù)雜語(yǔ)義理解、全局路徑推理以及行為預(yù)測(cè)上的局限。但我們必須清晰認(rèn)識(shí)到,Transformer在端到端架構(gòu)中的作用既非全能主腦,也并非簡(jiǎn)單插件,它更像是“認(rèn)知大腦”的角色,在端到端系統(tǒng)中承擔(dān)高階決策與抽象建模的任務(wù),而具體的感知、控制、接口層仍需要傳統(tǒng)深度學(xué)習(xí)模型支撐。這種多層次分工,是現(xiàn)階段端到端架構(gòu)得以落地的現(xiàn)實(shí)路徑。

傳統(tǒng)端到端架構(gòu)追求的是感知、決策、控制“一體化”建模,即通過(guò)一個(gè)大模型輸入傳感器原始數(shù)據(jù)(如圖像、點(diǎn)云、雷達(dá)),直接輸出轉(zhuǎn)向角、加速度、剎車指令等操作值。在這個(gè)過(guò)程中,模型在內(nèi)部完成了目標(biāo)識(shí)別、語(yǔ)義理解、路徑預(yù)測(cè)等任務(wù),但由于中間過(guò)程不可分割,因此也失去了可解釋性與調(diào)試能力。這在學(xué)術(shù)實(shí)驗(yàn)中尚可接受,但在需要極高安全保障的商用場(chǎng)景中存在巨大風(fēng)險(xiǎn)。Transformer試圖通過(guò)其在序列建模和上下文理解上的強(qiáng)大能力,提升端到端模型的抽象表達(dá)能力,并通過(guò)“注意力機(jī)制”模擬決策過(guò)程的透明性。

目前,典型的Transformer架構(gòu)已被用于構(gòu)建“感知-規(guī)劃-控制統(tǒng)一建?!钡姆桨?。如Waymo和小馬智行正在研發(fā)的多模態(tài)大模型(MultimodalLargeModels,MLLMs),將來(lái)自攝像頭、激光雷達(dá)、毫米波雷達(dá)的數(shù)據(jù)融合輸入,并結(jié)合地圖語(yǔ)義、交通規(guī)則、歷史軌跡等信息,交由Transformer構(gòu)建多層次時(shí)空表征。這種表征并非直接輸出控制命令,而是形成一個(gè)“世界模型”——即系統(tǒng)對(duì)當(dāng)前交通狀態(tài)的主觀理解。隨后,該模型再將理解結(jié)果交由行為規(guī)劃子模塊去執(zhí)行,使得端到端過(guò)程具有一定結(jié)構(gòu)化邏輯,從而兼顧可解釋性與泛化能力。

Transformer在此過(guò)程中承擔(dān)了以下幾個(gè)關(guān)鍵角色,首先,它作為感知與推理的中間橋梁,將多模態(tài)信息統(tǒng)一編碼后,建立不同要素之間的因果關(guān)系。如前方車輛正在減速、右側(cè)有行人接近斑馬線、紅綠燈為黃色,這一系列事件并非孤立,而是需要模型結(jié)合上下文統(tǒng)一判斷其潛在交互模式。傳統(tǒng)深度學(xué)習(xí)模型常以圖像特征為主導(dǎo),缺乏事件間的時(shí)間序列建模能力,而Transformer則可通過(guò)自注意力機(jī)制理解其潛在邏輯與權(quán)重。

其次,在行為預(yù)測(cè)與交互建模方面,Transformer的優(yōu)勢(shì)更加明顯。當(dāng)前大多數(shù)自動(dòng)駕駛車輛仍面臨“交互不清晰”的問(wèn)題,即無(wú)法準(zhǔn)確預(yù)測(cè)其他交通參與者的未來(lái)行為。在密集城市交通中,行人與非機(jī)動(dòng)車的行為極具不確定性,傳統(tǒng)模塊化方法常常分工割裂,難以統(tǒng)一評(píng)估這些交互背后的潛在意圖。而Transformer可將多方信息整合為統(tǒng)一的時(shí)序表示,并通過(guò)預(yù)訓(xùn)練或遷移學(xué)習(xí),推斷出最合理的策略響應(yīng)。這種“策略編排能力”正是大模型在端到端架構(gòu)中所具備的關(guān)鍵競(jìng)爭(zhēng)力。

但我們也必須看到,Transformer模型在端到端架構(gòu)中的部署仍有很多問(wèn)題需要解決。首先是實(shí)時(shí)性。自動(dòng)駕駛決策周期通??刂圃?0~100毫秒以內(nèi),而當(dāng)前參數(shù)級(jí)別在數(shù)十億的LLM模型,其推理時(shí)間遠(yuǎn)超這一窗口,哪怕在專用加速芯片上也難以滿足高頻循環(huán)執(zhí)行的需要。為此,有方案正在嘗試構(gòu)建“輕量化Transformer”或剪枝后的中型模型,用于車端執(zhí)行,同時(shí)將大型模型部署在云端,用于訓(xùn)練、場(chǎng)景生成和后處理分析。

其次是數(shù)據(jù)來(lái)源與分布一致性問(wèn)題。端到端架構(gòu)中,訓(xùn)練數(shù)據(jù)的分布對(duì)最終模型穩(wěn)定性至關(guān)重要。Transformer需要大規(guī)模多樣化的訓(xùn)練語(yǔ)料,但當(dāng)前自動(dòng)駕駛行業(yè)的數(shù)據(jù)集大多來(lái)自“長(zhǎng)尾場(chǎng)景稀缺”的真實(shí)道路采集,難以支持Transformer在各種極端場(chǎng)景中的泛化學(xué)習(xí)。因此,越來(lái)越多采用仿真平臺(tái)生成“近物理級(jí)真實(shí)場(chǎng)景”,通過(guò)虛擬交通參與者的動(dòng)態(tài)交互來(lái)拓展模型的訓(xùn)練維度。英偉達(dá)的Omniverse與小馬智行的Cosmos就是典型代表,它們利用物理引擎+世界建模的方式,賦能Transformer實(shí)現(xiàn)更完整的場(chǎng)景理解與遷移學(xué)習(xí)。

可解釋性問(wèn)題仍是另一個(gè)待解命題。盡管Transformer的注意力權(quán)重圖可以部分展示模型的“關(guān)注焦點(diǎn)”,但其內(nèi)部推理路徑、權(quán)重更新機(jī)制依舊缺乏明確可控的數(shù)學(xué)表達(dá)式。這意味著當(dāng)模型在特定場(chǎng)景下做出錯(cuò)誤決策時(shí),我們難以準(zhǔn)確還原其出錯(cuò)節(jié)點(diǎn)。這對(duì)負(fù)責(zé)安全評(píng)估的工程師或監(jiān)管機(jī)構(gòu)來(lái)說(shuō)是巨大障礙。因此,現(xiàn)階段很多自動(dòng)駕駛方案并不完全放棄中間模塊,而是采取“端到端+模塊化結(jié)合”的策略,既保留可追溯路徑,也提升建模能力。

在實(shí)際部署時(shí),Transformer常被用于“策略融合層”或“全局語(yǔ)義層”。在系統(tǒng)完成環(huán)境感知之后,Transformer可用來(lái)處理如“當(dāng)前進(jìn)入學(xué)校區(qū)域需減速”、“根據(jù)紅綠燈邏輯調(diào)整等待時(shí)間”等上下文規(guī)則。這種基于語(yǔ)義的規(guī)則推理與路徑重組,正是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)難以處理的抽象邏輯任務(wù),也是Transformer最為擅長(zhǎng)的部分。從長(zhǎng)遠(yuǎn)來(lái)看,這種認(rèn)知能力的引入或?qū)⑼苿?dòng)自動(dòng)駕駛從“感知驅(qū)動(dòng)”向“意圖驅(qū)動(dòng)”轉(zhuǎn)型,讓車輛不僅看到周圍發(fā)生了什么,還能理解“為什么”會(huì)發(fā)生,從而更好地預(yù)測(cè)“接下來(lái)會(huì)發(fā)生什么”。

還有一些技術(shù)方案正在探索更為極致的端到端方式,如將Transformer作為唯一的大模型,從傳感器輸入到控制輸出全部涵蓋。特斯拉的FSD Beta系統(tǒng)便試圖走這條路徑,嘗試用Transformer編排整個(gè)感知-決策流程,規(guī)避中間人工規(guī)則的干預(yù)。然而,目前該方案仍面臨大量質(zhì)疑。其在面對(duì)突發(fā)情況時(shí)缺乏故障冗余;系統(tǒng)行為的不可解釋性也令監(jiān)管機(jī)構(gòu)難以接受。因此,哪怕在特斯拉公布的Robotaxi項(xiàng)目中,仍需配備人工監(jiān)控機(jī)制以確保安全兜底。這充分說(shuō)明,在安全為前提的自動(dòng)駕駛場(chǎng)景中,Transformer在端到端中的應(yīng)用尚處于“受限”階段。

綜上,Transformer在端到端自動(dòng)駕駛架構(gòu)中的角色定位,絕不是“替代一切”的通用工具,也不是某些理想主義者期待的“萬(wàn)能大腦”。更準(zhǔn)確地說(shuō),它是一種用于抽象建模、高階推理、語(yǔ)義決策與交互理解的智能補(bǔ)丁。它填補(bǔ)了傳統(tǒng)深度學(xué)習(xí)難以處理的認(rèn)知空白,為系統(tǒng)帶來(lái)了更強(qiáng)的泛化能力與策略靈活性。它并不取代感知、控制等需要硬實(shí)時(shí)與高穩(wěn)定性的基礎(chǔ)模塊,而是通過(guò)融合架構(gòu)提升整個(gè)系統(tǒng)的智能密度。在未來(lái)的系統(tǒng)演進(jìn)中,Transformer將可能更多地參與“認(rèn)知層”設(shè)計(jì),成為輔助駕駛系統(tǒng)的“推理引擎”,但真正掌握方向盤的,仍然是深度學(xué)習(xí)與工程控制的“執(zhí)行大腦”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14887

    瀏覽量

    179988
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    156

    瀏覽量

    6939
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    為什么一段式自動(dòng)駕駛很難落地?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)在過(guò)去十年經(jīng)歷了從基礎(chǔ)輔助駕駛高度自動(dòng)化系統(tǒng)的快速演進(jìn)。在這一進(jìn)程
    的頭像 發(fā)表于 03-08 09:44 ?1618次閱讀
    為什么一段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>很難落地?

    自動(dòng)駕駛為什么會(huì)出現(xiàn)黑盒現(xiàn)象?

    自動(dòng)駕駛領(lǐng)域,(End-to-End)是指從感知環(huán)境的原始數(shù)據(jù)車輛實(shí)際控制指令,全部交
    的頭像 發(fā)表于 02-20 09:25 ?9290次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>為什么會(huì)出現(xiàn)黑盒現(xiàn)象?

    如何訓(xùn)練好自動(dòng)駕駛模型?

    ,確實(shí)會(huì)用到模仿學(xué)習(xí)(包括行為克隆、逆最優(yōu)控制/逆強(qiáng)化學(xué)習(xí)等)、強(qiáng)化學(xué)習(xí)(RL),以及近年來(lái)越來(lái)越受關(guān)注的離線強(qiáng)化學(xué)習(xí)(OfflineRL/BatchRL)這三類。 什么是“”訓(xùn)練?
    的頭像 發(fā)表于 12-08 16:31 ?1439次閱讀
    如何訓(xùn)練好<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型?

    自動(dòng)駕駛仿真與基于規(guī)則的仿真有什么區(qū)別?

    自動(dòng)駕駛領(lǐng)域,“仿真”指的是將感知控制的整個(gè)決策鏈條視為一個(gè)整體,從而進(jìn)行訓(xùn)練和驗(yàn)證的
    的頭像 發(fā)表于 11-02 11:33 ?1713次閱讀

    西井科技自動(dòng)駕駛模型獲得國(guó)際認(rèn)可

    近日,西井科技AI創(chuàng)研團(tuán)隊(duì)國(guó)際權(quán)威自動(dòng)駕駛算法榜單NAVSIM v2脫穎而出,憑借創(chuàng)新的
    的頭像 發(fā)表于 10-15 17:20 ?1290次閱讀

    一文讀懂特斯拉自動(dòng)駕駛FSD從輔助的演進(jìn)

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛行業(yè)發(fā)展至今,特斯拉一直被很多企業(yè)對(duì)標(biāo),其FSD系統(tǒng)的每一次更新,都會(huì)獲得非常多人的關(guān)注。早期自動(dòng)駕駛是一個(gè)分層的、由多模塊組成的系統(tǒng),感知、定位、預(yù)測(cè)、規(guī)劃
    的頭像 發(fā)表于 10-11 09:13 ?812次閱讀
    一文讀懂特斯拉<b class='flag-5'>自動(dòng)駕駛</b>FSD從輔助<b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的演進(jìn)

    自動(dòng)駕駛大模型為什么會(huì)有不確定性?

    。為了能讓自動(dòng)駕駛汽車做出正確、安全且符合邏輯的行駛動(dòng)作,大模型被提了出來(lái)。
    的頭像 發(fā)表于 09-28 09:20 ?880次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型為什么會(huì)有不確定性?

    自動(dòng)駕駛相較傳統(tǒng)自動(dòng)駕駛到底有提升?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)自誕生以來(lái),便承載了人類對(duì)安全、高效、智能出行的美好憧憬。傳統(tǒng)自動(dòng)駕駛系統(tǒng)以層次化、模塊化的架構(gòu)為主,將感知、定位、規(guī)劃與決策、控制四大核心功
    的頭像 發(fā)表于 09-02 09:09 ?842次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>相較傳統(tǒng)<b class='flag-5'>自動(dòng)駕駛</b>到底有<b class='flag-5'>何</b>提升?

    一段式自動(dòng)駕駛到底有優(yōu)勢(shì)?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)的發(fā)展歷程,模塊化架構(gòu)曾長(zhǎng)期占據(jù)主導(dǎo)地位,從多傳感器數(shù)據(jù)采集,特征提取與目標(biāo)檢測(cè),再到路徑規(guī)
    的頭像 發(fā)表于 08-05 09:06 ?1079次閱讀
    一段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>在</b><b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中</b>到底有<b class='flag-5'>何</b>優(yōu)勢(shì)?

    Nullmax自動(dòng)駕駛最新研究成果入選ICCV 2025

    近日,國(guó)際計(jì)算機(jī)視覺(jué)大會(huì) ICCV 2025 正式公布論文錄用結(jié)果,Nullmax 感知團(tuán)隊(duì)自動(dòng)駕駛方向的最新研究成果《HiP-AD
    的頭像 發(fā)表于 07-05 15:40 ?1815次閱讀
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>最新研究成果入選ICCV 2025

    為什么自動(dòng)駕駛大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)落地,(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門方向。相較于傳統(tǒng)自動(dòng)駕駛
    的頭像 發(fā)表于 07-04 16:50 ?890次閱讀
    為什么<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有黑盒特性?

    數(shù)據(jù)標(biāo)注方案自動(dòng)駕駛領(lǐng)域的應(yīng)用優(yōu)勢(shì)

    10-20TB,其中需要標(biāo)注的數(shù)據(jù)占比超過(guò)60%。在這樣的背景下,數(shù)據(jù)標(biāo)注方案應(yīng)運(yùn)而生,正在重塑自動(dòng)駕駛的數(shù)據(jù)生產(chǎn)范式。
    的頭像 發(fā)表于 06-23 17:27 ?1021次閱讀

    一文帶你厘清自動(dòng)駕駛架構(gòu)差異

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)飛速發(fā)展,智能駕駛系統(tǒng)的設(shè)計(jì)思路也經(jīng)歷了從傳統(tǒng)模塊化架構(gòu)
    的頭像 發(fā)表于 05-08 09:07 ?1042次閱讀
    一文帶你厘清<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>架構(gòu)</b>差異

    自動(dòng)駕駛基于規(guī)則的決策和大模型有區(qū)別?

    自動(dòng)駕駛架構(gòu)的選擇上,也經(jīng)歷了從感知、決策控制、執(zhí)行的三段式架構(gòu)到現(xiàn)在火熱的
    的頭像 發(fā)表于 04-13 09:38 ?3747次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中</b>基于規(guī)則的決策和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大模型有<b class='flag-5'>何</b>區(qū)別?

    東風(fēng)汽車推出自動(dòng)駕駛開(kāi)源數(shù)據(jù)集

    近日,智能網(wǎng)聯(lián)汽車智駕數(shù)據(jù)空間構(gòu)建研討會(huì)暨汽協(xié)會(huì)智能網(wǎng)聯(lián)汽車分會(huì)、數(shù)據(jù)分會(huì)2024年度會(huì)議在上海舉辦。會(huì)上,東風(fēng)汽車發(fā)布行業(yè)規(guī)模最大、涵蓋125萬(wàn)組高質(zhì)量數(shù)據(jù)的
    的頭像 發(fā)表于 04-01 14:54 ?1235次閱讀