91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛中Transformer大模型會取代深度學(xué)習(xí)嗎?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-08-13 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領(lǐng)域的驚艷表現(xiàn),“Transformer架構(gòu)是否正在取代傳統(tǒng)深度學(xué)習(xí)”這一話題一直被持續(xù)討論。特別是在自動駕駛領(lǐng)域,部分廠商開始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學(xué)習(xí)是否已過時”的激烈爭論。然而,從技術(shù)原理、算力成本、安全需求與實際落地路徑等維度來看,Transformer與深度學(xué)習(xí)并非你死我活的替代關(guān)系,更像是相互協(xié)作的搭檔,各自承擔(dān)著不同但關(guān)鍵的系統(tǒng)職責(zé)。

在自動駕駛的系統(tǒng)架構(gòu)中,感知、預(yù)測、決策和控制構(gòu)成了整套智能系統(tǒng)的核心流程。感知主要依賴傳感器獲取包括車輛、行人、車道、紅綠燈等外界信息,而后續(xù)的模塊將這些信息輸入到路徑預(yù)測、行為推理、避障規(guī)劃等過程中,最終通過控制模塊發(fā)出操作指令。傳統(tǒng)的深度學(xué)習(xí)技術(shù),尤其是卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)以及長短期記憶網(wǎng)絡(luò)(LSTM),在這些任務(wù)中長期占據(jù)主導(dǎo)地位。它們擅長從大規(guī)模標(biāo)注數(shù)據(jù)中學(xué)習(xí)復(fù)雜模式,尤其在圖像識別和語義分割任務(wù)中表現(xiàn)極其穩(wěn)定。這些能力對于自動駕駛感知模塊來說至關(guān)重要,因為車輛必須在毫秒級時間內(nèi)精確識別交通元素,做出正確判斷。

那么,Transformer及其演化版本——大語言模型(LLMs)是如何進(jìn)入自動駕駛語境的?最早,這類模型在自然語言處理(NLP)中大放異彩,其核心能力是利用“注意力機(jī)制”捕捉序列中各個元素之間的全局關(guān)系,從而建立強(qiáng)大的上下文理解能力。當(dāng)這種能力擴(kuò)展到圖像、視頻、雷達(dá)點云等非語言模態(tài)時,便演化出了多模態(tài)大模型。這些模型開始被用于分析交通情境、預(yù)測行為意圖甚至制定高層級的駕駛策略。如當(dāng)系統(tǒng)識別到一名行人正在接近斑馬線時,LLM可以結(jié)合先前的上下文,推理出行人可能即將穿越道路,從而提示系統(tǒng)減速或者繞行。

盡管LLM擁有非常強(qiáng)的表現(xiàn),但想讓LLM完全替代傳統(tǒng)深度學(xué)習(xí)仍存在很多障礙。其一,感知模塊需要實時響應(yīng),對延遲極為敏感,而當(dāng)前的LLM通常體積龐大,推理延遲高,難以滿足車載算力環(huán)境下的效率需求。其二,LLM存在“幻覺”問題,即在缺乏明確指令或訓(xùn)練邊界時可能生成虛假或無效內(nèi)容。這在文本生成中也許只是語義錯誤,但在自動駕駛中則可能導(dǎo)致不可控的安全風(fēng)險。其三,Transformer架構(gòu)天生是“黑盒”模型,其推理過程難以解釋,這與自動駕駛系統(tǒng)對安全審計、責(zé)任劃分和法規(guī)合規(guī)的高度可解釋性要求存在本質(zhì)沖突。

當(dāng)前一些技術(shù)方案正在嘗試“融合式架構(gòu)”,即不再二選一,而是將Transformer與深度學(xué)習(xí)各自用于最適合的模塊中。如感知系統(tǒng)繼續(xù)由CNN主導(dǎo),以保證高效率和高準(zhǔn)確性,而行為預(yù)測、意圖理解等推理性任務(wù)則由LLM輔助,提供更加豐富的語義支撐。甚至出現(xiàn)了一些具有“世界模型”能力的Transformer,可以通過對復(fù)雜交通環(huán)境的抽象建模,實現(xiàn)自我模擬、自我優(yōu)化。如小馬智行和Waymo等企業(yè)就采用了生成式AI與強(qiáng)化學(xué)習(xí)相結(jié)合的路徑,用于訓(xùn)練自動駕駛系統(tǒng)在“長尾場景”中的魯棒性。

wKgZPGib50-AEv3KAABtyQxab3s872.jpg

小馬智行解決方案

所謂“長尾場景”,是指那些在現(xiàn)實中極其罕見但又可能導(dǎo)致嚴(yán)重事故的交通情形,比如高速公路上掉落的鐵桶,或電動車突然逆行。這類場景在真實數(shù)據(jù)集中幾乎不可能窮盡采集,因此生成式AI成為補(bǔ)充訓(xùn)練數(shù)據(jù)的有效手段。Transformer在此處可以發(fā)揮作用,通過構(gòu)建基礎(chǔ)世界模型,模擬出這些罕見事件,從而提升系統(tǒng)的泛化能力。這種方式與AlphaGo早期學(xué)習(xí)人類棋譜的模仿學(xué)習(xí)相比,更類似于AlphaZero的自我博弈訓(xùn)練邏輯,即通過模擬世界不斷優(yōu)化自身策略。

模擬能力的提升也不意味著真實感知能力可以被忽略。真實環(huán)境下的道路情況千變?nèi)f化,光線、天氣、交通設(shè)施甚至人類行為都有不可預(yù)測的變量。只有深度學(xué)習(xí)算法對真實傳感器數(shù)據(jù)的穩(wěn)定識別能力,才能確保系統(tǒng)在最底層建立可靠輸入。Transformer只能在此基礎(chǔ)上做進(jìn)一步“思考”,卻不能完全“接管”任務(wù)流程。

還有一個不能忽視的問題是資源成本。LLMs往往依賴如GPU、TPU或?qū)S蒙窠?jīng)網(wǎng)絡(luò)加速芯片等高性能算力平臺,其部署成本極高。尤其在邊緣計算為主的自動駕駛車輛中,車載芯片資源有限,無法支持大規(guī)模參數(shù)模型的常態(tài)運行。相比之下,傳統(tǒng)深度學(xué)習(xí)模型經(jīng)過多年優(yōu)化,早已形成標(biāo)準(zhǔn)化的輕量級版本,能夠在嵌入式平臺上高效運行。因此,目前主流廠商多數(shù)仍在感知和控制層面采用深度學(xué)習(xí)方案,而將Transformer用于云端或訓(xùn)練環(huán)節(jié),作為仿真生成、行為推理等場景的工具。

在路徑規(guī)劃環(huán)節(jié),Transformer也遇到實際挑戰(zhàn)。路徑規(guī)劃是一項要求高度實時性和高可靠性的任務(wù),每一次決策都必須在極短時間內(nèi)完成,并具備高度確定性。大模型雖然在策略生成和規(guī)則制定上具備潛力,但在執(zhí)行效率和可控性方面仍難與傳統(tǒng)A*、RRT、BEV-basedlearning等路徑規(guī)劃算法媲美。此外,大模型輸出的隨機(jī)性與路徑規(guī)劃任務(wù)的確定性形成天然沖突,一旦規(guī)劃路徑不確定或出現(xiàn)偏差,將嚴(yán)重影響行車安全。

從系統(tǒng)架構(gòu)的演進(jìn)趨勢來看,自動駕駛行業(yè)正逐步走向“多模態(tài)+分工協(xié)作”模式。感知、控制、導(dǎo)航等模塊保持使用穩(wěn)定可靠的深度學(xué)習(xí)體系,而認(rèn)知層、交互層則可逐步引入LLMs,提升整車系統(tǒng)的理解力和推理能力。如自動駕駛車輛在接近施工區(qū)域時,傳統(tǒng)模型只能識別出前方有障礙物,而LLMs能夠通過“語義理解”判斷出這些障礙可能是臨時的,進(jìn)而優(yōu)化繞行路徑。未來還可探索將自然語言與車輛交互融合,如讓乘客以語音方式發(fā)出“去最近的加油站”或“我想避開高速”之類指令,由大模型解析后生成交通行為策略。

但這些探索尚處于試驗與驗證階段。監(jiān)管機(jī)構(gòu)對自動駕駛系統(tǒng)的“黑盒性”極為謹(jǐn)慎。Transformer模型在文本生成中出現(xiàn)的不穩(wěn)定性一旦遷移至交通系統(tǒng),可能導(dǎo)致災(zāi)難性后果。因此,目前的大模型更可能作為“增強(qiáng)模塊”參與系統(tǒng)設(shè)計,而非完全替代深度學(xué)習(xí)基礎(chǔ)架構(gòu)。

從整個行業(yè)來看,判斷Transformer是否取代深度學(xué)習(xí),關(guān)鍵不在于技術(shù)路線之爭,而在于適用性與安全性。在大語言模型快速發(fā)展的背景下,我們應(yīng)當(dāng)看到其在認(rèn)知理解、行為建模與復(fù)雜推理上的巨大潛力,但也必須正視其高算力需求、不確定性輸出和缺乏可解釋性的現(xiàn)實挑戰(zhàn)。在自動駕駛這樣的“物理AI”場景中,任何一個系統(tǒng)模塊的失誤都可能帶來生命安全風(fēng)險,因此技術(shù)的引入必須謹(jǐn)慎。

簡而言之,Transformer與深度學(xué)習(xí)之間并非此消彼長的替代關(guān)系,而是互補(bǔ)與融合的發(fā)展格局。它們在不同層級承擔(dān)各自最擅長的任務(wù),共同構(gòu)建更加智能、安全與高效的自動駕駛系統(tǒng)。未來,隨著技術(shù)演進(jìn)與芯片平臺優(yōu)化,或許會出現(xiàn)更加輕量化、可解釋且穩(wěn)定的Transformer模型,從而進(jìn)一步拓寬其在自動駕駛系統(tǒng)中的角色,但在此之前,深度學(xué)習(xí)仍將在底層穩(wěn)定運行,筑牢智能出行的安全基礎(chǔ)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14879

    瀏覽量

    179783
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5598

    瀏覽量

    124394
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3648

    瀏覽量

    5179
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛真的會來嗎?

    所需要的圖像識別、計算機(jī)視覺、深度學(xué)習(xí)等關(guān)鍵技術(shù)的投資熱度在明顯增強(qiáng)。另外,也已經(jīng)有公司在開發(fā)不同于普通地圖的3D地圖,能詳細(xì)到道路旁邊的電線桿的位置,以及與下一個油桶、燈柱距離。對于自動駕駛的發(fā)展
    發(fā)表于 07-21 09:00

    細(xì)說關(guān)于自動駕駛那些事兒

    輔助系統(tǒng)系統(tǒng))用到的技術(shù)重迭。自駕車如何看見世界為什么要這么多種傳感器?優(yōu)缺點互補(bǔ)目前多數(shù)車商在量產(chǎn)車配備的“自動駕駛”功能,包含特斯拉、Volvo、Mercedes-Benz、奧迪等,事實上就是搭載
    發(fā)表于 05-15 17:49

    自動駕駛的到來

    的Telematics收發(fā)芯片,非常適合V2V及V2X等相關(guān)應(yīng)用?! ∠啾扔趥鹘y(tǒng)的底盤、發(fā)動機(jī)等傳統(tǒng)汽車技術(shù),自動駕駛更多的技術(shù)集中在電子領(lǐng)域,而且核心技術(shù)并沒有被跨國車廠或Tier1所壟斷。并且
    發(fā)表于 06-08 15:25

    AI/自動駕駛領(lǐng)域的巔峰會議—國際AI自動駕駛高峰論壇

    已經(jīng)滲透到了社會生活的方方面面。人工智能在自動駕駛領(lǐng)域?qū)φ麄€汽車出行領(lǐng)域產(chǎn)生顛覆性變革。汽車的人工智能技術(shù)和數(shù)據(jù)后端的最新突破使自動駕駛成為可能。深度學(xué)習(xí)、高級數(shù)字助理和動態(tài)電子視野
    發(fā)表于 09-13 13:59

    如何讓自動駕駛更加安全?

    自動駕駛、完全自動駕駛。第四級別是汽車駕駛自動化、智能化程度最高級別,也就是通常所說的無人駕駛?,F(xiàn)實
    發(fā)表于 05-13 00:26

    如何保證自動駕駛的安全?

    自動駕駛技術(shù)為人們勾勒出了一副美好的未來出行的畫面:坐上沒有方向盤的汽車,一覺睡到公司門口;甚至我們可能不再擁有一輛汽車,需要出門時共享自動駕駛汽車自己到來,送到目的地時會自行離開……不過
    發(fā)表于 10-22 07:45

    探討深度學(xué)習(xí)自動駕駛的應(yīng)用

    深度強(qiáng)化學(xué)習(xí)的理論、自動駕駛技術(shù)的現(xiàn)狀以及問題、深度強(qiáng)化學(xué)習(xí)自動駕駛技術(shù)當(dāng)中的應(yīng)用及基于
    的頭像 發(fā)表于 08-18 10:19 ?5914次閱讀

    如何基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計一個端到端的自動駕駛模型?

    如何基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計一個端到端的自動駕駛模型?如何設(shè)計一個基于增強(qiáng)學(xué)習(xí)自動駕駛決策系統(tǒng)?
    的頭像 發(fā)表于 04-29 16:44 ?5921次閱讀
    如何基于<b class='flag-5'>深度</b>神經(jīng)網(wǎng)絡(luò)設(shè)計一個端到端的<b class='flag-5'>自動駕駛</b><b class='flag-5'>模型</b>?

    深度學(xué)習(xí)技術(shù)與自動駕駛設(shè)計的結(jié)合

    在過去的十年里,自動駕駛汽車技術(shù)取得了越來越快的進(jìn)步,主要得益于深度學(xué)習(xí)和人工智能領(lǐng)域的進(jìn)步。作者就自動駕駛中使用的深度
    發(fā)表于 10-28 16:07 ?2480次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>技術(shù)與<b class='flag-5'>自動駕駛</b>設(shè)計的結(jié)合

    深度學(xué)習(xí)算法在自動駕駛規(guī)控的應(yīng)用解讀

    雖然目前公開的自動駕駛規(guī)控算法相關(guān)資料大都是針對基于規(guī)則的算法的,但筆者打開招聘軟件卻經(jīng)常能看到自動駕駛企業(yè)招聘規(guī)控算法工程師時會要求候選人懂深度學(xué)習(xí)算法,這在某種程度上也說明了目前很
    的頭像 發(fā)表于 11-16 09:57 ?2091次閱讀

    自動駕駛的機(jī)器學(xué)習(xí)

    近年來,自動駕駛技術(shù)技術(shù)的發(fā)展速度非??臁nA(yù)計達(dá)到完全自動駕駛L5的程度是指日可待的。自動駕駛的核心技術(shù)主要是人工智能的機(jī)器學(xué)習(xí)與深 度
    發(fā)表于 06-06 10:06 ?0次下載
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中</b>的機(jī)器<b class='flag-5'>學(xué)習(xí)</b>

    深度學(xué)習(xí)自動駕駛的關(guān)鍵技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,自動駕駛技術(shù)作為其中的重要分支,正逐漸走向成熟。在自動駕駛系統(tǒng),深度學(xué)習(xí)技術(shù)發(fā)揮著至關(guān)重要的作用。它通過模擬人
    的頭像 發(fā)表于 07-01 11:40 ?1825次閱讀

    自動駕駛中一直說的BEV+Transformer到底是個啥?

    在很多車企的自動駕駛介紹,都會聽到一個關(guān)鍵技術(shù),那就是BEV+Transformer,那BEV+Transformer到底是個啥?為什么很多車企在
    的頭像 發(fā)表于 11-07 11:19 ?2477次閱讀
    <b class='flag-5'>自動駕駛</b>中一直說的BEV+<b class='flag-5'>Transformer</b>到底是個啥?

    Transformer如何讓自動駕駛模型獲得思考能力?

    在談及自動駕駛時,Transformer一直是非常關(guān)鍵的技術(shù),為何Transformer自動駕駛行業(yè)一直被提及?
    的頭像 發(fā)表于 02-01 09:15 ?4155次閱讀

    如何構(gòu)建適合自動駕駛的世界模型

    [首發(fā)于智駕最前沿微信公眾號]世界模型經(jīng)歷了系統(tǒng)動力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動駕駛汽車上
    的頭像 發(fā)表于 02-18 08:14 ?1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動駕駛</b>的世界<b class='flag-5'>模型</b>?