91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動(dòng)駕駛中常提的模仿學(xué)習(xí)是什么?

智駕最前沿 ? 來源:智駕最前沿 ? 2026-01-16 16:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]當(dāng)談及自動(dòng)駕駛模型學(xué)習(xí)時(shí),經(jīng)常會(huì)提到模仿學(xué)習(xí)的概念。所謂模仿學(xué)習(xí),就是模型先看別人怎么做,然后學(xué)著去做。自動(dòng)駕駛中的模仿學(xué)習(xí),就是把人類司機(jī)在各種路況下的行為做成范例,記錄下看到了什么和做了什么等信息,然后將這些一一對(duì)應(yīng)起來當(dāng)作訓(xùn)練數(shù)據(jù),并訓(xùn)練出一個(gè)模型。

當(dāng)模型訓(xùn)練好以后,遇到類似場(chǎng)景就可以嘗試輸出類似的人類動(dòng)作。這種學(xué)習(xí)方式不需要工程師把每一種情況的規(guī)則一條條寫出來,也不需要設(shè)計(jì)一個(gè)復(fù)雜的獎(jiǎng)勵(lì)函數(shù)讓機(jī)器在虛擬世界里靠試錯(cuò)學(xué)會(huì)開車,只要有質(zhì)量較好的“人類示范”,就能把人的“駕駛風(fēng)格”灌輸?shù)侥P屠铩?/p>

模仿學(xué)習(xí)有不同的實(shí)現(xiàn)方式。最直接的叫行為克隆(behavior cloning),就是把專家看見與執(zhí)行的對(duì)應(yīng)關(guān)系作為監(jiān)督學(xué)習(xí)任務(wù),其輸入是傳感器數(shù)據(jù)、前視圖、速度等信息,輸出是方向盤角度、油門剎車等控制量。還有一種思路是逆強(qiáng)化學(xué)習(xí)(inverse reinforcement learning),它不是直接學(xué)“做什么”,而是試圖從人類的行為里反推出一個(gè)“潛在的目標(biāo)函數(shù)”或者偏好,再用這個(gè)目標(biāo)去訓(xùn)練模型。除此之外,還有對(duì)抗式模仿、層次化模仿等更復(fù)雜的變體,這些方法能夠在一定程度上緩解簡(jiǎn)單模仿學(xué)習(xí)在泛化能力和魯棒性上的不足。

模仿學(xué)習(xí)對(duì)自動(dòng)駕駛有什么用

在自動(dòng)駕駛這樣高風(fēng)險(xiǎn)的領(lǐng)域,讓模型在真實(shí)世界里靠“試錯(cuò)”學(xué)習(xí)顯然不現(xiàn)實(shí)。模仿學(xué)習(xí)可以利用已有的人類駕駛數(shù)據(jù),讓模型在安全的條件下學(xué)習(xí)“合格駕駛員”的行為模式。

對(duì)于很多常見場(chǎng)景,尤其是城市道路或高速路上的常規(guī)操作,模仿學(xué)習(xí)能教會(huì)車輛如何平順變道、如何與前車保持距離、如何在擁堵路段保持合理速度,這種“像人開車”的行為將提升乘客的體驗(yàn),并會(huì)讓社會(huì)有更高的接受度。

此外,模仿學(xué)習(xí)在工程上好上手、訓(xùn)練效率也相對(duì)更高。模仿學(xué)習(xí)本質(zhì)上是監(jiān)督學(xué)習(xí),訓(xùn)練目標(biāo)直接、損失明確,數(shù)據(jù)處理管道成熟。因此在研發(fā)早期,以及做端到端感知-控制的探索時(shí),模仿學(xué)習(xí)是首選方法。

模仿學(xué)習(xí)還能把多模態(tài)傳感器的信息(攝像頭、毫米波雷達(dá)、LiDAR、里程計(jì)等)合并到一個(gè)網(wǎng)絡(luò)中,直接從原始感知到控制量學(xué)習(xí)一條端到端的映射,這在某些應(yīng)用場(chǎng)景能顯著簡(jiǎn)化系統(tǒng)架構(gòu)。

模仿學(xué)習(xí)還有一個(gè)好處,就是能把“人類的駕駛習(xí)慣”保留下來。人類駕駛員在很多情形里會(huì)做出既安全又舒適的動(dòng)作,像是平滑的加減速、合理的避讓、符合社會(huì)駕駛習(xí)慣的決策等,都是人類駕駛員可以輕松應(yīng)對(duì)的動(dòng)作。把這些行為灌輸?shù)侥P屠?,有助于自?dòng)駕駛車輛在混合交通環(huán)境中更自然地與人類駕駛者共存,從而減少被其他車輛或行人誤判的風(fēng)險(xiǎn)。

如何用模仿學(xué)習(xí)訓(xùn)練模型?

想用模仿學(xué)習(xí)訓(xùn)練模型,要先進(jìn)行采集示范數(shù)據(jù),然后做數(shù)據(jù)清洗與標(biāo)注,接著訓(xùn)練模型并在模擬器或封閉道路上測(cè)試,最后再做在線改進(jìn)與驗(yàn)證。

采集階段不是簡(jiǎn)單地采集更多場(chǎng)景,也不是無腦地堆砌各種場(chǎng)景,而是要找到場(chǎng)景多樣且高質(zhì)量的數(shù)據(jù),像是白天夜晚、雨雪、高架與城市擁堵、復(fù)雜交叉口等場(chǎng)景場(chǎng)景必須都覆蓋到。訓(xùn)練時(shí)可用卷積神經(jīng)網(wǎng)絡(luò)處理圖像輸入,并把時(shí)序信息通過遞歸結(jié)構(gòu)或時(shí)間窗口的方式納入,讓模型能記住短時(shí)間內(nèi)的動(dòng)態(tài)變化。

在模型上線之前,需要通過仿真和閉環(huán)測(cè)試來驗(yàn)證模型的魯棒性。單純?cè)陟o態(tài)測(cè)試集上做得好并不代表閉環(huán)駕駛也能穩(wěn)健運(yùn)行,控制策略的每一步動(dòng)作都會(huì)改變后續(xù)的狀態(tài)分布,這種分布偏移會(huì)導(dǎo)致誤差積累。

為此,要引入在線糾偏機(jī)制,如在模型駕駛時(shí)讓專家在線糾正,將這些新的“偏離狀態(tài)-專家動(dòng)作對(duì)”加入數(shù)據(jù)集繼續(xù)訓(xùn)練,像是DAgger(Dataset Aggregation,數(shù)據(jù)集聚合)就是采用的這種方法。還有技術(shù)方案中會(huì)先用模仿學(xué)習(xí)學(xué)一個(gè)“基礎(chǔ)策略”,再用強(qiáng)化學(xué)習(xí)或規(guī)則化的規(guī)劃層對(duì)其微調(diào)與約束,以增強(qiáng)對(duì)稀有或危險(xiǎn)場(chǎng)景的處理能力。

當(dāng)然,模仿學(xué)習(xí)并不等同于完全放手不設(shè)規(guī)則。為確保自動(dòng)駕駛系統(tǒng)的安全性,很多技術(shù)方案中會(huì)采用混合架構(gòu),模仿學(xué)習(xí)負(fù)責(zé)感知-決策的快速映射,規(guī)劃層負(fù)責(zé)長時(shí)間尺度的路徑規(guī)劃,規(guī)則模塊負(fù)責(zé)硬性安全約束(比如絕對(duì)剎停條件、最小車距限制等)。這種分層與混合的策略不僅可以利用模仿學(xué)習(xí)的高效性,也能通過規(guī)則化模塊彌補(bǔ)它在極端情況上的不足。

模仿學(xué)習(xí)的局限與現(xiàn)實(shí)挑戰(zhàn)

模仿學(xué)習(xí)雖好,但其存在泛化能力有限與誤差積累等問題。模仿模型在訓(xùn)練時(shí)學(xué)到的是“在那些見過的狀態(tài)里該做什么”,一旦遇到訓(xùn)練集中沒有覆蓋到的罕見場(chǎng)景,模型將不知道應(yīng)該如何處理。尤其是在序列決策問題中,模型自己的每一步?jīng)Q定都會(huì)改變未來觀測(cè)的分布,哪怕開始只是輕微偏差,也可能隨著時(shí)間放大成嚴(yán)重錯(cuò)誤,這就是所謂的分布偏移或誤差累積問題。

模仿學(xué)習(xí)主要學(xué)習(xí)專家示范的內(nèi)容,提供給模型的專家示范總希望是高質(zhì)量的且具代表性的,但人類司機(jī)并不完美,總會(huì)存在疏忽、習(xí)慣性錯(cuò)誤或?qū)δ承﹫?chǎng)景不恰當(dāng)?shù)呐袛?。如果模型只?a target="_blank">機(jī)械地模仿這些行為,就可能學(xué)到不良駕駛習(xí)慣。尤其對(duì)于人類社會(huì)來說,道德和法律層面的約束不是簡(jiǎn)單靠模仿就能學(xué)會(huì)的,如何在多方?jīng)_突情形下如何取舍、如何展現(xiàn)可辯護(hù)的決策過程等,都需要額外的規(guī)則與可解釋性的支撐。

端到端的模仿學(xué)習(xí)模型還存在內(nèi)部決策過程不透明的問題,其安全邊界難以被嚴(yán)格界定和驗(yàn)證。對(duì)于汽車這種涉及生命財(cái)產(chǎn)安全的關(guān)鍵領(lǐng)域,監(jiān)管與認(rèn)證體系要求系統(tǒng)具備可解釋的邏輯或明確的安全保證。因此,單純依賴數(shù)據(jù)驅(qū)動(dòng)的模仿學(xué)習(xí),在應(yīng)對(duì)復(fù)雜多變的長尾場(chǎng)景時(shí),可能面臨可驗(yàn)證性不足的挑戰(zhàn)。

要把模仿學(xué)習(xí)做得足夠魯棒,要覆蓋足夠廣的高質(zhì)量示范數(shù)據(jù),這就帶來了采集成本高、標(biāo)注難、隱私與合規(guī)等問題。尤其是極端天氣、罕見事故或復(fù)雜交互場(chǎng)景,本身就少見,要人工制造這些場(chǎng)景又有風(fēng)險(xiǎn),仿真雖然能補(bǔ)充一部分,但仿真與現(xiàn)實(shí)間的差距也會(huì)影響模型遷移效果,因此,對(duì)于模仿學(xué)習(xí)來說,數(shù)據(jù)方面的挑戰(zhàn)不容忽視。

最后的話

模仿學(xué)習(xí)為自動(dòng)駕駛系統(tǒng)提供了實(shí)現(xiàn)擬人化駕駛行為的重要基礎(chǔ),但其數(shù)據(jù)驅(qū)動(dòng)的黑箱特性在安全驗(yàn)證和長尾場(chǎng)景泛化方面存在局限。想應(yīng)用好模仿學(xué)習(xí),就要將模仿學(xué)習(xí)置于一個(gè)包含規(guī)則約束、規(guī)劃模塊及多重安全冗余的混合系統(tǒng)架構(gòu)中,從而確保其在發(fā)揮其高效學(xué)習(xí)優(yōu)勢(shì)的同時(shí),更能確保系統(tǒng)的整體行為符合可解釋、可驗(yàn)證的安全規(guī)范。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52101
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14882

    瀏覽量

    179815
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動(dòng)駕駛中常的占用網(wǎng)絡(luò)檢測(cè)存在哪些問題?

    自動(dòng)駕駛感知技術(shù)在過去幾年中經(jīng)歷了很大的變化,從最初的二維圖像檢測(cè)到鳥瞰圖投影,再到如今備受關(guān)注的占用網(wǎng)絡(luò),感知技術(shù)的提升,讓自動(dòng)駕駛的能力越來越強(qiáng)。
    的頭像 發(fā)表于 02-24 15:53 ?953次閱讀

    自動(dòng)駕駛中常的“深度估計(jì)”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]當(dāng)我們看一張照片時(shí),可以通過肉眼自然地判斷照片中的物體遠(yuǎn)近,這種對(duì)于空間和距離的感知,對(duì)于人類來說是本能,是從幼兒時(shí)期開始就形成的一種能力。 對(duì)于自動(dòng)駕駛汽車來說
    的頭像 發(fā)表于 02-16 13:18 ?1.7w次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“深度估計(jì)”是個(gè)啥?

    自動(dòng)駕駛中常的離線強(qiáng)化學(xué)習(xí)是什么?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在之前談及自動(dòng)駕駛模型學(xué)習(xí)時(shí),詳細(xì)聊過強(qiáng)化學(xué)習(xí)的作用,由于強(qiáng)化學(xué)習(xí)能讓大模型通過交互學(xué)到策略,不需要固定的規(guī)則,從而給
    的頭像 發(fā)表于 02-07 09:21 ?207次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的離線強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>是什么?

    強(qiáng)化學(xué)習(xí)會(huì)讓自動(dòng)駕駛模型學(xué)習(xí)更快嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛大模型訓(xùn)練時(shí),有的技術(shù)方案會(huì)采用模仿學(xué)習(xí),而有些會(huì)采用強(qiáng)化學(xué)習(xí)。同樣作為大模型的訓(xùn)練方式,強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 01-31 09:34 ?641次閱讀
    強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>會(huì)讓<b class='flag-5'>自動(dòng)駕駛</b>模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    自動(dòng)駕駛中常的世界模型是什么?

    在很多廠家的技術(shù)方案中,會(huì)提到世界模型的介紹。世界模型,就是自動(dòng)駕駛系統(tǒng)內(nèi)部用來表示外部世界并預(yù)測(cè)未來演變的一組模型或表征。換句話說,世界模型就是把傳感器看到的東西(攝像頭畫面、激光雷達(dá)點(diǎn)云、雷達(dá)
    的頭像 發(fā)表于 01-05 16:23 ?903次閱讀

    大模型中常的快慢思考會(huì)對(duì)自動(dòng)駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺語言模型和世界模型的全新自動(dòng)駕駛技術(shù)架構(gòu)標(biāo)志著其全棧自研的智能駕駛研發(fā)進(jìn)入了新階段。該架構(gòu)的算法原型創(chuàng)新性地受到了諾貝爾獎(jiǎng)得主丹尼爾·卡尼曼
    的頭像 發(fā)表于 11-22 10:59 ?2499次閱讀
    大模型<b class='flag-5'>中常</b><b class='flag-5'>提</b>的快慢思考會(huì)對(duì)<b class='flag-5'>自動(dòng)駕駛</b>產(chǎn)生什么影響?

    自動(dòng)駕駛中常的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛時(shí),有些方案中會(huì)提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡(jiǎn)稱RL)”,強(qiáng)化學(xué)習(xí)是一類讓機(jī)器通過試錯(cuò)來學(xué)會(huì)做決策的技術(shù)。簡(jiǎn)單理解
    的頭像 發(fā)表于 10-23 09:00 ?664次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>”是個(gè)啥?

    自動(dòng)駕駛中常的“專家數(shù)據(jù)”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛時(shí),經(jīng)常會(huì)聽到一個(gè)概念,那便是“專家數(shù)據(jù)”。專家數(shù)據(jù),說白了就是“按理應(yīng)該這么做”的那類示范數(shù)據(jù)。它不是隨機(jī)抓來的日志,也不是隨便標(biāo)注的標(biāo)簽,而是來源可靠
    的頭像 發(fā)表于 10-09 09:33 ?612次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“專家數(shù)據(jù)”是個(gè)啥?

    自動(dòng)駕駛中常的ODD是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛中,經(jīng)常會(huì)聽到一個(gè)概念,那就是ODD。所謂ODD,全稱為Operational Design Domain,中文常譯為“運(yùn)行設(shè)計(jì)域”或者“作業(yè)域”。直觀一點(diǎn)
    的頭像 發(fā)表于 09-22 09:04 ?900次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ODD是個(gè)啥?

    自動(dòng)駕駛中常的硬件在環(huán)是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛技術(shù)時(shí),經(jīng)常會(huì)提及一個(gè)技術(shù),那就是硬件在環(huán),所謂的硬件在環(huán)是個(gè)啥?對(duì)于自動(dòng)駕駛來說有啥作用?今天智駕最前沿就帶大家來聊聊這一技術(shù)。 所謂硬件在環(huán)
    的頭像 發(fā)表于 08-14 08:54 ?1243次閱讀

    自動(dòng)駕駛中常的RTK是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛關(guān)鍵技術(shù)時(shí),經(jīng)常會(huì)聽到一個(gè)技術(shù),那就是RTK,很多人看到RTK后一定會(huì)想,這到底是個(gè)啥技術(shù)?為啥這個(gè)技術(shù)很少在發(fā)布會(huì)上看到,但對(duì)于自動(dòng)駕駛來說卻非常關(guān)鍵
    的頭像 發(fā)表于 08-10 10:35 ?1125次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的RTK是個(gè)啥?

    自動(dòng)駕駛中常的世界模型是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)的不斷成熟,車輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測(cè)”未來的變化。世界模型可以被看作一種
    的頭像 發(fā)表于 06-24 08:53 ?1125次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的世界模型是個(gè)啥?

    自動(dòng)駕駛中常的“點(diǎn)云”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)中,點(diǎn)云技術(shù)作為三維空間感知的核心手段,為車輛提供了精確的距離和形狀信息,從而實(shí)現(xiàn)目標(biāo)檢測(cè)、環(huán)境建模、定位與地圖構(gòu)建等關(guān)鍵功能。那所謂的“點(diǎn)云”,到底是個(gè)
    的頭像 發(fā)表于 05-21 09:04 ?1128次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“點(diǎn)云”是個(gè)啥?

    自動(dòng)駕駛中常的“NOA”是個(gè)啥?

    近年來,自動(dòng)駕駛技術(shù)發(fā)展迅速,業(yè)界不斷探索如何在復(fù)雜交通場(chǎng)景中實(shí)現(xiàn)真正的無人駕駛。城市NOA作為自動(dòng)駕駛的一項(xiàng)前沿技術(shù),正成為各大廠商相互爭(zhēng)奪的關(guān)鍵技術(shù)。 何為NOA? NOA,全稱
    的頭像 發(fā)表于 04-09 09:03 ?3076次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是個(gè)啥?

    自動(dòng)駕駛大模型中常的Token是個(gè)啥?對(duì)自動(dòng)駕駛有何影響?

    近年來,人工智能技術(shù)迅速發(fā)展,大規(guī)模深度學(xué)習(xí)模型(即大模型)在自然語言處理、計(jì)算機(jī)視覺、語音識(shí)別以及自動(dòng)駕駛等多個(gè)領(lǐng)域取得了突破性進(jìn)展。自動(dòng)駕駛作為未來智能交通的重要方向,其核心技術(shù)之一便是對(duì)海量
    的頭像 發(fā)表于 03-28 09:16 ?1336次閱讀