91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛大模型中常提的泛化能力是指啥?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-12-10 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]在討論自動駕駛大模型時,常會有幾個評價維度,如感知是否準確、決策是否穩(wěn)定、系統(tǒng)是否足夠魯棒,以及模型有沒有“泛化能力”。相比準確率、延遲這些容易量化的指標,“泛化能力”這個詞看起來比較抽象,也更容易被模糊使用。

它沒有直觀的評價標準,卻決定了模型能不能真正走出訓練數(shù)據(jù)、應對真實道路中的未知情況。理解清楚它到底指的是什么、為什么難、又該如何評估,是理解自動駕駛大模型能力邊界的第一步。

wKgZO2k4yZSAeZ57AAAQo00DEvw305.jpg

什么是泛化能力?

泛化能力,就是機器學習模型能否將在訓練里學到的東西應用到?jīng)]見過的新情況上。舉個簡單例子,訓練相當于老師在教一套例題,泛化就是學生碰到新題能不能用學到的方法做對。

圖片源自:網(wǎng)絡

對于自動駕駛來說,所謂泛化能力,指的是訓練出來的感知、預測和規(guī)劃等模塊,不僅能在實驗室條件下表現(xiàn)很好,在真實道路中同樣表現(xiàn)可靠。無論是在日常街道,還是在雨天、夜間、施工路段這些模型并未充分見過的場景下,系統(tǒng)都能持續(xù)做出合理、安全的判斷和決策。它并不是一個可以用單一分數(shù)衡量的性能指標,而是一種綜合體現(xiàn),反映的是整個自動駕駛系統(tǒng)在未知環(huán)境和復雜條件下的穩(wěn)定性與可信程度。

wKgZO2k4yZWAbU3eAAAR42n7O-I640.jpg

為什么自動駕駛格外看重泛化?

自動駕駛和多數(shù)純視覺、識別任務不同,承擔的是交通安全責任。數(shù)據(jù)永遠不可能窮盡,世界上有無數(shù)種路、不同國家的交通習慣、各種天氣和光照組合、臨時施工和奇怪的路牌、以及駕駛者和行人的隨機行為。

訓練里能見到的都是有限樣本,現(xiàn)實里的變化比訓練復雜得多。像是那些孩子從車后突然竄出、貨車散落、逆向臨時標牌、極端暴雨或路面結冰等“稀有但危險”的尾部場景,在訓練集中極少出現(xiàn),但發(fā)生時后果會更嚴重。如果模型在這些場景下不能泛化,那就不能算是合格的自動駕駛。

除了安全原因,泛化還能決定系統(tǒng)的可推廣性和商業(yè)落地成本,泛化好,意味著同一套模型能在更多城市、更廣的ODD里復用,可節(jié)省反覆收集和標注的成本。

wKgZPGk4yZaAGne2AAASG3BOmsQ412.jpg

泛化為什么這么難?

大模型泛化能力一直是重要的評價指標,但很難確保大模型足夠泛化。大模型的訓練集和實際部署環(huán)境往往不是同一個分布,一個白天、晴天在市區(qū)采集的訓練集,不能保證夜間、鄉(xiāng)間或另一座城市里的表現(xiàn)。

對于大模型來說,它很容易把訓練樣本“記住”,卻未必真正理解其中的規(guī)律,也就是我們常說的過擬合。模型本身能力很強,如果訓練數(shù)據(jù)不夠豐富,或者約束手段不合適,它就可能抓住一些只在訓練數(shù)據(jù)里成立的小特征,當成判斷依據(jù)。這種做法在訓練時看起來效果很好,但一旦換了環(huán)境或場景,這些“捷徑”就不成立了,模型的表現(xiàn)也會隨之下降。

自動駕駛是多模塊、多傳感器、多任務的系統(tǒng),感知、預測、規(guī)劃、控制之間的誤差會放大;傳感器也各有弱點,攝像頭在逆光或弱光里受限,雷達在細節(jié)分辨率上不足,LiDAR在某些天氣或被遮擋時性能下降。不同傳感器失效的模式不同,讓大模型在新環(huán)境下的行為更難預測。

此外,還有一個問題經(jīng)常會被忽略,那就是模型到底“測得準不準”。很多時候,大家只關注驗證集或者榜單上的平均得分,有些模型會看起來表現(xiàn)不錯,但這些數(shù)字只是反映常見場景,并不能說明在少見、復雜或者危險的情況下會怎么表現(xiàn)。一些真正有風險的情況,可能正好被平均指標掩蓋了。

同時,自動駕駛想真正上路運行,還要面對法律和安全方面的要求。這意味著系統(tǒng)不僅要在大多數(shù)情況下表現(xiàn)好,還必須提前想清楚,如果模型在陌生場景里出錯,該怎么發(fā)現(xiàn)、怎么監(jiān)測、又該如何安全地退出來,而不能等問題發(fā)生了再補救。這些能力的體現(xiàn),全部都可以歸結到大模型的泛化能力中。

wKgZPGk4yZeAKqLqAAASAJELks8298.jpg

如何提升大模型泛化能力?

想要真正提升大模型的泛化能力,不能只盯著數(shù)據(jù)。數(shù)據(jù)固然重要,但更關鍵的是有沒有更多類型的數(shù)據(jù)。實際訓練中,需要在不同城市、不同季節(jié)、不同路網(wǎng)結構下采集數(shù)據(jù),同時要覆蓋不同攝像頭和傳感器配置。像雨天、夜里、施工路段、臨時增加的交通標識這些不常見但很容易出問題的場景,也都應該盡量出現(xiàn)在訓練過程中。數(shù)據(jù)增強的作用也不只是簡單拉高亮度、調(diào)下對比度,而是有針對性地模擬真實世界可能遇到的變化,必要時還可以用合成數(shù)據(jù)補足那些現(xiàn)實中很難大量采集的場景。

為了實現(xiàn)這些目的,仿真的作用就凸顯出來了。通過高質(zhì)量的仿真,可以構造出大量危險或極端但現(xiàn)實中難以反復采集的場景,可以讓大模型提前見見世面。當然,仿真并不是隨便搭建就行,如果仿真環(huán)境和真實道路差距太大,大模型學到的就只是虛擬世界里的規(guī)律,一旦上路反而容易出問題。因此,仿真需要覆蓋多種環(huán)境變化,并持續(xù)用真實數(shù)據(jù)去校準和修正,形成一個和真實世界不斷對齊的閉環(huán)。

也有很多技術方案會從算法層面讓模型更容易適應新環(huán)境。比如域適應,就是大模型在正式部署前,用一小部分新環(huán)境的數(shù)據(jù)對模型做針對性調(diào)整,讓它先“適應下新地方”。域泛化則更進一步,其希望模型在訓練階段就不要過分依賴某個具體城市或場景,而是學到更通用的判斷依據(jù)。遷移學習和元學習也是類似思路,一個是把在舊環(huán)境中學到的通用能力帶到新環(huán)境里,另一個是讓模型具備更快適應新場景的能力。

此外,還有一些魯棒訓練方法,可以讓模型對噪聲和擾動不那么敏感;而置信度評估和異常檢測,則是在大模型自己“不太確定”時,及時暴露這種不確定性,避免繼續(xù)做出過于激進的判斷。

沒有哪一種傳感器在所有情況下都穩(wěn)定可靠,為提升大模型泛化能力,不能把系統(tǒng)的安全完全寄托在單個感知源或單一模型上。攝像頭、雷達、激光雷達、定位和地圖各有優(yōu)勢,把它們作為互相補充的信息來源,通過交叉校驗和一致性檢查來相互驗證,當某一種傳感器受影響時,其他通道還能起到補充作用。通過冗余,還可以在發(fā)現(xiàn)不確定性升高時逐步收緊能力,從正常自動駕駛過渡到受限模式,再到提醒人工接管,必要時執(zhí)行安全停車,而不是等出現(xiàn)明顯錯誤才做出劇烈反應。

對于大模型的評估和驗證,也不能單純看“平均表現(xiàn)”,而要看“場景是否覆蓋充分”。在車輛正式上路前,應該有一套盡量完整的場景庫,能說清楚系統(tǒng)已經(jīng)覆蓋了哪些天氣、光照條件、路口類型和突發(fā)行為。同時,還要專門針對那些少見但風險高的場景做壓力測試,而不是只看一個整體準確率。系統(tǒng)上線之后,同樣不能就此放手不管,而是要通過日志分析、近失效事件回放等方式,持續(xù)監(jiān)控實際表現(xiàn),把那些在真實運行中暴露出來的問題重新引入訓練流程,形成持續(xù)修正的閉環(huán)。

wKgZPGk4yZmAVlFmAAARwcz1hbg074.jpg

最后的話

談自動駕駛大模型到底行不行,不能只是看在測試集上跑得有多漂亮,還要看在真實道路上、換了城市、天氣和交通參與者之后能不能穩(wěn)得住。泛化能力說白了,就是評價模型有沒有真正“學會開車”。只有在沒見過的場景里依然能做出合理、安全決策的大模型,才有可能走得出實驗室,真的用在路上。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關注

    關注

    793

    文章

    14879

    瀏覽量

    179790
  • 大模型
    +關注

    關注

    2

    文章

    3648

    瀏覽量

    5179
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自動駕駛中常的“深度估計”是個

    [首發(fā)于智駕最前沿微信公眾號]當我們看一張照片時,可以通過肉眼自然地判斷照片中的物體遠近,這種對于空間和距離的感知,對于人類來說是本能,是從幼兒時期開始就形成的一種能力。 對于自動駕駛汽車來說
    的頭像 發(fā)表于 02-16 13:18 ?1.7w次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“深度估計”是個<b class='flag-5'>啥</b>?

    自動駕駛中常的模仿學習是什么?

    當談及自動駕駛模型學習時,經(jīng)常會提到模仿學習的概念。所謂模仿學習,就是模型先看別人怎么做,然后學著去做。自動駕駛中的模仿學習,就是把人類司機在各種路況下的行為做成范例,記錄下看到了什么
    的頭像 發(fā)表于 01-16 16:41 ?1991次閱讀

    自動駕駛中常的世界模型是什么?

    在很多廠家的技術方案中,會提到世界模型的介紹。世界模型,就是自動駕駛系統(tǒng)內(nèi)部用來表示外部世界并預測未來演變的一組模型或表征。換句話說,世界模型
    的頭像 發(fā)表于 01-05 16:23 ?902次閱讀

    模型中常的快慢思考會對自動駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺語言模型和世界模型的全新自動駕駛技術架構標志著其全棧自研的智能駕駛研發(fā)進入了新階段。
    的頭像 發(fā)表于 11-22 10:59 ?2499次閱讀
    大<b class='flag-5'>模型</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的快慢思考會對<b class='flag-5'>自動駕駛</b>產(chǎn)生什么影響?

    自動駕駛中常的“專家數(shù)據(jù)”是個?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,經(jīng)常會聽到一個概念,那便是“專家數(shù)據(jù)”。專家數(shù)據(jù),說白了就是“按理應該這么做”的那類示范數(shù)據(jù)。它不是隨機抓來的日志,也不是隨便標注的標簽,而是來源可靠
    的頭像 發(fā)表于 10-09 09:33 ?600次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“專家數(shù)據(jù)”是個<b class='flag-5'>啥</b>?

    自動駕駛中常的ODD是個?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛中,經(jīng)常會聽到一個概念,那就是ODD。所謂ODD,全稱為Operational Design Domain,中文常譯為“運行設計域”或者“作業(yè)域”。直觀一點
    的頭像 發(fā)表于 09-22 09:04 ?899次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ODD是個<b class='flag-5'>啥</b>?

    自動駕駛中常的硬件在環(huán)是個?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛技術時,經(jīng)常會提及一個技術,那就是硬件在環(huán),所謂的硬件在環(huán)是個?對于自動駕駛來說有作用?今天智駕最前沿就帶大家來聊聊這一技術。 所謂硬件
    的頭像 發(fā)表于 08-14 08:54 ?1242次閱讀

    自動駕駛中常的RTK是個?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛關鍵技術時,經(jīng)常會聽到一個技術,那就是RTK,很多人看到RTK后一定會想,這到底是個技術?為啥這個技術很少在發(fā)布會上看到,但對于自動駕駛來說卻非常關鍵
    的頭像 發(fā)表于 08-10 10:35 ?1121次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的RTK是個<b class='flag-5'>啥</b>?

    自動駕駛中常的慣性導航系統(tǒng)是個?可以不用嗎?

    每次提到自動駕駛硬件時,大家可能第一反應想到的是激光雷達、車載攝像頭、毫米波雷達等,但想要讓自動駕駛車輛實際落地,有一個硬件也非常重要,那就是慣性導航系統(tǒng)。在很多討論自動駕駛技術的內(nèi)容中,慣性導航系統(tǒng)的出場頻次遠低于激光雷達、車
    的頭像 發(fā)表于 07-24 18:12 ?1923次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的慣性導航系統(tǒng)是個<b class='flag-5'>啥</b>?可以不用嗎?

    自動駕駛中常的“時序”是個?有作用?

    之間以及傳感器與執(zhí)行單元之間,按照嚴格的時間順序和頻率進行數(shù)據(jù)采集、處理與響應的能力。對于自動駕駛系統(tǒng)而言,時序不僅是保障精度和性能的基石,更是確保安全和可靠性的基礎。只有在嚴格的時序框架下,各個子系統(tǒng)才能協(xié)
    的頭像 發(fā)表于 07-17 09:07 ?1054次閱讀

    自動駕駛中常的世界模型是個?

    對外部環(huán)境進行抽象和建模的技術,讓自動駕駛系統(tǒng)在一個簡潔的內(nèi)部“縮影”里,對真實世界進行描述與預測,從而為感知、決策和規(guī)劃等關鍵環(huán)節(jié)提供有力支持。 什么是世界模型? 我們不妨先把“世界模型”想象成一種“數(shù)字
    的頭像 發(fā)表于 06-24 08:53 ?1124次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的世界<b class='flag-5'>模型</b>是個<b class='flag-5'>啥</b>?

    自動駕駛中常的HMI是個?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛汽車領域,HMI(Human–Machine Interface,人機交互界面)正成為很多車企相互競爭的一大領域。之所以如此,是因為在車輛從“人控”過渡到“機
    的頭像 發(fā)表于 06-22 13:21 ?2340次閱讀

    自動駕駛中常的“點云”是個?

    ?對自動駕駛有何影響? 點云是個? 點云(Point Cloud)是一種在三維空間中由大量離散點組成的數(shù)據(jù)集合,每個點包含自身的笛卡爾坐標(X、Y、Z),并可附帶顏色、強度、時間戳等屬性,用于描述物體的空間分布和表面特性。在
    的頭像 發(fā)表于 05-21 09:04 ?1127次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“點云”是個<b class='flag-5'>啥</b>?

    自動駕駛中常的“NOA”是個?

    近年來,自動駕駛技術發(fā)展迅速,業(yè)界不斷探索如何在復雜交通場景中實現(xiàn)真正的無人駕駛。城市NOA作為自動駕駛的一項前沿技術,正成為各大廠商相互爭奪的關鍵技術。 何為NOA? NOA,全稱
    的頭像 發(fā)表于 04-09 09:03 ?3069次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是個<b class='flag-5'>啥</b>?

    自動駕駛模型中常的Token是個?對自動駕駛有何影響?

    、多模態(tài)傳感器數(shù)據(jù)的實時處理與決策。在這一過程中,大模型以其強大的特征提取、信息融合和預測能力自動駕駛系統(tǒng)提供了有力支持。而在大模型的中,有一個“Token”的概念,有些人看到后或許
    的頭像 發(fā)表于 03-28 09:16 ?1336次閱讀