91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

訓(xùn)練自動(dòng)駕駛大模型的數(shù)據(jù)并不是越多越好?

智駕最前沿 ? 來(lái)源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-04-01 08:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]對(duì)于自動(dòng)駕駛大模型的訓(xùn)練,不知道是否有人感覺(jué),訓(xùn)練的數(shù)據(jù)越多,模型就會(huì)越聰明。這個(gè)說(shuō)法只能說(shuō)在一定程度上是對(duì)的,但如果把這個(gè)結(jié)論簡(jiǎn)單理解為無(wú)限堆訓(xùn)練數(shù)據(jù)就能讓模型越聰明,那只會(huì)偏離實(shí)際情況。

自動(dòng)駕駛大模型的訓(xùn)練數(shù)據(jù),不能只單純看數(shù)量,而是要看數(shù)量、質(zhì)量、結(jié)構(gòu)等多個(gè)方面。

wKgZO2nMa-WAD5NXAAAQo00DEvw831.jpg

數(shù)據(jù)越多,模型真的就越強(qiáng)嗎?

在模型訓(xùn)練的早期階段,增加數(shù)據(jù)量確實(shí)會(huì)明顯提升性能。模型性能一般會(huì)隨著數(shù)據(jù)規(guī)模增長(zhǎng)而持續(xù)改善,甚至呈現(xiàn)出規(guī)模定律。

簡(jiǎn)單說(shuō),就是投入越多、數(shù)據(jù)越大、參數(shù)越多,模型就越聰明。

圖片源自:網(wǎng)絡(luò)

之所以出現(xiàn)這個(gè)現(xiàn)象,是因?yàn)樽詣?dòng)駕駛本質(zhì)是在學(xué)習(xí)駕駛經(jīng)驗(yàn),數(shù)據(jù)越多,模型見(jiàn)過(guò)的道路情況就越豐富,對(duì)常見(jiàn)場(chǎng)景的理解也會(huì)更穩(wěn)定。像是常規(guī)的跟車、變道、紅綠燈識(shí)別等高頻場(chǎng)景只要數(shù)據(jù)量夠大,模型一般都能學(xué)得比較可靠。

但隨著訓(xùn)練數(shù)據(jù)的增加,這種提升是逐漸變緩的。當(dāng)數(shù)據(jù)規(guī)模達(dá)到一定程度之后,再增加同類型的數(shù)據(jù),收益會(huì)明顯下降。換句話說(shuō),如果新增的數(shù)據(jù)只是重復(fù)已有場(chǎng)景,本質(zhì)上是在讓自動(dòng)駕駛大模型“刷題”,而不是學(xué)習(xí)新的能力。

wKgZO2nMa-WAWtjWAAAR42n7O-I575.jpg

為什么“多”不等于“有效”?

自動(dòng)駕駛數(shù)據(jù)有一個(gè)很典型的特征,就是分布極不均衡。絕大多數(shù)數(shù)據(jù)來(lái)自日常的正常駕駛,很多內(nèi)容都是與直行、跟車、停車相關(guān),而真正決定安全性能的,恰恰是那些極少出現(xiàn)的特殊情況,也就是常說(shuō)的長(zhǎng)尾場(chǎng)景。

這些場(chǎng)景包括突發(fā)橫穿、異常行為車輛、復(fù)雜施工、極端天氣等,這類數(shù)據(jù)天然稀缺。即使采集了海量數(shù)據(jù),絕大部分仍然是“普通樣本”,而關(guān)鍵的長(zhǎng)尾樣本占比很低。

這就讓自動(dòng)駕駛大模型訓(xùn)練數(shù)據(jù)呈現(xiàn)出一個(gè)矛盾,那就是數(shù)據(jù)量在增加,但有效信息并沒(méi)有同步增加。

其實(shí)只要適當(dāng)增加少量長(zhǎng)尾數(shù)據(jù),就可能對(duì)模型在對(duì)應(yīng)邊緣場(chǎng)景下的表現(xiàn)帶來(lái)明顯提升,而盲目增加常規(guī)數(shù)據(jù),大模型的能力提升其實(shí)很有限。

wKgZO2nMa-aAc0Y5AAASG3BOmsQ115.jpg

數(shù)據(jù)質(zhì)量,比數(shù)量更關(guān)鍵

如果說(shuō)數(shù)據(jù)量決定了大模型“上限”,那么數(shù)據(jù)質(zhì)量決定的是其“底線”。

自動(dòng)駕駛訓(xùn)練數(shù)據(jù)對(duì)質(zhì)量的要求非常高,不只是清晰與否的問(wèn)題,而是包括標(biāo)注準(zhǔn)確性、時(shí)間同步、多傳感器對(duì)齊等一整套細(xì)節(jié)。如果這些環(huán)節(jié)出現(xiàn)問(wèn)題,模型學(xué)到的就不是正確的駕駛邏輯,而是帶偏差的經(jīng)驗(yàn)。

wKgZPGnMa-eAIw66AEwcmfpB0Vk981.jpg

圖片源自:網(wǎng)絡(luò)

舉個(gè)簡(jiǎn)單的例子,如果同一幀中,攝像頭和激光雷達(dá)的數(shù)據(jù)沒(méi)有對(duì)齊,那么模型看到的“位置關(guān)系”就是錯(cuò)的。這種錯(cuò)誤不會(huì)在訓(xùn)練時(shí)暴露,但會(huì)在真實(shí)道路中放大。

再說(shuō)說(shuō)標(biāo)注,如果目標(biāo)類別、位置或運(yùn)動(dòng)狀態(tài)標(biāo)錯(cuò),模型就會(huì)在這些邊界條件下產(chǎn)生系統(tǒng)性誤判。

所以在自動(dòng)駕駛大模型訓(xùn)練中會(huì)看到一個(gè)現(xiàn)象,那就是清洗一批“臟數(shù)據(jù)”,比新增同規(guī)模數(shù)據(jù)更有價(jià)值。

wKgZO2nMa-iASHEyAAASAJELks8073.jpg

真正難的是“覆蓋”和“結(jié)構(gòu)”

自動(dòng)駕駛模型并不是在做簡(jiǎn)單的識(shí)別,而是在學(xué)習(xí)一個(gè)動(dòng)態(tài)系統(tǒng),其中包括感知、預(yù)測(cè)和決策。因此,數(shù)據(jù)不僅要多,還要“覆蓋得對(duì)”。

有效的數(shù)據(jù)通常需要滿足多樣性、時(shí)序性、多態(tài)性等多個(gè)關(guān)鍵特征。

wKgZPGnMa-qASez2ANjglQ9o894752.jpg

圖片源自:網(wǎng)絡(luò)

多樣性就是要覆蓋不同天氣、光照、道路類型和交通密度,否則模型只是在特定環(huán)境下有效。

時(shí)序性則強(qiáng)調(diào)的是大模型訓(xùn)練數(shù)據(jù)同一場(chǎng)景下時(shí)刻的要求,單幀數(shù)據(jù)只能描述“此刻是什么”,但駕駛決策依賴的是“接下來(lái)會(huì)發(fā)生什么”,所以必須有連續(xù)幀來(lái)學(xué)習(xí)運(yùn)動(dòng)關(guān)系。

多模態(tài)則是指攝像頭、激光雷達(dá)、毫米波雷達(dá)等信息需要融合,否則感知能力會(huì)有明顯短板。

這些要求也體現(xiàn)出自動(dòng)駕駛大模型訓(xùn)練的一個(gè)要求,那就是數(shù)據(jù)不能只是簡(jiǎn)單堆積,而是需要結(jié)構(gòu)化設(shè)計(jì)。

wKgZPGnMa-2AVo8qAAARwcz1hbg727.jpg

數(shù)據(jù)閉環(huán),比數(shù)據(jù)規(guī)模更重要

在實(shí)際量產(chǎn)的系統(tǒng)中,真正能拉開(kāi)差距的,不是“誰(shuí)的數(shù)據(jù)多”,而是“誰(shuí)的數(shù)據(jù)用得更有效”。

wKgZO2nMa-2AHz4AAAadZZ1MXyI358.jpg

圖片源自:網(wǎng)絡(luò)

數(shù)據(jù)閉環(huán)對(duì)于自動(dòng)駕駛大模型來(lái)說(shuō)非常重要,所謂數(shù)據(jù)閉環(huán),就是指自動(dòng)駕駛系統(tǒng)在道路行駛過(guò)程中運(yùn)行的一整套邏輯,即車輛在道路上運(yùn)行→發(fā)現(xiàn)問(wèn)題→回傳數(shù)據(jù)→針對(duì)性訓(xùn)練→再部署驗(yàn)證。

數(shù)據(jù)閉環(huán)強(qiáng)調(diào)的不是數(shù)據(jù)規(guī)模,而是“針對(duì)性采集”。尤其是長(zhǎng)尾問(wèn)題,需要通過(guò)閉環(huán)機(jī)制不斷補(bǔ)齊,否則再多的歷史數(shù)據(jù)也覆蓋不到。

也正因?yàn)槿绱耍恍┘夹g(shù)方案并不會(huì)被動(dòng)依賴自然采集,而是會(huì)通過(guò)影子模式、仿真生成等方式,主動(dòng)挖掘或構(gòu)造稀缺場(chǎng)景。

wKgZPGnMa-6ASMpSAAATCLDSk7w067.jpg

最后的話

回到最初的問(wèn)題,自動(dòng)駕駛模型訓(xùn)練數(shù)據(jù)并不是越多越好,若單純?cè)黾訑?shù)量,并不能持續(xù)提升能力。只有在數(shù)據(jù)質(zhì)量和結(jié)構(gòu)合理的前提下,規(guī)模越大才越有價(jià)值。

若想真正提升模型上限,其實(shí)需要關(guān)注幾個(gè)方面,即:

數(shù)據(jù)是否覆蓋關(guān)鍵場(chǎng)景,尤其是長(zhǎng)尾;

數(shù)據(jù)是否干凈、標(biāo)注準(zhǔn)確、時(shí)序完整;

數(shù)據(jù)是否形成閉環(huán),可不斷補(bǔ)齊缺失能力;

自動(dòng)駕駛行業(yè)其實(shí)已經(jīng)從“拼數(shù)據(jù)量”逐漸轉(zhuǎn)向“拼數(shù)據(jù)效率”。誰(shuí)能更快發(fā)現(xiàn)問(wèn)題、采到關(guān)鍵數(shù)據(jù)、形成有效訓(xùn)練,誰(shuí)的系統(tǒng)就更接近真實(shí)可用。如果只靠堆數(shù)據(jù),而忽略結(jié)構(gòu)和質(zhì)量,模型很容易在看似訓(xùn)練充分的情況下,在關(guān)鍵時(shí)刻失效。這也是自動(dòng)駕駛一直沒(méi)有完全落地的核心原因之一。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14932

    瀏覽量

    180706
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3712

    瀏覽量

    5230
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    理想汽車發(fā)布下一代自動(dòng)駕駛基礎(chǔ)模型MindVLA-o1

    2026年3月17日,理想汽車基座模型負(fù)責(zé)人詹錕出席NVIDIA GTC 2026,發(fā)表主題演講《MindVLA-o1:開(kāi)啟全能范式——下一代統(tǒng)一視覺(jué)-語(yǔ)言-動(dòng)作自動(dòng)駕駛模型探索》,發(fā)布
    的頭像 發(fā)表于 03-18 11:51 ?1363次閱讀
    理想汽車發(fā)布下一代<b class='flag-5'>自動(dòng)駕駛</b>基礎(chǔ)<b class='flag-5'>模型</b>MindVLA-o1

    自動(dòng)駕駛如何做好數(shù)據(jù)閉環(huán)?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛系統(tǒng)能否穩(wěn)定、安全地工作,關(guān)鍵在于它能不能持續(xù)學(xué)習(xí)、持續(xù)改進(jìn)。自動(dòng)駕駛系統(tǒng)并不是靠一個(gè)寫(xiě)好的程序就能一直用下去的,它在運(yùn)行過(guò)程中會(huì)經(jīng)常遇到“看不懂”或“判斷錯(cuò)
    的頭像 發(fā)表于 02-23 14:00 ?1639次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>如何做好<b class='flag-5'>數(shù)據(jù)</b>閉環(huán)?

    自動(dòng)駕駛如何確保數(shù)據(jù)處理的實(shí)時(shí)性?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)里,數(shù)據(jù)處理的實(shí)時(shí)性并不是一個(gè)抽象的技術(shù)指標(biāo),而是直接決定車輛“來(lái)不來(lái)得及反應(yīng)”的關(guān)鍵能力。道路環(huán)境變化極快,前車急剎、行人突然橫穿、旁車并線等情況
    的頭像 發(fā)表于 02-21 09:48 ?5293次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>如何確保<b class='flag-5'>數(shù)據(jù)</b>處理的實(shí)時(shí)性?

    如何構(gòu)建適合自動(dòng)駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷了系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動(dòng)駕駛</b>的世界<b class='flag-5'>模型</b>?

    自動(dòng)駕駛中常提的模仿學(xué)習(xí)是什么?

    當(dāng)談及自動(dòng)駕駛模型學(xué)習(xí)時(shí),經(jīng)常會(huì)提到模仿學(xué)習(xí)的概念。所謂模仿學(xué)習(xí),就是模型先看別人怎么做,然后學(xué)著去做。自動(dòng)駕駛中的模仿學(xué)習(xí),就是把人類司機(jī)在各種路況下的行為做成范例,記錄下看到了什么
    的頭像 發(fā)表于 01-16 16:41 ?2061次閱讀

    自動(dòng)駕駛模型訓(xùn)練數(shù)據(jù)有什么具體要求?

    [首發(fā)于智駕最前沿微信公眾號(hào)]想訓(xùn)練出一個(gè)可以落地的自動(dòng)駕駛模型,不是簡(jiǎn)單地給其提供幾張圖片,幾條規(guī)則就可以的,而是需要非常多的多樣的、真實(shí)的駕駛
    的頭像 發(fā)表于 12-26 09:32 ?303次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>大<b class='flag-5'>模型</b>的<b class='flag-5'>訓(xùn)練</b><b class='flag-5'>數(shù)據(jù)</b>有什么具體要求?

    自動(dòng)駕駛模型中常提的泛化能力是指啥?

    ”這個(gè)詞看起來(lái)比較抽象,也更容易被模糊使用。 它沒(méi)有直觀的評(píng)價(jià)標(biāo)準(zhǔn),卻決定了模型能不能真正走出訓(xùn)練數(shù)據(jù)、應(yīng)對(duì)真實(shí)道路中的未知情況。理解清楚它到底指的是什么、為什么難、又該如何評(píng)估,是理解自動(dòng)駕
    的頭像 發(fā)表于 12-10 09:15 ?727次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>大<b class='flag-5'>模型</b>中常提的泛化能力是指啥?

    如何訓(xùn)練自動(dòng)駕駛端到端模型?

    ,確實(shí)會(huì)用到模仿學(xué)習(xí)(包括行為克隆、逆最優(yōu)控制/逆強(qiáng)化學(xué)習(xí)等)、強(qiáng)化學(xué)習(xí)(RL),以及近年來(lái)越來(lái)越受關(guān)注的離線強(qiáng)化學(xué)習(xí)(OfflineRL/BatchRL)這三類。 什么是“端到端”訓(xùn)練? 端到端(end-to-end)在自動(dòng)駕駛中的應(yīng)用越來(lái)
    的頭像 發(fā)表于 12-08 16:31 ?1533次閱讀
    如何<b class='flag-5'>訓(xùn)練</b>好<b class='flag-5'>自動(dòng)駕駛</b>端到端<b class='flag-5'>模型</b>?

    模型真的有助于自動(dòng)駕駛落地嗎?

    其實(shí)大模型帶來(lái)的并不是單一的“萬(wàn)能解”,而是一個(gè)能夠顯著提升認(rèn)知、生成和推理能力的新工具箱。它能加速數(shù)據(jù)閉環(huán)、提升對(duì)復(fù)雜場(chǎng)景的理解、改善人機(jī)交互、并在工程流程中提高效率。
    的頭像 發(fā)表于 08-16 09:43 ?1247次閱讀
    大<b class='flag-5'>模型</b>真的有助于<b class='flag-5'>自動(dòng)駕駛</b>落地嗎?

    自動(dòng)駕駛系統(tǒng)的算力越高就越好嗎?

    處理更多的數(shù)據(jù)、更復(fù)雜的模型,并能在更短的時(shí)間內(nèi)作出精準(zhǔn)決策。那是否就代表著算力越高的自動(dòng)駕駛系統(tǒng)就越好自動(dòng)駕駛依賴于攝像頭、激光雷達(dá)(
    的頭像 發(fā)表于 08-11 18:30 ?961次閱讀

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    的結(jié)構(gòu)化標(biāo)簽。這些標(biāo)簽不僅構(gòu)成了模型訓(xùn)練與評(píng)估的數(shù)據(jù)基礎(chǔ),也直接影響系統(tǒng)在實(shí)際道路環(huán)境中的識(shí)別、理解和決策能力。準(zhǔn)確、系統(tǒng)的數(shù)據(jù)標(biāo)注能夠有效提升感知算法的魯棒性與泛化能力,因此
    的頭像 發(fā)表于 07-30 11:54 ?1461次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>數(shù)據(jù)</b>標(biāo)注主要是標(biāo)注什么?

    什么是自動(dòng)駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的開(kāi)發(fā)過(guò)程中,數(shù)據(jù)標(biāo)注是一項(xiàng)至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和
    的頭像 發(fā)表于 07-09 09:19 ?1525次閱讀
    什么是<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>數(shù)據(jù)</b>標(biāo)注?如何好做<b class='flag-5'>數(shù)據(jù)</b>標(biāo)注?

    為什么自動(dòng)駕駛端到端大模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)落地,端到端(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門方向。相較于傳統(tǒng)自動(dòng)駕駛系統(tǒng)中的模塊化結(jié)構(gòu),端到端模型嘗試直接從感知輸
    的頭像 發(fā)表于 07-04 16:50 ?969次閱讀
    為什么<b class='flag-5'>自動(dòng)駕駛</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    只是加減速和轉(zhuǎn)彎,為啥自動(dòng)駕駛這么難實(shí)現(xiàn)?

    并不是那么容易?自動(dòng)駕駛汽車為何發(fā)展這么多年,還是沒(méi)有實(shí)現(xiàn)L5?今天智駕最前沿就來(lái)和大家聊聊這個(gè)話題。 車輛的運(yùn)行軌跡看似簡(jiǎn)單,但并不是簡(jiǎn)單地“往前跑”或“停下來(lái)”那么簡(jiǎn)單。任何一次加減速,都與車輛的質(zhì)量、輪胎與
    的頭像 發(fā)表于 06-27 12:20 ?685次閱讀
    只是加減速和轉(zhuǎn)彎,為啥<b class='flag-5'>自動(dòng)駕駛</b>這么難實(shí)現(xiàn)?

    新能源車軟件單元測(cè)試深度解析:自動(dòng)駕駛系統(tǒng)視角

    。 ?自動(dòng)駕駛軟件的特殊性? ? 感知層: ?激光雷達(dá)、攝像頭等傳感器數(shù)據(jù)處理算法的單元測(cè)試需覆蓋極端場(chǎng)景。例如,激光雷達(dá)點(diǎn)云濾波算法在雨雪天氣下的噪聲抑制能力需通過(guò)邊界測(cè)試驗(yàn)證。某廠商曾在測(cè)試中遺漏
    發(fā)表于 05-12 15:59