91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能駕駛大模型:有望顯著提升自動(dòng)駕駛系統(tǒng)的性能和魯棒性

汽車電子設(shè)計(jì) ? 來(lái)源:芝能科技 ? 2024-05-07 17:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能駕駛大模型是近年來(lái)人工智能領(lǐng)域和自動(dòng)駕駛領(lǐng)域最為前沿的研究方向之一,它融合了深度學(xué)習(xí)、多模態(tài)融合、世界模型構(gòu)建等多種技術(shù),有望顯著提升自動(dòng)駕駛系統(tǒng)的性能和魯棒性。

01 Transformer架構(gòu)和端到端

2361db3e-0a8e-11ef-a297-92fbcf53809c.png ? ?

Transformer架構(gòu)是近年來(lái)神經(jīng)網(wǎng)絡(luò)領(lǐng)域最具突破性的成果之一,它在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域取得了巨大成功。

Transformer架構(gòu)擅長(zhǎng)建模遠(yuǎn)距離依賴關(guān)系,能夠有效關(guān)聯(lián)多種模態(tài)的信息并合成為統(tǒng)一形式的信號(hào),且其性能通常隨著參數(shù)量的擴(kuò)大而大幅提升。

2365f192-0a8e-11ef-a297-92fbcf53809c.png ?

在智能駕駛領(lǐng)域,Transformer架構(gòu)被廣泛應(yīng)用于感知、預(yù)測(cè)和決策等各個(gè)環(huán)節(jié)。

在感知環(huán)節(jié),Transformer架構(gòu)可以用于構(gòu)建多模態(tài)融合的感知模型,將攝像頭、雷達(dá)、激光雷達(dá)等傳感器獲取的感知信息進(jìn)行融合,以獲得更加完整和準(zhǔn)確的環(huán)境感知結(jié)果;

在預(yù)測(cè)環(huán)節(jié),Transformer架構(gòu)可以用于構(gòu)建時(shí)空預(yù)測(cè)模型,預(yù)測(cè)未來(lái)道路上的行人和車輛運(yùn)動(dòng)軌跡,以幫助自動(dòng)駕駛系統(tǒng)提前規(guī)劃行駛路徑;

在決策環(huán)節(jié),Transformer架構(gòu)可以用于構(gòu)建多模態(tài)決策模型,綜合考慮環(huán)境感知、交通規(guī)則和駕駛策略等因素,做出最優(yōu)的控制決策。

什么是端到端智能駕駛?

2365f192-0a8e-11ef-a297-92fbcf53809c.png

端到端智能駕駛致力于將獨(dú)立的感知、預(yù)測(cè)、決策等模塊融合成一個(gè)統(tǒng)一的模型,使信息能夠在模型的各個(gè)部分進(jìn)行流動(dòng),從而實(shí)現(xiàn)更優(yōu)化的決策。端到端智能駕駛具有以下優(yōu)勢(shì):

提升效率: 端到端模型可以避免中間結(jié)果的存儲(chǔ)和傳輸,減少計(jì)算冗余,提高整體效率。

增強(qiáng)魯棒性: 端到端模型可以使各個(gè)模塊之間相互協(xié)作,共同應(yīng)對(duì)復(fù)雜場(chǎng)景,提高系統(tǒng)的魯棒性。

降低成本: 端到端模型可以減少模型的數(shù)量和復(fù)雜度,降低軟硬件成本。

然而,端到端智能駕駛也面臨著以下挑戰(zhàn):

可解釋性: 端到端模型的內(nèi)部結(jié)構(gòu)較為復(fù)雜,難以解釋其決策過(guò)程,這可能會(huì)導(dǎo)致安全隱患。

魯棒性: 端到端模型對(duì)訓(xùn)練數(shù)據(jù)的依賴性較大,如果訓(xùn)練數(shù)據(jù)存在偏差或不足,可能會(huì)導(dǎo)致模型泛化能力差,在實(shí)際應(yīng)用中表現(xiàn)不佳。

236e2db2-0a8e-11ef-a297-92fbcf53809c.png

02 什么是多模態(tài)智能駕駛

多模態(tài)智能駕駛旨在融合視覺(jué)、聽(tīng)覺(jué)、語(yǔ)言等多種傳感器信息,以提升感知和決策的魯棒性。

多模態(tài)智能駕駛可以克服單一傳感器感知信息不足、魯棒性差等缺點(diǎn),為自動(dòng)駕駛系統(tǒng)提供更加全面和可靠的環(huán)境感知。

2379b768-0a8e-11ef-a297-92fbcf53809c.png

多模態(tài)大模型可以嫁接大語(yǔ)言模型已涌現(xiàn)的上下文學(xué)習(xí)、零樣本學(xué)習(xí)、邏輯推理、常識(shí)判斷等能力,提高智能駕駛面對(duì)復(fù)雜場(chǎng)景的泛化性與可解釋性

例如,通過(guò)視覺(jué)和激光雷達(dá)傳感器可以獲取車輛周圍的靜態(tài)環(huán)境信息,通過(guò)聽(tīng)覺(jué)傳感器可以獲取周圍車輛的喇叭聲、引擎聲等動(dòng)態(tài)信息,通過(guò)語(yǔ)言傳感器可以理解交通指示牌、語(yǔ)音導(dǎo)航指令等信息。

這些信息經(jīng)過(guò)多模態(tài)大模型的融合處理,可以使自動(dòng)駕駛系統(tǒng)更加準(zhǔn)確地理解周圍環(huán)境,并做出更合理的決策。

什么是世界模型?

世界模型是一種用于描述和預(yù)測(cè)駕駛環(huán)境的模型,它可以幫助自動(dòng)駕駛系統(tǒng)提前規(guī)劃行駛路徑,并應(yīng)對(duì)突發(fā)情況。

世界模型通常包含以下要素:

靜態(tài)地圖: 靜態(tài)地圖描述了道路的結(jié)構(gòu)、車道線、交通標(biāo)志等信息。

動(dòng)態(tài)信息: 動(dòng)態(tài)信息描述了道路上行駛的車輛、行人、障礙物等信息。

交通規(guī)則: 交通規(guī)則描述了道路行駛的基本規(guī)則,例如紅燈停綠燈行、限速等。

世界模型的構(gòu)建通常需要大量的駕駛數(shù)據(jù)和先進(jìn)的模型訓(xùn)練方法。例如,可以利用來(lái)自攝像頭、雷達(dá)、激光雷達(dá)等傳感器的感知數(shù)據(jù),以及來(lái)自高精度地圖、交通信息等數(shù)據(jù),來(lái)訓(xùn)練世界模型。

還有哪些前沿技術(shù)?

除了上述幾項(xiàng)主要方向之外,還有SAM、NeRF等其他前沿技術(shù)也被應(yīng)用于智能駕駛大模型中,這些技術(shù)有望進(jìn)一步提升智能駕駛系統(tǒng)的性能和能力。

SAM(Self-Attention Mapping):SAM是一種基于自注意力機(jī)制的時(shí)空感知模型,可以有效地捕捉環(huán)境中的動(dòng)態(tài)變化,并預(yù)測(cè)未來(lái)環(huán)境的演化趨勢(shì)。

NeRF(Neurual Radiance Fields):NeRF是一種基于神經(jīng)網(wǎng)絡(luò)的渲染技術(shù),可以利用稀疏的觀測(cè)數(shù)據(jù)生成逼真的三維場(chǎng)景重建,為自動(dòng)駕駛系統(tǒng)提供更加沉浸式的環(huán)境感知。

小結(jié)

智能駕駛大模型是智能駕駛領(lǐng)域近年來(lái)最具前瞻性的研究方向之一,智能駕駛大模型也面臨著一些挑戰(zhàn),例如模型的復(fù)雜度、訓(xùn)練數(shù)據(jù)的需求量、倫理問(wèn)題等。 智能駕駛大模型代表了自動(dòng)駕駛技術(shù)發(fā)展的未來(lái)趨勢(shì)。

審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50102

    瀏覽量

    265527
  • 智能駕駛
    +關(guān)注

    關(guān)注

    5

    文章

    3008

    瀏覽量

    51292
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124408
  • 自動(dòng)駕駛系統(tǒng)

    關(guān)注

    0

    文章

    70

    瀏覽量

    7323
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3651

    瀏覽量

    5194

原文標(biāo)題:芝能智駕 | 什么是智能駕駛大模型?

文章出處:【微信號(hào):QCDZSJ,微信公眾號(hào):汽車電子設(shè)計(jì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何構(gòu)建適合自動(dòng)駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷了系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動(dòng)駕駛</b>的世界<b class='flag-5'>模型</b>?

    自動(dòng)駕駛模型中常提的泛化能力是指啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在討論自動(dòng)駕駛模型時(shí),常會(huì)有幾個(gè)評(píng)價(jià)維度,如感知是否準(zhǔn)確、決策是否穩(wěn)定、系統(tǒng)是否足夠,以及
    的頭像 發(fā)表于 12-10 09:15 ?603次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>大<b class='flag-5'>模型</b>中常提的泛化能力是指啥?

    模型中常提的快慢思考會(huì)對(duì)自動(dòng)駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺(jué)語(yǔ)言模型和世界模型的全新自動(dòng)駕駛技術(shù)架構(gòu)標(biāo)志著其全棧自研的智能
    的頭像 發(fā)表于 11-22 10:59 ?2508次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會(huì)對(duì)<b class='flag-5'>自動(dòng)駕駛</b>產(chǎn)生什么影響?

    自動(dòng)駕駛仿真測(cè)試有什么具體要求?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛技術(shù)快速迭代、功能邊界不斷擴(kuò)展的今天,如何系統(tǒng)、嚴(yán)謹(jǐn)且高效地驗(yàn)證一個(gè)自動(dòng)駕駛系統(tǒng)性能,成為研發(fā)、測(cè)
    的頭像 發(fā)表于 10-15 09:14 ?638次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>仿真測(cè)試有什么具體要求?

    如何確保自動(dòng)駕駛汽車感知的準(zhǔn)確?

    感知的定義及原理 在聊這個(gè)話題之前,我們先聊一聊感知是什么,自動(dòng)駕駛感知系統(tǒng)就是一個(gè)把外界變成機(jī)器可用信息的工程流水線。感知系統(tǒng)的輸入主要依靠如攝像頭(可見(jiàn)光、近紅外)、激光雷達(dá)(LiDAR)、毫米波雷達(dá)(RADAR)、超聲
    的頭像 發(fā)表于 08-23 15:06 ?1676次閱讀
    如何確保<b class='flag-5'>自動(dòng)駕駛</b>汽車感知的準(zhǔn)確<b class='flag-5'>性</b>?

    決定自動(dòng)駕駛激光雷達(dá)感知質(zhì)量的因素有哪些?

    一個(gè)激光雷達(dá)是否適合自動(dòng)駕駛,基本上取決于它在距離(range)、角度/點(diǎn)云分辨率(resolution)、以及在現(xiàn)實(shí)世界復(fù)雜條件下的(robustness)。
    的頭像 發(fā)表于 08-20 12:08 ?2216次閱讀
    決定<b class='flag-5'>自動(dòng)駕駛</b>激光雷達(dá)感知質(zhì)量的因素有哪些?

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    的結(jié)構(gòu)化標(biāo)簽。這些標(biāo)簽不僅構(gòu)成了模型訓(xùn)練與評(píng)估的數(shù)據(jù)基礎(chǔ),也直接影響系統(tǒng)在實(shí)際道路環(huán)境中的識(shí)別、理解和決策能力。準(zhǔn)確、系統(tǒng)的數(shù)據(jù)標(biāo)注能夠有效提升感知算法的
    的頭像 發(fā)表于 07-30 11:54 ?1355次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    低速自動(dòng)駕駛與乘用車自動(dòng)駕駛在技術(shù)要求上有何不同?

    到我們生活的方方面面。與面向開(kāi)放道路、高速巡航的乘用車自動(dòng)駕駛系統(tǒng)相比,低速小車在技術(shù)實(shí)現(xiàn)、系統(tǒng)架構(gòu)、硬件配置、軟件算法及安全冗余等方面都存在顯著差異和針對(duì)
    的頭像 發(fā)表于 07-14 09:10 ?1046次閱讀
    低速<b class='flag-5'>自動(dòng)駕駛</b>與乘用車<b class='flag-5'>自動(dòng)駕駛</b>在技術(shù)要求上有何不同?

    淺析4D-bev標(biāo)注技術(shù)在自動(dòng)駕駛領(lǐng)域的重要

    ?自動(dòng)駕駛技術(shù)的發(fā)展日新月異。從最初簡(jiǎn)單的輔助駕駛功能,逐步邁向高度自動(dòng)化甚至完全自動(dòng)駕駛的階段。其中,海量且精準(zhǔn)的數(shù)據(jù)是訓(xùn)練高性能
    的頭像 發(fā)表于 06-12 16:10 ?2399次閱讀

    新能源車軟件單元測(cè)試深度解析:自動(dòng)駕駛系統(tǒng)視角

    、道路塌陷)的測(cè)試用例庫(kù),通過(guò)虛擬仿真和真實(shí)路測(cè)數(shù)據(jù)回灌驗(yàn)證算法的。 ?第二部分:自動(dòng)駕駛軟件單元測(cè)試技術(shù)體系****? ?測(cè)試對(duì)象分類與測(cè)試策略? ? 數(shù)據(jù)驅(qū)動(dòng)型模塊(如傳
    發(fā)表于 05-12 15:59

    AI將如何改變自動(dòng)駕駛

    自動(dòng)駕駛帶來(lái)哪些變化?其實(shí)AI可以改變自動(dòng)駕駛技術(shù)的各個(gè)環(huán)節(jié),從感知能力的提升到?jīng)Q策框架的優(yōu)化,從安全性能的增強(qiáng)到測(cè)試驗(yàn)證的加速,AI可以讓自動(dòng)駕駛
    的頭像 發(fā)表于 05-04 09:58 ?849次閱讀

    模型如何推動(dòng)自動(dòng)駕駛技術(shù)革新?

    [首發(fā)于智駕最前沿微信公眾號(hào)]近年來(lái),人工智能技術(shù)正以前所未有的速度在各個(gè)領(lǐng)域滲透與應(yīng)用,而大模型(大語(yǔ)言模型和多模態(tài)大模型)的迅猛發(fā)展為自動(dòng)駕駛
    的頭像 發(fā)表于 04-20 13:16 ?1030次閱讀
    大<b class='flag-5'>模型</b>如何推動(dòng)<b class='flag-5'>自動(dòng)駕駛</b>技術(shù)革新?

    自動(dòng)駕駛模型中常提的Token是個(gè)啥?對(duì)自動(dòng)駕駛有何影響?

    近年來(lái),人工智能技術(shù)迅速發(fā)展,大規(guī)模深度學(xué)習(xí)模型(即大模型)在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別以及自動(dòng)駕駛等多個(gè)領(lǐng)域取得了突破進(jìn)展。
    的頭像 發(fā)表于 03-28 09:16 ?1350次閱讀

    NVIDIA Halos自動(dòng)駕駛汽車安全系統(tǒng)發(fā)布

    NVIDIA 整合了從云端到車端的安全自動(dòng)駕駛開(kāi)發(fā)技術(shù)套件,涵蓋車輛架構(gòu)到 AI 模型,包括芯片、軟件、工具和服務(wù)。 物理 AI 正在為自動(dòng)駕駛和機(jī)器人開(kāi)發(fā)技術(shù)的交叉領(lǐng)域釋放新的可能
    的頭像 發(fā)表于 03-25 14:51 ?1187次閱讀