91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Waymo和谷歌合作提出一系列用于自動駕駛行為預(yù)測的模型

如意 ? 來源:今日頭條 ? 作者:DeepTech深科技 ? 2020-10-19 12:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀:Waymo 近期宣布在鳳凰城地區(qū)開放沒有安全員的無人駕駛出租車,實現(xiàn)首個商用的真正的無人駕駛。與此同時,Waymo 也公開分享了一系列新的研究論文,本文就來講解一下 Waymo 在行為預(yù)測方面的研究成果。

周圍的車輛和行人在接下來數(shù)秒中會做什么?要實現(xiàn)安全的自動駕駛,這是一個必須回答的關(guān)鍵問題,這也就是自動駕駛領(lǐng)域中的行為預(yù)測問題。

行為預(yù)測的難點在于周圍行人、車輛的不確定性和各種規(guī)則之外的行為。這些狀況難以用規(guī)則進(jìn)行總結(jié),因此最近研發(fā)人員們開始利用基于數(shù)據(jù)驅(qū)動的深度學(xué)習(xí)的方法,以達(dá)到更加合理的預(yù)測效果。

在這方面,來自 Waymo 和谷歌的團(tuán)隊提出了一系列用于自動駕駛行為預(yù)測的模型,讓無人車?yán)斫獬橄蟮牡缆翻h(huán)境,并實現(xiàn)對車輛、行人的多可能性預(yù)測。

在今年 6 月的一篇 CVPR 論文中,這個團(tuán)隊首先提出了一個全新模型 VectorNet。

在該模型中,團(tuán)隊首次提出了一種抽象化認(rèn)識周圍環(huán)境信息的做法:用向量(vector)來簡化地表達(dá)地圖信息和移動物體,這一做法拋開了傳統(tǒng)的用圖片渲染的方式,達(dá)到了降低數(shù)據(jù)量、計算量的效果。Waymo 也在其博客文章中明確表示,該技術(shù)提高了其行為預(yù)測的精準(zhǔn)度。

近日,這個團(tuán)隊公布了進(jìn)一步的工作,提出了 TNT (Target-driveN Trajectory Predictio)。TNT 是一種目的地引導(dǎo)的軌跡預(yù)測方法,運用了監(jiān)督學(xué)習(xí)的方法對車輛和行人進(jìn)行多軌跡回歸,最終的模型能夠輸出多個未來軌跡的預(yù)測,同時明確指出各個軌跡可能性。

論文中介紹,TNT 在公開數(shù)據(jù)集 Argoverse 的測試表現(xiàn)與冠軍結(jié)果相當(dāng),同時在 INTERACTION、Stanford Drone,以及 Waymo 內(nèi)部數(shù)據(jù)集中取得了非常好的效果。

目前該論文已經(jīng)被國際機器人學(xué)習(xí)會議 CoRL(Conference on Robot Learning)接收。

預(yù)測多種可能的未來情形

Waymo和谷歌合作提出一系列用于自動駕駛行為預(yù)測的模型

Waymo 在博客中指出,VectorNet 突破性地提出了用向量的方式來抽象化表達(dá)這個世界,從而感知、理解周圍環(huán)境。在理解環(huán)境以后,下一步就是實現(xiàn)更好的行為預(yù)測。

自動駕駛行為預(yù)測和其他問題不一樣的地方在于,周圍的車輛、行人在接下來數(shù)秒時間里有多種行進(jìn)的可能性。這些可能性本身也將影響自動駕駛車輛的決策規(guī)劃。

比方說,如果機器能算出:前方車輛有 80% 的概率左轉(zhuǎn)、20% 的概率右轉(zhuǎn),自動駕駛車輛都能根據(jù)這一結(jié)果進(jìn)行更好的決策規(guī)劃。同時對機器來說,就算別的車輛只有 1% 的可能性右轉(zhuǎn),這種可能性也不能被忽視。

而這種針對多種可能性的多軌跡預(yù)測,有著很大的技術(shù)難度。當(dāng)下的神經(jīng)網(wǎng)絡(luò)難以很好應(yīng)對多軌跡預(yù)測的任務(wù)。

據(jù)業(yè)內(nèi)人士介紹,神經(jīng)網(wǎng)絡(luò)擅長于一對一和多對一的擬合問題,而非一對多的問題。多對一如常見的分類問題,輸入多張車輛的照片,神經(jīng)網(wǎng)絡(luò)能準(zhǔn)確識別這些照片為 “車” 的類別。一對一如常見的回歸問題,輸入一張車輛的照片,神經(jīng)網(wǎng)絡(luò)能估計它的長寬高等尺寸。但如果輸入一個樣本,想讓神經(jīng)網(wǎng)絡(luò)回歸出三個結(jié)果,這是神經(jīng)網(wǎng)絡(luò)所不擅長的事情。

據(jù)介紹,現(xiàn)在市面上基礎(chǔ)的方案是基于交通規(guī)則獲得周圍車輛、行人的行進(jìn)可能性。如果交規(guī)允許這條道路直行、左右轉(zhuǎn),那么就算三種可能性。但這種方式的預(yù)測結(jié)果并不完全可靠,因為規(guī)則之外的案例并未被考慮其中,如借道,違法掉頭,事實上,要保障自動駕駛長時間運行下的安全性,應(yīng)對規(guī)則之外的情形的能力非常重要。

近兩年的論文內(nèi)容顯示,很多團(tuán)隊正在嘗試使用生成模型來進(jìn)行多軌跡預(yù)測。即利用如 GAN,VAE 等模型在隱空間 latent space 進(jìn)行采樣,得到周圍目標(biāo)在特定場景下的多種潛在選擇。

但依靠生成模型的問題在于,樣本采集存在很大的隨機性,這對一個要求可靠的系統(tǒng)來說是難以接受的。假設(shè)前方來車左拐的可能性有 90%,右拐的可能性有 10%,用采樣的方法很有可能我們采樣三次得到的都是左拐,而忽略了它往右拐的可能性。在自動駕駛領(lǐng)域,依靠這種方式的行為預(yù)測難以進(jìn)行實際應(yīng)用。

用監(jiān)督學(xué)習(xí)實現(xiàn)精準(zhǔn)預(yù)測

該團(tuán)隊提出的 TNT 首次運用了監(jiān)督學(xué)習(xí)的方法對車輛和行人進(jìn)行多軌跡預(yù)測,是一種目的地引導(dǎo)的軌跡預(yù)測方法。其模型的最大貢獻(xiàn),就是能夠不依靠采樣,純靠監(jiān)督學(xué)習(xí)來進(jìn)行多軌跡的行為預(yù)測。

具體來說,該模型的行為預(yù)測按順序分為三步,每一步都有著特定目標(biāo):1、利用地圖的先驗信息,離散化并預(yù)測目的地;2、在預(yù)測目的地基礎(chǔ)之上,進(jìn)一步預(yù)測目標(biāo)的運行軌跡;3、在預(yù)測出多條運行軌跡當(dāng)中,對每條軌跡進(jìn)行篩選和打分,預(yù)測出各個選擇的可能性,也同時選擇出可能性最高的幾個運行軌跡。

Waymo和谷歌合作提出一系列用于自動駕駛行為預(yù)測的模型

在技術(shù)層面,運用監(jiān)督學(xué)習(xí)的好處在于能夠讓最終的模型給出多個未來軌跡的預(yù)測,同時明確指出各個軌跡可能性。比如在輸出三個軌跡的情況下,模型能夠明確指出,30% 可能性左轉(zhuǎn)、30% 可能性右轉(zhuǎn),直行的可能性為 40%。這樣的預(yù)測結(jié)果就能真正地被決策系統(tǒng)所使用。

在最終的表現(xiàn)上,單個 TNT 模型的行為預(yù)測準(zhǔn)確性在公開數(shù)據(jù)集 Argoverse 的測試表現(xiàn)與冠軍結(jié)果相當(dāng),同時在 INTERACTION、Stanford Drone 等測試中取得了非常好的效果。

圖|論文作者團(tuán)隊,左至右分別為趙行、高繼揚、孫晨

論文核心作者來自 Waymo 和谷歌。其中,趙行是 Waymo 研究科學(xué)家,本科畢業(yè)于浙江大學(xué),在麻省理工學(xué)院獲得博士學(xué)位;高繼揚目前是 Waymo 的高級工程師,本科畢業(yè)于清華大學(xué),后在美國南加州大學(xué)獲博士學(xué)位;孫晨本科同樣就讀于清華大學(xué),后博士畢業(yè)于南加州大學(xué),目前在谷歌任研究科學(xué)家。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111446
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3755

    瀏覽量

    52121
  • 自動駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14887

    瀏覽量

    179987
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛端到端為什么會出現(xiàn)黑盒現(xiàn)象?

    自動駕駛領(lǐng)域,端到端(End-to-End)是指從感知環(huán)境的原始數(shù)據(jù)到車輛實際控制指令,全部交給個統(tǒng)的深度學(xué)習(xí)模型來完成。這和傳統(tǒng)的模塊化自動
    的頭像 發(fā)表于 02-20 09:25 ?9285次閱讀
    <b class='flag-5'>自動駕駛</b>端到端為什么會出現(xiàn)黑盒現(xiàn)象?

    如何構(gòu)建適合自動駕駛的世界模型?

    提出的。那世界模型自動駕駛落地的正解嗎? 什么是世界模型? 世界模型對于自動駕駛汽車來說,更像
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動駕駛</b>的世界<b class='flag-5'>模型</b>?

    自動駕駛中常提的模仿學(xué)習(xí)是什么?

    當(dāng)談及自動駕駛模型學(xué)習(xí)時,經(jīng)常會提到模仿學(xué)習(xí)的概念。所謂模仿學(xué)習(xí),就是模型先看別人怎么做,然后學(xué)著去做。自動駕駛中的模仿學(xué)習(xí),就是把人類司機在各種路況下的
    的頭像 發(fā)表于 01-16 16:41 ?2000次閱讀

    自動駕駛中常提的世界模型是什么?

    在很多廠家的技術(shù)方案中,會提到世界模型的介紹。世界模型,就是自動駕駛系統(tǒng)內(nèi)部用來表示外部世界并預(yù)測未來演變的
    的頭像 發(fā)表于 01-05 16:23 ?912次閱讀

    世界模型是讓自動駕駛汽車?yán)斫馐澜邕€是預(yù)測未來?

    ? [首發(fā)于智駕最前沿微信公眾號]世界模型自動駕駛技術(shù)中已有廣泛應(yīng)用。但當(dāng)談及它對自動駕駛的作用時,難免會出現(xiàn)分歧。它到底是讓自動駕駛汽車得以理解世界,還是為其提供了
    的頭像 發(fā)表于 12-16 09:27 ?880次閱讀
    世界<b class='flag-5'>模型</b>是讓<b class='flag-5'>自動駕駛</b>汽車?yán)斫馐澜邕€是<b class='flag-5'>預(yù)測</b>未來?

    VLA能解決自動駕駛中的哪些問題?

    、語言表達(dá)和動作控制這三者整合到個統(tǒng)模型框架中。 與傳統(tǒng)自動駕駛系統(tǒng)將感知、預(yù)測、規(guī)劃、控制拆解為多個獨立模塊的做法不同,VLA可以縮
    的頭像 發(fā)表于 11-25 08:53 ?496次閱讀
    VLA能解決<b class='flag-5'>自動駕駛</b>中的哪些問題?

    自動駕駛為什么要重視軌跡預(yù)測?

    軌跡預(yù)測。 軌跡預(yù)測要做的是,在幾秒到十幾秒的時間范圍內(nèi),判斷出“其他交通參與者可能會怎么移動”。如果缺少這個能力,自動駕駛系統(tǒng)更像是個被動的跟隨者,只能針對當(dāng)前狀況做出反應(yīng);
    的頭像 發(fā)表于 11-20 10:45 ?708次閱讀
    <b class='flag-5'>自動駕駛</b>為什么要重視軌跡<b class='flag-5'>預(yù)測</b>?

    NVIDIA與Uber合作推進(jìn)全球L4級自動駕駛移動出行網(wǎng)絡(luò)

    NVIDIA 宣布與 Uber 達(dá)成合作,將共同擴展全球 L4 級自動駕駛移動出行網(wǎng)絡(luò)。合作將依托 Uber 新代無人駕駛出租車和
    的頭像 發(fā)表于 11-03 14:33 ?1314次閱讀

    不同等級的自動駕駛技術(shù)要求上有何不同?

    談到自動駕駛,不可避免地會涉及到自動駕駛分級,美國汽車工程師學(xué)會(SAE)根據(jù)自動駕駛系統(tǒng)與人類駕駛員參與駕駛
    的頭像 發(fā)表于 10-18 10:17 ?2716次閱讀

    Google Cloud展示一系列前沿技術(shù)更新

    在 2025 Google 谷歌開發(fā)者大會上,Google Cloud 展示了一系列前沿技術(shù)更新——不僅是模型升級,更是智能體、創(chuàng)意、行業(yè)應(yīng)用的全面進(jìn)化。這些前沿技術(shù),正為出海開發(fā)者提供強大的技術(shù)支撐,助力他們打造面向全球用戶的
    的頭像 發(fā)表于 08-29 09:38 ?1151次閱讀

    愛立信推出一系列AI驅(qū)動的新產(chǎn)品與合作計劃

    愛立信近日推出一系列AI驅(qū)動的增強功能,進(jìn)步豐富其業(yè)務(wù)和運營支持系統(tǒng)(OSS/BSS)產(chǎn)品組合,實現(xiàn)產(chǎn)品升級演進(jìn)。同時,愛立信還宣布啟動面向緊密合作伙伴的全新AI合作計劃。
    的頭像 發(fā)表于 07-08 10:05 ?1.6w次閱讀

    為什么自動駕駛端到端大模型有黑盒特性?

    、激光雷達(dá)數(shù)據(jù))映射到控制輸出(如方向盤轉(zhuǎn)角、加速度、制動等),以深度神經(jīng)網(wǎng)絡(luò)為核心,打通了從視覺到駕駛行為的完整鏈條。它也代表了自動駕駛從“規(guī)則驅(qū)動”向“數(shù)據(jù)驅(qū)動”的躍遷,展現(xiàn)了極高的潛力。當(dāng)然這種結(jié)構(gòu)也天然地帶來了
    的頭像 發(fā)表于 07-04 16:50 ?888次閱讀
    為什么<b class='flag-5'>自動駕駛</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    自動駕駛中常提的世界模型是個啥?

    種對外部環(huán)境進(jìn)行抽象和建模的技術(shù),讓自動駕駛系統(tǒng)在個簡潔的內(nèi)部“縮影”里,對真實世界進(jìn)行描述與預(yù)測,從而為感知、決策和規(guī)劃等關(guān)鍵環(huán)節(jié)提供有力支持。 什么是世界模型? 我們不妨先把“世
    的頭像 發(fā)表于 06-24 08:53 ?1132次閱讀
    <b class='flag-5'>自動駕駛</b>中常提的世界<b class='flag-5'>模型</b>是個啥?

    小鵬汽車在全球AI頂會展示下自動駕駛模型

    Driving),與Waymo、英偉達(dá)、加利福尼亞大學(xué)洛杉磯分校(UCLA)、圖賓根大學(xué)(University of Tuebingen)等來自工業(yè)界和學(xué)術(shù)界的自動駕駛同行共同探討業(yè)界最新AI技術(shù)。
    的頭像 發(fā)表于 06-23 09:13 ?1161次閱讀

    自動駕駛模型中常提的Token是個啥?對自動駕駛有何影響?

    、多模態(tài)傳感器數(shù)據(jù)的實時處理與決策。在這過程中,大模型以其強大的特征提取、信息融合和預(yù)測能力為自動駕駛系統(tǒng)提供了有力支持。而在大模型的中,
    的頭像 發(fā)表于 03-28 09:16 ?1347次閱讀