91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種端到端的單階段多視圖融合3D檢測方法MVAF-Net

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 作者:新機(jī)器視覺 ? 2021-01-27 11:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

該方法將激光雷達(dá)投影的BEV和前向視角、與攝像頭視角圖像作為檢測輸入,在特征融合中,提出attentive pointwise fusion (APF) 模塊。設(shè)計attentive pointwise weighting (APW) 模塊學(xué)習(xí),附加另外兩個任務(wù)foreground分類和中心回歸。

af6eaade-6042-11eb-8b86-12bb97331649.png

如圖是架構(gòu)圖:整個MVAF-Net包括三個部分

1)單視圖特征提取(SVFE),

2)多視圖特征融合(MVFF)

3)融合特征檢測(FFD)。

afbae516-6042-11eb-8b86-12bb97331649.png

在SVFE部分,原始的RGB圖像和點云由3-stream CNN主干(CV,BEV和RV)處理,生成多視圖特征圖,在BEV和RV做點云體素化。在MVFF部分,多視圖特征與attentive pointwise fusion模塊逐點自適應(yīng)融合。融合的點特征通過attentive pointwise weighting模塊進(jìn)一步處理,對點特征進(jìn)行加權(quán)并學(xué)習(xí)結(jié)構(gòu)信息。在FFD部分,對融合和重加權(quán)的點特征再次體素化,并作融合主干輸入給最終的3D檢測。

RV投影表示為柱面坐標(biāo)系統(tǒng):

b02bd316-6042-11eb-8b86-12bb97331649.png

attentive pointwise fusion模塊架構(gòu)如下:

b0809f40-6042-11eb-8b86-12bb97331649.png

而attentive pointwise weighting模塊架構(gòu)如下:

b131afb0-6042-11eb-8b86-12bb97331649.png

MVAF-Net的主干網(wǎng)絡(luò)細(xì)節(jié)如下圖:

b1825e38-6042-11eb-8b86-12bb97331649.png

檢測頭包括:分類(focal loss)、框回歸(SmoothL1 loss)和方向分類(softMax loss)。其總loss函數(shù)為

b20fc3a4-6042-11eb-8b86-12bb97331649.png

最后兩個是前景分類項(focal loss)和中心回歸項(SmoothL1 loss)。

結(jié)果如下:

b27a322a-6042-11eb-8b86-12bb97331649.png

結(jié)論

我們提出了一種端到端的單階段多視圖融合3D檢測方法MVAF-Net,它由三部分組成:單視圖特征提?。⊿VFE),多視圖特征融合(MVFF)和融合特征檢測(FFD)。在SVFE部分,三流CNN主干(CV,BEV和RV主干)使用LiDAR點云和RGB圖像來生成多視圖特征圖。在MVFF部分,使用我們提出的注意點向融合(APF)模塊實現(xiàn)了多視圖特征的自適應(yīng)融合,該模塊可以使用注意力機(jī)制自適應(yīng)地確定從多視圖輸入中引入了多少信息。此外,我們通過提出的注意點加權(quán)(APW)模塊進(jìn)一步改善了網(wǎng)絡(luò)的性能,該模塊可以對點特征進(jìn)行加權(quán)并通過兩個額外的任務(wù)來學(xué)習(xí)結(jié)構(gòu)信息:前景分類和中心回歸。大量實驗驗證了所提出的APF和APW模塊的有效性。此外,所提出的MVAF-Net產(chǎn)生了競爭性結(jié)果,并且在所有單階段融合方法中均達(dá)到了最佳性能。此外,我們的MVAF-Net勝過大多數(shù)兩階段融合方法,在KITTI基準(zhǔn)上實現(xiàn)了速度和精度之間的最佳平衡。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2838

    瀏覽量

    53317
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    5096

    瀏覽量

    103175
  • 激光雷達(dá)
    +關(guān)注

    關(guān)注

    980

    文章

    4480

    瀏覽量

    196603

原文標(biāo)題:相機(jī)與激光雷達(dá)融合的3D目標(biāo)檢測方法MVAF-Net

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何訓(xùn)練好自動駕駛模型?

    [首發(fā)于智駕最前沿微信公眾號]最近有位小伙伴在后臺留言提問:算法是怎樣訓(xùn)練的?是模仿學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和離線強(qiáng)化學(xué)習(xí)這三類嗎?其實
    的頭像 發(fā)表于 12-08 16:31 ?1465次閱讀
    如何訓(xùn)練好自動駕駛<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型?

    Vitrox的v510i系列的3D AOI光學(xué)檢測設(shè)備

    V510i部署在SMT生產(chǎn)線的 貼片機(jī)之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務(wù)是: 3D與2D復(fù)合檢測 :同時利用
    的頭像 發(fā)表于 12-04 09:27 ?681次閱讀

    Nullmax軌跡規(guī)劃論文入選AAAI 2026

    11月8日,全球人工智能頂會 AAAI 2026 公布論文錄用結(jié)果,Nullmax 研發(fā)團(tuán)隊的軌跡規(guī)劃論文成功入選。該論文創(chuàng)新提出一種由粗
    的頭像 發(fā)表于 11-12 10:53 ?878次閱讀

    板子的差分時鐘如何正確地轉(zhuǎn)化為

    本組使用的板子是GENESYS2,輸入時鐘信號為差分時鐘信號,而E203使用的時鐘都是的,所以需要將差分時鐘信號轉(zhuǎn)為。而通過網(wǎng)絡(luò)檢索,可以得到以下的
    發(fā)表于 10-27 07:29

    自動駕駛中“段式”和“二段式”有什么區(qū)別?

    [首發(fā)于智駕最前沿微信公眾號]最近有小伙伴提問,段式和二段式
    的頭像 發(fā)表于 10-24 09:03 ?1222次閱讀
    自動駕駛中“<b class='flag-5'>一</b>段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”和“二段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”有什么區(qū)別?

    自動駕駛中常提的段式(段)是個啥?

    自動駕駛技術(shù)的發(fā)展,催生出技術(shù)的應(yīng)用,段式
    的頭像 發(fā)表于 10-18 10:16 ?1709次閱讀

    玩轉(zhuǎn) KiCad 3D模型的使用

    時間都在與 2D 的焊盤、走線和絲印打交道。但個完整的產(chǎn)品,終究是要走向物理世界的。元器件的高度、接插件的朝向、與外殼的配合,這些都是 2D 視圖難以表達(dá)的。 幸運的是,KiCad
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    海伯森3D閃測傳感器,工業(yè)檢測領(lǐng)域的高精度利器

    隨著信息技術(shù)的飛速進(jìn)步,第四次視覺革命深度融合“人”“機(jī)”“物”,基于光學(xué)原理的3D視覺檢測技術(shù)迎來爆發(fā)式發(fā)展,成為工業(yè)生產(chǎn)中更高效的檢測利器。3D
    的頭像 發(fā)表于 06-20 17:46 ?1489次閱讀
    海伯森<b class='flag-5'>3D</b>閃測傳感器,工業(yè)<b class='flag-5'>檢測</b>領(lǐng)域的高精度利器

    ABSD-10169PSM差分有源巴倫Marki

    ABSD-10169PSM差分有源巴倫MarkiABSD-10169PSM是款使用3mm QFN表面貼裝封裝的GaAs有源MMIC平
    發(fā)表于 06-19 09:21

    為何成為各車企智駕布局的首要選擇?

    算法實現(xiàn)輸入輸出的整體映射,技術(shù)通過將原始傳感器數(shù)據(jù)直接輸入單神經(jīng)網(wǎng)絡(luò),并在網(wǎng)絡(luò)中經(jīng)
    的頭像 發(fā)表于 06-07 11:52 ?743次閱讀
    為何<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>成為各車企智駕布局的首要選擇?

    文帶你厘清自動駕駛架構(gòu)差異

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)飛速發(fā)展,智能駕駛系統(tǒng)的設(shè)計思路也經(jīng)歷了從傳統(tǒng)模塊化架構(gòu)大模型轉(zhuǎn)變。傳統(tǒng)模塊化架構(gòu)將感知、預(yù)測、規(guī)劃和控制等子任務(wù)拆分開,分別由不
    的頭像 發(fā)表于 05-08 09:07 ?1052次閱讀
    <b class='flag-5'>一</b>文帶你厘清自動駕駛<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架構(gòu)差異

    VirtualLab Fusion應(yīng)用:光學(xué)系統(tǒng)的3D可視化

    3D 系統(tǒng)視圖: 無光可視化系統(tǒng) 選項 - 選擇要顯示的元件 右鍵單擊文檔窗口,菜單上將顯示詳細(xì)選項。第個選項 \"Select Elements to Show\"允許對文
    發(fā)表于 04-02 08:42

    小米汽車智駕技術(shù)介紹

    后起之秀,小米在宣布造車前被非常的人質(zhì)疑,但在“真香”定律下,小米創(chuàng)下了很多友商所不能及的成就。作為科技企業(yè),小米也在智能駕駛領(lǐng)域也不斷研發(fā)及突破,并推送了自動駕駛系統(tǒng)。 小米
    的頭像 發(fā)表于 03-31 18:17 ?5294次閱讀
    小米汽車<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>智駕技術(shù)介紹

    技術(shù)分享 |模態(tài)自動駕駛混合渲染HRMAD:將NeRF和3DGS進(jìn)行感知驗證和AD測試

    模態(tài)自動駕駛混合渲染HRMAD,融合NeRF與3DGS技術(shù),實現(xiàn)超10萬㎡場景重建,傳感器實時輸出,仿真更接近真實數(shù)據(jù)!然而,如何用高保真仿真場景快速驗證自動駕駛算法?HRMAD已
    的頭像 發(fā)表于 03-26 16:05 ?4238次閱讀
    技術(shù)分享 |<b class='flag-5'>多</b>模態(tài)自動駕駛混合渲染HRMAD:將NeRF和<b class='flag-5'>3</b>DGS進(jìn)行感知驗證和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>AD測試

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是個關(guān)鍵組件,它在側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標(biāo)簽,具備重要的研
    的頭像 發(fā)表于 03-17 13:44 ?1244次閱讀
    <b class='flag-5'>一種</b>以圖像為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>