91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于圖卷積的層級圖網(wǎng)絡(luò)用于基于點(diǎn)云的3D目標(biāo)檢測

454398 ? 來源:學(xué)術(shù)頭條 ? 作者:徐家興 ? 2021-06-21 12:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

論文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds

由于大多數(shù)現(xiàn)有的點(diǎn)云對象檢測方法不能充分適應(yīng)點(diǎn)云的特征(例如稀疏性),所以一些關(guān)鍵的語義信息(如物體形狀)不能被很好的捕捉到。本文提出了一種基于層級圖網(wǎng)絡(luò)(HGNet)的圖卷積(GConv),可以直接將點(diǎn)云作為輸入來預(yù)測 3D 的邊界框。形狀注意圖卷積(SA-GConv)可以通過劍魔點(diǎn)的位置星系來描述物體形狀,基于 SA-GConv 的 U 形網(wǎng)絡(luò)可以通過改進(jìn)的 voting 模塊獲取多層級的特征進(jìn)而生成候選,然后一個(gè)基于圖卷積的候選推理模塊考慮全局的場景語義來對邊界框進(jìn)行預(yù)測。該框架在兩個(gè)大規(guī)模點(diǎn)云數(shù)據(jù)上的表現(xiàn)超過了目前最先進(jìn)的模型。

論文背景

由于點(diǎn)云的稀疏性,一些已有的為網(wǎng)格形式數(shù)據(jù)設(shè)計(jì)的方法(如 CNN)在點(diǎn)云上的表現(xiàn)并不好,為解決這一問題,最近有一些對點(diǎn)云數(shù)據(jù)的方法被提出,例如基于投影的方法、基于體卷積的方法和基于 PointNet 的方法。前兩種試圖將點(diǎn)云數(shù)據(jù)嚴(yán)格轉(zhuǎn)換為網(wǎng)格結(jié)構(gòu)數(shù)據(jù),而后一種則在不明確考慮點(diǎn)的幾何位置的情況下聚合特征。

其他方法相比,PointNet++ 可以保留點(diǎn)的稀疏特點(diǎn),因此被廣泛作為框架的骨架。當(dāng)目前仍有一些未能很好解決的挑戰(zhàn),首先由于沒有考慮點(diǎn)的相對幾何位置,因此使用 PointNet++ 作為主干忽略了一些局部形狀信息。其次,框架的結(jié)構(gòu)沒有充分利用多級語義,這可能會忽略一些有助于目標(biāo)檢測的信息。

本文提出了一個(gè)基于圖卷積(GCONV)的層級圖網(wǎng)絡(luò)(HGNet)用于基于點(diǎn)云的 3D 目標(biāo)檢測。HGNet 包含三部分:一個(gè)基于圖卷積的 U 形網(wǎng)絡(luò)(GUnet)、一個(gè)候選生成器以及一個(gè)候選推理模塊(ProRe Module)。基于層級圖網(wǎng)絡(luò)(HGNet)的圖卷積

整個(gè) HGNet 以端到端的方式進(jìn)行培訓(xùn)。在本文的框架中,點(diǎn)云的局部形狀信息、多級語義和全局場景信息(候選的特征)已被層級圖模型充分捕獲、聚合和合并,充分考慮了點(diǎn)云數(shù)據(jù)的特征。

本文的主要貢獻(xiàn)如下:

(A)開發(fā)了一種新的層級圖網(wǎng)絡(luò)(HGNet),用于在點(diǎn)云上進(jìn)行 3D 對象檢測,其表現(xiàn)好于已有方法。

(B)提出了一種新穎的 SA-(De)GConv,它可以有效地聚合特征并捕獲點(diǎn)云中對象的形狀信息。

(C)構(gòu)建了一個(gè)新的 GU-net,用于生成多級特征,這對于 3D 對象檢測至關(guān)重要。

(D)利用全局信息,ProRe 模塊通過對候選進(jìn)行推理來提高效果。

論文模型

pIYBAF-cV8yALlh9AAKzXXorTzM753.jpg

融合采樣

3D 目標(biāo)檢測有基于點(diǎn)和基于體素兩種框架,前者更加耗時(shí),由候選生成與預(yù)測細(xì)化兩個(gè)階段組成。

在第一個(gè)階段,SA 用于降采樣以獲得更高的效率以及擴(kuò)大感受野,F(xiàn)P 用來為降采樣過程中丟掉的點(diǎn)傳播特征。在第二階段,一個(gè)優(yōu)化模塊最優(yōu)化 RPN 的結(jié)果以獲得更準(zhǔn)確的預(yù)測。SA 對于提取點(diǎn)的特征是必需的。但 FP 和優(yōu)化模塊會限制效率。

形狀注意圖卷積

點(diǎn)云通常不能清楚地表示出物體的形狀,可以使用其相鄰點(diǎn)的相對幾何位置來描述點(diǎn)周圍的局部形狀。本文介紹了一種新穎的形狀注意圖卷積,它通過對點(diǎn)的幾何位置建模來捕獲對象形狀。

對于一個(gè)點(diǎn)集 X,其中每一個(gè)點(diǎn)由其集合位置 p_i 以及 D 維的特征 f_i 組成,我們想要生成一個(gè) X’,本文設(shè)計(jì)了圖卷積用于聚合從 X 到 X’ 的特征。與 PointNet++的采樣層相類似,本文首先從 n 個(gè)點(diǎn)中采樣 n’ 個(gè)點(diǎn),通常 K 最近鄰(KNN)被用來在采樣中保留局部信息將其作為中心點(diǎn)特征。

pIYBAF-cV86ABApMAAA25BZLxR8713.jpg

其中 g 表示 i 和 j 的相對位置,通過一個(gè)卷積將三維變?yōu)橐痪S,f 是 mlp,然后二者的乘積就是中心點(diǎn)的 knn,其中最大的作為 i 的特征。形狀注意操作不同于簡單的基于 mlp 的操作主要就是因?yàn)檫@個(gè) g 函數(shù)。雖然形式上沒有 attention 中的 softmax 這樣的歸一化,但是 g 的輸出就和 attention 一樣,每個(gè)點(diǎn)的 weights,然后對應(yīng)的乘以特征。

o4YBAF-cV9iAADYDAAfuw2ITQns343.jpg

GU-net

本文設(shè)計(jì)了一個(gè)下采樣模塊,并將其重復(fù)堆疊 4 次以形成下采樣路徑,而將一個(gè)上采樣模塊重復(fù)堆疊兩次以構(gòu)成上采樣方式。類似 FPN、GU-net 生成三張點(diǎn)特征圖的特征金字塔。下采樣使用的是 FPS,然后通過 KNN 構(gòu)建局部區(qū)域,再使用 SA-GConv 更新特征,上采樣模塊的過程與下采樣模塊的過程相反,主要由 SA-GConv 執(zhí)行。

pIYBAF-cV96AZ4YhAAVmh5c6fG8299.jpg

候選生成器

GU-net 生成了包含多級語義的三張點(diǎn)特征圖。一些先前的方法(如 VoteNet)僅使用一個(gè)特征圖進(jìn)行目標(biāo)預(yù)測。即使通過在上采樣過程中融合較低層的特征來計(jì)算較高層的特征,由于不同層的特征提供了各種語義,因此將多層特征一起用于候選生成會更加有益。本文提出了一種候選生成器,以改進(jìn)的投票模塊作為主要結(jié)構(gòu)來預(yù)測對象中心,該模型將多級特征轉(zhuǎn)換為相同的特征空間。接下來為了聚合特征,通過 FPS 保留 Np 的投票,該做法與 VoteNet 類似,從而融合多級特征以預(yù)測邊界框及其類別。

候選推理模塊

通過以上幾步,多層局部的語義信息已經(jīng)被很好的捕捉到了,但全局信息還沒有很好的學(xué)到,或者說可能有些目標(biāo)在點(diǎn)云中只體現(xiàn)出很小的一部分表面的點(diǎn),在這樣少的信息下很難正確的將其識別出來。其推理過程為:

o4YBAF-cV-CABjbfAAAyyHHn4tE694.jpg

其中 Hp 表示候選特征 tensor,P 表示候選的相對位置

論文實(shí)驗(yàn)

本文在 SUN RGB-D 和 ScanNet-V2 兩個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。

pIYBAF-cV-SAecV-AAIQCbTGyOM690.jpg

o4YBAF-cV-mAODbPAAM3xD0AqUY930.jpg

此外,本文還進(jìn)行了消融實(shí)驗(yàn)以證明各??斓挠行?。

o4YBAF-cV-6ALsTCAAKeSQs30fg144.jpg

結(jié)論

本文提出了一種新穎的 HGNet 框架,該框架通過層級圖建模學(xué)習(xí)語義。

具體來說,作者提出了一種新穎且輕巧的形狀注意圖卷積來捕獲局部形狀語義,該語義聚合了點(diǎn)的相對幾何位置的特征?;?SA-GConv 和 SA-DeGConv 構(gòu)建了 GU-net,生成了包含多級語義的特征金字塔。要素金字塔投票的點(diǎn)將位于相應(yīng)的對象中心,并且進(jìn)一步聚合多級語義以生成候選。然后使用 ProRe 模塊在候選之間合并和傳播特征,從而利用全局場景語義來提高檢測性能。最后,對邊界框和類別進(jìn)行了預(yù)測。

編輯:hfy


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    光子精密3D工業(yè)相機(jī)高效質(zhì)檢連接器pin針

    光子精密GL-8000系列3D線激光輪廓測量儀,專為精密工件三維檢測而生,從算法、硬件到系統(tǒng)集成,全面解除PIN針檢測點(diǎn)
    的頭像 發(fā)表于 01-29 15:51 ?132次閱讀
    光子精密<b class='flag-5'>3D</b>工業(yè)相機(jī)高效質(zhì)檢連接器pin針

    Vitrox的v510i系列的3D AOI光學(xué)檢測設(shè)備

    V510i部署在SMT生產(chǎn)線的 貼片機(jī)之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務(wù)是: 3D與2D復(fù)合檢測
    的頭像 發(fā)表于 12-04 09:27 ?674次閱讀

    3D案例丨不良率直降!光子精密3D工業(yè)相機(jī)專治汽車散熱板測量痛點(diǎn)

    汽車散熱板是熱管理系統(tǒng)核心部件,其質(zhì)量直接影響整車穩(wěn)定性、壽命與市場競爭力。 但汽車散熱基板(尤其是銅基板)尺寸大、端點(diǎn)小、結(jié)構(gòu)密集,且受多重反射與雜光干擾,常規(guī) 3D 檢測易出現(xiàn)精度和測量范圍難
    的頭像 發(fā)表于 11-20 08:03 ?259次閱讀
    <b class='flag-5'>3D</b>案例丨不良率直降!光子精密<b class='flag-5'>3D</b>工業(yè)相機(jī)專治汽車散熱板測量痛<b class='flag-5'>點(diǎn)</b>

    iSUN3D即將推出單組分彈性樹脂3D打印解決方案!

    iSUN3D將在Formnext 2025發(fā)布單組分彈性樹脂3D打印方案,覆蓋設(shè)計(jì)到交付全流程,解決柔彈性制造成本與效率痛點(diǎn),現(xiàn)場可體驗(yàn)高速打印與限量禮品。
    的頭像 發(fā)表于 11-17 11:45 ?669次閱讀
    iSUN<b class='flag-5'>3D</b>即將推出單組分彈性樹脂<b class='flag-5'>3D</b>打印解決方案!

    一些神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計(jì)優(yōu)化方案

    特征保留不變,完成和所有相關(guān)卷積點(diǎn)積以后再加載,最多復(fù)用 R*R*M 次。 3.不同網(wǎng)絡(luò)模型的效果 如圖所示,后者相對于前者,減少了
    發(fā)表于 10-31 07:14

    【CIE全國RISC-V創(chuàng)新應(yīng)用大賽】+基于MUSE Pi Pro的3d激光里程計(jì)實(shí)現(xiàn)

    基于Point-LIO算法的系統(tǒng)設(shè)計(jì)、實(shí)現(xiàn)方法和優(yōu)化策略。 1. 系統(tǒng)概述 項(xiàng)目目標(biāo) 利用MUSE Pi Pro開發(fā)板和速騰聚創(chuàng)Airy 96線激光雷達(dá)傳感器,基于Point-LIO算法開發(fā)高性能的3D
    發(fā)表于 10-24 17:02

    如何通過地址生成器實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)特征的padding?

    對于SiamFC網(wǎng)絡(luò)結(jié)構(gòu),我們設(shè)計(jì)的卷積核寬度為3*3,卷積步長為1,則經(jīng)卷積過后,特征
    發(fā)表于 10-22 08:15

    玩轉(zhuǎn) KiCad 3D模型的使用

    時(shí)間都在與 2D 的焊盤、走線和絲印打交道。但一個(gè)完整的產(chǎn)品,終究是要走向物理世界的。元器件的高度、接插件的朝向、與外殼的配合,這些都是 2D 視圖難以表達(dá)的。 幸運(yùn)的是,KiCad 提供了強(qiáng)大的 3D 可視化功能。它不僅能讓你
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    iTOF技術(shù),多樣化的3D視覺應(yīng)用

    動態(tài)模糊,確保高耐光性,同時(shí)輸出2D(紅外)和3D(深度)數(shù)據(jù)。 ◆ Testing Principles ※ 測量脈沖光的飛行時(shí)間,以檢測 TOF 相機(jī)與被測物體之間的距離。 ◆ ToF 產(chǎn)品
    發(fā)表于 09-05 07:24

    3D激光輪廓儀可實(shí)現(xiàn)在線3D測量和檢測

    Z-Trak? Express 1K5 系列專為實(shí)現(xiàn)經(jīng)濟(jì)高效的在線3D測量和檢測而設(shè)計(jì),具有高速檢測能力和實(shí)時(shí)處理性能。
    的頭像 發(fā)表于 08-08 17:17 ?982次閱讀
    <b class='flag-5'>3D</b>激光輪廓儀可實(shí)現(xiàn)在線<b class='flag-5'>3D</b>測量和<b class='flag-5'>檢測</b>

    海伯森3D閃測傳感器,工業(yè)檢測領(lǐng)域的高精度利器

    隨著信息技術(shù)的飛速進(jìn)步,第四次視覺革命深度融合“人”“機(jī)”“物”,基于光學(xué)原理的3D視覺檢測技術(shù)迎來爆發(fā)式發(fā)展,成為工業(yè)生產(chǎn)中更高效的檢測利器。3D視覺技術(shù)通過非接觸性、高速性、數(shù)據(jù)完
    的頭像 發(fā)表于 06-20 17:46 ?1482次閱讀
    海伯森<b class='flag-5'>3D</b>閃測傳感器,工業(yè)<b class='flag-5'>檢測</b>領(lǐng)域的高精度利器

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?6次下載

    告別漫長等待! 3D測量竟然可以如此的絲滑

    據(jù)進(jìn)行實(shí)時(shí)處理,快速得到全視角的彩色高精度2D圖像和3D點(diǎn)。產(chǎn)品優(yōu)勢01高精度的在線3D檢測
    的頭像 發(fā)表于 05-12 18:01 ?684次閱讀
    告別漫長等待! <b class='flag-5'>3D</b>測量竟然可以如此的絲滑

    TPS65735 用于主動快門 3D 眼鏡的電源管理 IC數(shù)據(jù)手冊

    TPS65735 設(shè)備是用于活動的電源管理單元 (PMU) 快門 3D 眼鏡由集成電源路徑、線性充電器、LDO、升壓轉(zhuǎn)換器、 以及全 H 橋模擬開關(guān),用于一對主動快門中的左右快門作 3D
    的頭像 發(fā)表于 04-28 09:41 ?908次閱讀
    TPS65735 <b class='flag-5'>用于</b>主動快門 <b class='flag-5'>3D</b> 眼鏡的電源管理 IC數(shù)據(jù)手冊

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標(biāo)簽,具備重要的研究價(jià)值?,F(xiàn)有主流算法主要依賴于點(diǎn)
    的頭像 發(fā)表于 03-17 13:44 ?1241次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>