91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何學習基于Tansformer的目標檢測算法呢?

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-08-07 16:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說到純視覺的自動駕駛方案,大家第一個想到的就是Tesla吧。的確,早在2021年,Tesla就已經(jīng)實現(xiàn)了純視覺的BEV檢測方案,而且效果非常好。

240e9aa2-32e1-11ee-9e74-dac502259ad0.png

細心的同學可能發(fā)現(xiàn)了,這套BEV方案中將相機空間的圖像轉(zhuǎn)換到BEV空間的核心組件就是Transformer。

Transformer來源于自然語言處理領(lǐng)域,首先被應(yīng)用于機器翻譯。后來,大家發(fā)現(xiàn)它在計算機視覺領(lǐng)域效果也很不錯,而且在各大排行榜上碾壓CNN網(wǎng)絡(luò)。

2435d4a0-32e1-11ee-9e74-dac502259ad0.png

目標檢測領(lǐng)域中,視覺Transformer不僅可以實現(xiàn)2D檢測、3D檢測,還可以實現(xiàn)多模態(tài)檢測,BEV視角下的檢測,性能也非常出色。

245b52ac-32e1-11ee-9e74-dac502259ad0.png

因此,掌握Transformer相關(guān)知識和工程基礎(chǔ)成為了企業(yè)招聘算法工程師的一個技能要求點,也是簡歷上的一個很大的加分項。

然而,想要掌握基于Transformer的目標檢測算法,有以下3個難點

理解Transformer背后的理論基礎(chǔ),比如自注意力機制(self-attention), 位置編碼(positional embedding),目標查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學做到深入理解并融會貫通。

2475f544-32e1-11ee-9e74-dac502259ad0.png

掌握基于Transformer的目標檢測算法的思路和創(chuàng)新點,一些Transformer論文涉及的新概念比較多,話術(shù)沒有那么通俗易懂,讀完論文仍然不理解算法的細節(jié)部分。

24a3cd02-32e1-11ee-9e74-dac502259ad0.png2

Transformer代碼不易看懂,因為作用機制與CNN有不少差別,所以完全理解代碼并實踐應(yīng)用需要花費很大功夫。

24c35ec4-32e1-11ee-9e74-dac502259ad0.png3

那么如何學習基于Tansformer的目標檢測算法呢?

實踐部分

24d6a84e-32e1-11ee-9e74-dac502259ad0.png24fc84a6-32e1-11ee-9e74-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47637
  • 自動駕駛
    +關(guān)注

    關(guān)注

    793

    文章

    14887

    瀏覽量

    179985
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    156

    瀏覽量

    6938

原文標題:Transformer在自動駕駛中的應(yīng)用前景怎么樣?

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    瑞芯微(EASY EAI)RV1126B 安全帽檢測

    是一種基于深度學習的對人進行檢測定位的目標檢測,能有效用于產(chǎn)品落地。本安全帽檢測算法在數(shù)據(jù)集表現(xiàn)如下所示基于EASY-EAI-Nano-TB
    的頭像 發(fā)表于 01-15 09:57 ?6712次閱讀
    瑞芯微(EASY EAI)RV1126B 安全帽<b class='flag-5'>檢測</b>

    Melexis推出針對FIR陣列的免費版人員檢測算法

    全球微電子工程公司Melexis宣布,重磅推出專為MLX90642(FIR) 32×24熱傳感器陣列設(shè)計的新型人員檢測算法,可實現(xiàn)人員檢測、精確計數(shù)以及位置定位。與傳統(tǒng)攝像頭相比,該解決方案在保護
    的頭像 發(fā)表于 12-15 17:30 ?508次閱讀

    有哪些常見的AI算法可以用于裝置數(shù)據(jù)的異常檢測?

    在裝置數(shù)據(jù)(如工業(yè)設(shè)備傳感器數(shù)據(jù)、電子裝置運行參數(shù)、化工裝置工況數(shù)據(jù)等)的異常檢測中,AI 算法的選擇需結(jié)合數(shù)據(jù)特點(如 時序性、維度、標注情況 )、檢測目標(如實時性、精度、可解釋性
    的頭像 發(fā)表于 09-18 09:27 ?785次閱讀
    有哪些常見的AI<b class='flag-5'>算法</b>可以用于裝置數(shù)據(jù)的異常<b class='flag-5'>檢測</b>?

    基于FPGA的SSD目標檢測算法設(shè)計

    隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)正被逐步應(yīng)用于智能安防、自動駕駛、醫(yī)療等各行各業(yè)。目標識別作為人工智能的一項重要應(yīng)用也擁有著巨大的前景,隨著深度學習的普及和框架的成熟,卷積神經(jīng)網(wǎng)絡(luò)模型的識別精度越來越高
    的頭像 發(fā)表于 07-10 11:12 ?2572次閱讀
    基于FPGA的SSD<b class='flag-5'>目標</b><b class='flag-5'>檢測算法</b>設(shè)計

    【嘉楠堪智K230開發(fā)板試用體驗】K230機器視覺相關(guān)功能體驗

    畫圖 機器學習模型在通過攝像頭獲取圖像后,經(jīng)過處理輸入后,在輸出環(huán)節(jié)通常還需要進行后處理,例如圖像檢測應(yīng)用中,目標位置的框選等。 在K230中提供了畫圖的功能,可以實現(xiàn)畫線段、畫矩形、畫圓、畫箭頭
    發(fā)表于 07-08 17:25

    基于RK3576開發(fā)板的車輛檢測算法

    車輛檢測是一種基于深度學習的對人進行檢測定位的目標檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種
    的頭像 發(fā)表于 05-08 17:34 ?1485次閱讀
    基于RK3576開發(fā)板的車輛<b class='flag-5'>檢測算法</b>

    基于RK3576開發(fā)板的安全帽檢測算法

    安全帽佩戴檢測是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發(fā)表于 05-08 16:59 ?2021次閱讀
    基于RK3576開發(fā)板的安全帽<b class='flag-5'>檢測算法</b>

    基于RK3576開發(fā)板的人員檢測算法

    展示了RK3576開發(fā)板的人員檢測算法例程及API說明
    的頭像 發(fā)表于 05-07 17:33 ?886次閱讀
    基于RK3576開發(fā)板的人員<b class='flag-5'>檢測算法</b>

    基于RV1126開發(fā)板的車輛檢測算法開發(fā)

    車輛檢測是一種基于深度學習的對人進行檢測定位的目標檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種
    的頭像 發(fā)表于 04-14 16:00 ?866次閱讀
    基于RV1126開發(fā)板的車輛<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的吸煙檢測算法開發(fā)

    吸煙檢測是一種基于深度學習的對抽煙人群進行檢測定位的目標檢測,能廣泛的用于安防、生產(chǎn)安全、園區(qū)管理等多種場景。配合攝像頭,實時識別監(jiān)控區(qū)內(nèi)人
    的頭像 發(fā)表于 04-14 15:37 ?732次閱讀
    基于RV1126開發(fā)板的吸煙<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的安全帽檢測算法開發(fā)

    安全帽佩戴檢測是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發(fā)表于 04-14 15:10 ?852次閱讀
    基于RV1126開發(fā)板的安全帽<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的火焰檢測算法開發(fā)

    火焰檢測是一種基于深度學習的對火焰進行檢測定位的目標檢測。基于大規(guī)?;鹧鏀?shù)據(jù)識別訓練,配合攝像頭,實時識別監(jiān)控區(qū)內(nèi)明火情況立刻發(fā)出警報,提醒
    的頭像 發(fā)表于 04-14 14:53 ?776次閱讀
    基于RV1126開發(fā)板的火焰<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的人臉檢測算法開發(fā)

    在RV1126上開發(fā)人臉檢測算法組件
    的頭像 發(fā)表于 04-14 10:19 ?961次閱讀
    基于RV1126開發(fā)板的人臉<b class='flag-5'>檢測算法</b>開發(fā)

    軒轅智駕紅外目標檢測算法在汽車領(lǐng)域的應(yīng)用

    在 AI 技術(shù)蓬勃發(fā)展的當下,目標檢測算法取得了重大突破,其中紅外目標檢測算法更是在汽車行業(yè)掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗與產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 03-27 15:55 ?965次閱讀

    睿創(chuàng)微納推出新一代目標檢測算法

    隨著AI技術(shù)的發(fā)展,目標檢測算法也迎來重大突破。睿創(chuàng)微納作為熱成像領(lǐng)軍者,憑借深厚的技術(shù)積累與創(chuàng)新能力,結(jié)合AI技術(shù)推出新一代目標檢測算法,以三大核心技術(shù)帶來AI視覺感知全場景解決方案
    的頭像 發(fā)表于 03-20 13:49 ?1151次閱讀