91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

COCO單模型測試取得新紀錄:60.6 AP

新機器視覺 ? 來源:新智元 ? 作者:袁路 ? 2021-06-23 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著注意力機制在自然語言處理和計算機視覺等多個人工智能領域風靡,計算機視覺領域刷榜之爭可謂是進入白熱化階段。

近期大量工作刷新現(xiàn)有各項任務SOTA:前腳谷歌剛在圖像識別ImageNet上準確度超過90,緊接著微軟又在目標檢測COCO上AP超過60。

在一篇CVPR 2021 論文中,來自微軟的研究者提出多重注意力機制統(tǒng)一目標檢測頭方法Dynamic Head, 可插拔特性提高多種目標檢測框架的性能。

在Transformer骨干和額外數(shù)據(jù)加持下,COCO單模型測試取得新紀錄:60.6 AP。

方法概述

本文首先對現(xiàn)有目標檢測頭的改進工作進行了總結(jié),發(fā)現(xiàn)近期方法主要通過三個不同的角度出發(fā)進行目標檢測性能的提升:

尺度感知:目標尺度的差異對應了不同尺度的特征,改進不同級的表達能力可以有效提升目標檢測器的尺度感知能力;

空間位置:不相似目標形狀的不同幾何變換對應了特征的不同空間位置,改進不同空間位置的表達能力可以有效提升目標檢測器的空間位置感知能力;

多任務:目標表達與任務的多樣性對應了不同通道特征,改進不同通道的表達能力可以有效提升目標檢測的任務感知能力。

本文提出一種新穎的動態(tài)頭框架,它采用多注意力機制將不同的目標檢測頭進行統(tǒng)一。

通過特征層次之間的注意力機制用于尺度感知,空間位置之間的注意力機制用于空間感知,輸出通道內(nèi)的注意力機制用于任務感知,該方法可以在不增加計算量的情況顯著提升模型目標檢測頭的表達能力。

為了達成以上目的,本文對特征金字塔進行重構(gòu),將不同層級的特征統(tǒng)一到一個3D張量,并發(fā)現(xiàn)在不同維度引入注意力機制可以提高對尺度,空間位置和多任務的感知能力。

因此上述方向可以統(tǒng)一到一個高效注意力學習問題中。本文也是首個嘗試采用多注意力機制將三個維度組合構(gòu)建統(tǒng)一頭并最大化其性能的工作。

作者將注意力函數(shù)轉(zhuǎn)換為三個序列子注意力函數(shù)來解決傳統(tǒng)注意力函數(shù)在高維度導致計算量激增的問題。

每個注意力函數(shù)僅聚焦一個維度:基于SE模塊的尺度自注意函數(shù)π_L, 基于可變形卷積的空間自注意函數(shù)π_S 和 基于動態(tài)ReLU激活函數(shù)的多任務的自注意函數(shù)π_C。

作者將三種自注意函數(shù)進行堆疊,形成一個可輕易插拔的模塊DyHead,并將其應用于多種目標檢測框架中。

實驗結(jié)果

作者首先分析了的計算效率。當采用6個模塊時,模型性能提升達到最大,而計算量提升相比骨干網(wǎng)絡可以忽略。

作者將DyHead集成到不同檢測器進行性能對比,發(fā)現(xiàn)所提DyHead可以一致性提升所有主流目標檢測器性能:1.2~3.2AP,展示了優(yōu)異的可插拔擴展性能。

在與其他目標檢測方法的對比中,所提方案以較大的優(yōu)勢超越了流行方案。相比僅采用多尺度尋覽的方法,所提方案僅需2x訓練即可取得新的SOTA指標52.3AP。相對于谷歌提出的EfficientDet與SpineNet,所提方法訓練時間更少(僅1/20);

當同時采用多尺度訓練與測試時,所提方法取得了新的SOTA指標54.0AP,以1.3AP指標優(yōu)于此前最佳。

當引入更優(yōu)異的Transformer骨干網(wǎng)絡、以及通過類似于谷歌自我學習方法生成的額外偽框的ImageNet數(shù)據(jù)后,所提方案取得了COCO新的記錄:60.6 AP,成為首個超過60的單模型方法。

責任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:刷新記錄! CVPR2021全新目標檢測機制達到SOTA!

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    喜訊 | 凌科DL28系列連接器榮獲「第二十四屆(2025)深圳企業(yè)創(chuàng)新紀錄」殊榮

    凌科喜獲三項大獎近日,凌科電氣榮獲三項殊榮:第二十四屆(2025)深圳企業(yè)創(chuàng)新紀錄(DL28系列連接器);2025粵港澳大灣區(qū)企業(yè)創(chuàng)新力榜單(高成長創(chuàng)新榜);深圳工匠培育示范單位(復審)。本次三獎
    的頭像 發(fā)表于 02-05 18:00 ?534次閱讀
    喜訊 | 凌科DL28系列連接器榮獲「第二十四屆(2025)深圳企業(yè)創(chuàng)<b class='flag-5'>新紀錄</b>」殊榮

    阿里巴巴發(fā)布通義千問旗艦推理模型Qwen3-Max-Thinking

    今天,我們正式發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,創(chuàng)下數(shù)項權(quán)威評測全球新紀錄。
    的頭像 發(fā)表于 01-27 15:47 ?425次閱讀
    阿里巴巴發(fā)布通義千問旗艦推理<b class='flag-5'>模型</b>Qwen3-Max-Thinking

    單模光纖理論速率是多少

    單模光纖理論傳輸速率可達100Gbps,且未來可通過技術升級進一步提升。以下是對單模光纖理論速率的詳細解釋: 一、單模光纖的基本特性 傳輸模式:單模光纖僅允許單一光模式傳播,減少了信號
    的頭像 發(fā)表于 01-27 09:55 ?137次閱讀

    海外首發(fā)即告售罄,韶音OpenFit Pro創(chuàng)新紀錄!中國智造標桿再獲全球認可

    %,新客增長率突破100%,創(chuàng)下韶音在海外市場的銷售新紀錄。這一成績不僅反映出全球消費者對韶音產(chǎn)品的高度認可,也印證了韶音在全球市場上日益增長的影響力與號召力。
    的頭像 發(fā)表于 01-14 17:31 ?845次閱讀

    晶科能源創(chuàng)下n型TOPCon太陽能電池效率新紀錄

    來源:維度網(wǎng) 中國晶科能源公司宣布其n型TOPCon太陽能電池轉(zhuǎn)換效率達到27.79%,該成果已獲得德國哈默爾恩太陽能研究所獨立驗證。這一太陽能電池效率新紀錄較該公司今年6月公布的27.02%有所
    的頭像 發(fā)表于 12-22 17:24 ?715次閱讀

    深入剖析AP61200/AP61201/AP61202/AP61203同步降壓轉(zhuǎn)換器

    深入剖析AP61200/AP61201/AP61202/AP61203同步降壓轉(zhuǎn)換器 在電子設計領域,電源管理芯片的選擇至關重要,它直接影響著整個系統(tǒng)的性能和穩(wěn)定性。今天,我們就來深入
    的頭像 發(fā)表于 12-17 18:20 ?3497次閱讀

    晶科能源第31次打破電池效率和組件功率世界紀錄

    效率和組件功率世界紀錄。 本次刷新紀錄得益于晶科能源在TOPCon基礎核心技術上的一系列前瞻性布局與深耕。該技術采用新型鈍化接觸技術,通過復合鈍化材料和工藝開發(fā)及優(yōu)化,實現(xiàn)了對電池表面的全面高效鈍化,有效抑制載流子復合損失。并使用超低光學寄生
    的頭像 發(fā)表于 11-24 15:00 ?574次閱讀

    速騰聚創(chuàng)月交付激光雷達破12萬臺,創(chuàng)造行業(yè)新紀錄

    速騰聚創(chuàng)近日宣布,公司在2025年10月實現(xiàn)了激光雷達單月交付量突破12萬臺的里程碑,創(chuàng)下全球激光雷達行業(yè)的新紀錄。這一突破性成績標志著智能駕駛核心零部件正式邁入大規(guī)模商業(yè)化應用的新階段。尤為
    的頭像 發(fā)表于 11-11 18:43 ?1809次閱讀

    四芯單模光纜和六芯單模光纜有什么不同呢

    四芯單模光纜與六芯單模光纜的核心差異體現(xiàn)在光纖芯數(shù)、傳輸容量、應用場景、成本效益及擴展性五個方面,具體分析如下: 一、光纖芯數(shù):物理結(jié)構(gòu)的直接差異 四芯單模光纜內(nèi)置4根單模光纖,每根光
    的頭像 發(fā)表于 11-11 10:28 ?767次閱讀

    如何在vivadoHLS中使用.TLite模型

    (ap_uint<8> input[INPUT_HEIGHT][INPUT_WIDTH][INPUT_CHANNELS], ...){ // 定義模型輸入和輸出變量 hls
    發(fā)表于 10-22 06:29

    Siumulink模型測試典型問題分享——模型層級設計不合理

    典型測試問題分享-模型層級設計不合理 問題描述: ?重點功能與非重點功能混合,導致測試層級選擇困難。 ?模型未體現(xiàn)層級劃分,結(jié)構(gòu)平鋪導致層級圈復雜度異常。 ?部分計算/判斷/賦值等結(jié)構(gòu)
    的頭像 發(fā)表于 09-20 12:31 ?2979次閱讀
    Siumulink<b class='flag-5'>模型</b><b class='flag-5'>測試</b>典型問題分享——<b class='flag-5'>模型</b>層級設計不合理

    比亞迪仰望U9工程測試車打破全球電車極速紀錄

    近日,仰望汽車宣布,仰望U9工程測試車在德國ATP測試場實現(xiàn)472.41km/h的最高時速成績,打破全球電車極速紀錄,此舉是中國自主品牌首次在該領域問鼎世界。
    的頭像 發(fā)表于 08-27 10:32 ?1069次閱讀

    模型捉蟲行家MV:致力全流程模型動態(tài)測試

    隨著基于模型設計(MBD)開發(fā)量的增長,其對應的測試需求也顯著提升。此前,在《您的模型診斷專家MI:助力把好模型質(zhì)量關》一文中詳述了模型靜態(tài)
    的頭像 發(fā)表于 07-09 16:37 ?885次閱讀
    <b class='flag-5'>模型</b>捉蟲行家MV:致力全流程<b class='flag-5'>模型</b>動態(tài)<b class='flag-5'>測試</b>

    多模光纖可以接單模

    多模光纖不能直接連接單模光纖,強行連接會導致信號無法正常傳輸,甚至可能損壞設備。以下是具體原因及解決方案: 一、多模與單模光纖的核心差異 二、直接連接的風險 光信號無法耦合 多模光纖的芯徑遠大于單模
    的頭像 發(fā)表于 04-09 10:19 ?4480次閱讀
    多模光纖可以接<b class='flag-5'>單模</b>嗎

    愛立信攜手Telstra、高通刷新5G上行鏈路速度紀錄

    愛立信、Telstra、高通近日攜手創(chuàng)下5G上行鏈路516 Mbps速度新紀錄,成為目前在商用Sub-6GHz 5G SA現(xiàn)網(wǎng)實現(xiàn)的最高上行鏈路速度。
    的頭像 發(fā)表于 03-26 16:31 ?1.3w次閱讀