91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全面解讀CVPR2021-MMAct挑戰(zhàn)賽跨模態(tài)動(dòng)作識(shí)別雙冠方案

深蘭科技 ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-06-25 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

日前,計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域的三大頂級(jí)會(huì)議之一CVPR正在進(jìn)行中,深蘭DeepBlueAI團(tuán)隊(duì)在動(dòng)作識(shí)別國(guó)際挑戰(zhàn)賽 (ActivityNet) 研討會(huì)上,參加了 MMAct 挑戰(zhàn)賽中僅設(shè)的兩個(gè)賽道——“跨模態(tài)裁剪動(dòng)作識(shí)別”和“跨模態(tài)未裁剪動(dòng)作時(shí)序定位”,并均以大比分領(lǐng)先取得第一。

冠軍方案解讀

競(jìng)賽要求參賽者提出跨模態(tài)視頻動(dòng)作識(shí)別/定位方法,以彌補(bǔ)使用 MMAct[1] 數(shù)據(jù)集的純視覺方法的缺點(diǎn)。此任務(wù)的目標(biāo)是利用基于傳感器的,例如穿戴式傳感器數(shù)據(jù)作為特權(quán)信息,以及基于視覺的模態(tài),其方式可以克服訓(xùn)練(傳感器 + 視頻)和測(cè)試(僅視頻)階段之間模態(tài)差異所帶來的限制。用于此競(jìng)賽的多模態(tài)數(shù)據(jù)包括:加速度、方向、陀螺儀、RGB 視頻和人體關(guān)鍵點(diǎn)。

挑戰(zhàn)賽促進(jìn)了關(guān)于如何通過使用跨模態(tài)方法解決視覺挑戰(zhàn)的另一種觀點(diǎn),希望擴(kuò)大對(duì)視頻動(dòng)作理解的研究,以進(jìn)一步利用日常使用的智能設(shè)備(例如智能手機(jī))中的傳感器。

賽題一

跨模態(tài)裁剪動(dòng)作識(shí)別

Cross-Modal Trimmed Action Recognition

在此任務(wù)中,參與者使用來自MMAct 的修剪視頻以及配對(duì)的傳感器數(shù)據(jù),在數(shù)據(jù)中包含交叉視角和交叉場(chǎng)景兩種類型的數(shù)據(jù),共35個(gè)動(dòng)作類別。任務(wù)允許參與者使用修剪過的傳感器數(shù)據(jù)和修剪過的視頻進(jìn)行訓(xùn)練,但不能同時(shí)使用交叉視角和交叉場(chǎng)景的數(shù)據(jù),且僅對(duì)修剪過的視頻進(jìn)行測(cè)試以進(jìn)行動(dòng)作識(shí)別,并采用mAP作為評(píng)價(jià)指標(biāo)。

賽題難點(diǎn):

不同視頻等多模態(tài)數(shù)據(jù)時(shí)序長(zhǎng)度變化大,從幾秒到幾分鐘不等;

測(cè)試階段只提供了視頻數(shù)據(jù)。

應(yīng)用場(chǎng)景:

視頻監(jiān)控、異常行為識(shí)別

解決方案:

考慮到視頻長(zhǎng)度較長(zhǎng),為了有效地捕獲視頻中的動(dòng)作信息,團(tuán)隊(duì)優(yōu)先采用了等間隔采樣的方式對(duì)每個(gè)視頻進(jìn)行采樣,然后采用隨機(jī)尺度裁剪、水平翻轉(zhuǎn)等數(shù)據(jù)增強(qiáng)方式進(jìn)行增強(qiáng)。

算法選型上,團(tuán)隊(duì)優(yōu)先采用了TSM[2]進(jìn)行實(shí)驗(yàn),它具有高效率和高性能。具體來說,它可以達(dá)到 3D CNN 的性能,但保持 2D CNN 的復(fù)雜性。TSM 沿時(shí)間維度移動(dòng)部分通道,從而促進(jìn)相鄰幀之間的信息交換,它還可以插入到 2D CNN 中以實(shí)現(xiàn)零計(jì)算和零參數(shù)的時(shí)間建模。

作為對(duì)比,團(tuán)隊(duì)同時(shí)采用了滑動(dòng)窗口的形式進(jìn)行幀數(shù)據(jù)采樣,并采用ir-CSN[3]進(jìn)行實(shí)驗(yàn)。CSN探索了通道之間交互的重要性,并達(dá)到了節(jié)省計(jì)算參數(shù)和通道之間交互的平衡,網(wǎng)絡(luò)具有結(jié)構(gòu)精簡(jiǎn)、計(jì)算量小、速度快、準(zhǔn)確率好的優(yōu)點(diǎn),并且還有一定的正則化能力。

最后,在進(jìn)行了為每個(gè)視頻采樣不同的幀數(shù),是否添加Non-Local模塊,以及MixUp與ColorJitter數(shù)據(jù)增強(qiáng)的實(shí)驗(yàn)之后,團(tuán)隊(duì)采用TSM,以ResNet50作為Backbone, 并以等間隔采樣的方式采樣32幀,最終取得了最好的單模成績(jī)。在融合ir-CSN結(jié)果后,取得了最好的線上成績(jī)。

賽題二

跨模態(tài)未裁剪動(dòng)作時(shí)序定位

Cross-Modal Untrimmed Action Temporal Localization,在這項(xiàng)任務(wù)中,參與者使用來自MMAct 的未修剪視頻以及配對(duì)的傳感器數(shù)據(jù),在數(shù)據(jù)中包含交叉視角和交叉場(chǎng)景兩種類型的數(shù)據(jù),共35個(gè)動(dòng)作類別。參與者允許使用未修剪的配對(duì)傳感器數(shù)據(jù)和視頻進(jìn)行訓(xùn)練,然后在僅包含未修剪的視頻數(shù)據(jù)的測(cè)試集上進(jìn)行時(shí)間動(dòng)作定位,輸出未修剪視頻中識(shí)別的動(dòng)作類別及其開始和結(jié)束時(shí)間,并采用AP作為評(píng)價(jià)指標(biāo)。

賽題難點(diǎn):

視頻時(shí)長(zhǎng)較長(zhǎng),從幾分鐘到十幾分鐘不等;

測(cè)試階段只提供了視頻數(shù)據(jù)。

應(yīng)用場(chǎng)景:

視頻監(jiān)控、異常行為識(shí)別、定位

解決方案:

考慮到在測(cè)試集中只提供了視頻數(shù)據(jù),因此團(tuán)隊(duì)的實(shí)現(xiàn)方案主要在視頻數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)。在時(shí)序動(dòng)作定位相關(guān)的工作中,主流的方法如BSN[5]、BMN[6]等。需要經(jīng)過:視頻抽幀-》提取光流-》行為識(shí)別算法進(jìn)行特征提取-》時(shí)序動(dòng)作定位算法進(jìn)行動(dòng)作定位-》行為識(shí)別算法進(jìn)行動(dòng)作識(shí)別等多個(gè)環(huán)節(jié),整個(gè)方案實(shí)現(xiàn)流程十分繁雜。

在實(shí)現(xiàn)方案中為了簡(jiǎn)化方案流程,采用AFSD[7]作為算法實(shí)現(xiàn)。這是一個(gè)anchor-free的時(shí)序定位框架,并且是一個(gè)end-to-end使用視頻幀作為輸入而不是特征作為輸入的算法。

為了獲得模型的輸入,團(tuán)隊(duì)對(duì)每個(gè)視頻以動(dòng)態(tài)幀率采樣2304幀,并進(jìn)行光流計(jì)算,這樣可以保證10分鐘以上的視頻有大約3幀的采樣幀率,不至于丟失過多的視頻信息。最后再分別采用RGB數(shù)據(jù)和光流數(shù)據(jù)進(jìn)行訓(xùn)練,并融合兩種類型的預(yù)測(cè)結(jié)果后,取得了團(tuán)隊(duì)最好成績(jī)。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    831

    瀏覽量

    61914
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47622
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26184
  • 深蘭科技
    +關(guān)注

    關(guān)注

    1

    文章

    106

    瀏覽量

    6568

原文標(biāo)題:賽道 | CVPR2021-MMAct挑戰(zhàn)賽跨模態(tài)動(dòng)作識(shí)別雙冠方案解讀

文章出處:【微信號(hào):kmdian,微信公眾號(hào):深蘭科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍

    近日,國(guó)際語音與語言處理領(lǐng)域頂級(jí)賽事Interspeech 2026音頻推理挑戰(zhàn)賽結(jié)果正式揭曉。在這場(chǎng)首次將評(píng)估焦點(diǎn)從“答案正確性”轉(zhuǎn)向“推理過程質(zhì)量”的變革性賽事中,思必馳-上海交通大學(xué)聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)?wèi){借創(chuàng)新的多智能體協(xié)同方案,在全球眾多頂尖科研團(tuán)隊(duì)的角逐中脫穎而出,斬
    的頭像 發(fā)表于 02-28 14:13 ?420次閱讀

    AICAS 2026 Grand Challenge全球挑戰(zhàn)賽啟動(dòng)

    第四屆AICAS Grand Challenge——AICAS 2026全球技術(shù)挑戰(zhàn)賽現(xiàn)已正式啟動(dòng),誠(chéng)邀各界英才和技術(shù)先鋒共同參與,以“芯”智能驅(qū)動(dòng)未來!
    的頭像 發(fā)表于 02-04 14:59 ?483次閱讀

    “芯”年來襲 | 瑞薩邊緣AI線上技術(shù)月暨挑戰(zhàn)賽

    自1月7日起,瑞薩邊緣AI技術(shù)月活動(dòng)將每周開啟一場(chǎng)在線技術(shù)交流,涵蓋MCU/MPU產(chǎn)品、應(yīng)用案例及開發(fā)實(shí)踐,并同步開啟瑞薩AI評(píng)測(cè)挑戰(zhàn)賽,借助教程資源及每周在線講解和答疑,幫助嵌入式開發(fā)者從入門學(xué)習(xí)到上手第一個(gè)AI項(xiàng)目。
    的頭像 發(fā)表于 12-25 10:21 ?2231次閱讀
    “芯”年來襲 | 瑞薩邊緣AI線上技術(shù)月暨<b class='flag-5'>挑戰(zhàn)賽</b>

    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰(zhàn)賽銀獎(jiǎng)

    Challenge(3DGS 重建挑戰(zhàn)賽)中憑借自研技術(shù)LiteGS出色的算法實(shí)力和軟硬件協(xié)同優(yōu)化能力,斬獲銀獎(jiǎng),再次證明摩爾線程在新一代圖形渲染技術(shù)上的深度積累與全球?qū)W術(shù)界的高度認(rèn)可。
    的頭像 發(fā)表于 12-22 18:01 ?1798次閱讀
    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建<b class='flag-5'>挑戰(zhàn)賽</b>銀獎(jiǎng)

    第三屆ICPC與華為挑戰(zhàn)賽冠軍杯圓滿結(jié)束

    近日,第三屆ICPC&華為挑戰(zhàn)賽冠軍杯在上海練秋湖研發(fā)中心閉幕,來自佐治亞理工學(xué)院的中國(guó)選手褚寫庭獲得冠軍。這項(xiàng)賽事由ICPC(國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽)基金會(huì)和華為聯(lián)合舉辦,匯聚全球頂尖
    的頭像 發(fā)表于 11-19 16:15 ?949次閱讀

    傳音TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)分割挑戰(zhàn)賽雙料亞軍

    近日,國(guó)際計(jì)算機(jī)視覺大會(huì)(ICCV 2025)舉辦了第七屆大型視頻目標(biāo)分割挑戰(zhàn)賽(LSVOS Challenge),傳音TEX AI團(tuán)隊(duì)?wèi){借自主研發(fā)的創(chuàng)新技術(shù)方案,在復(fù)雜視頻目標(biāo)分割和語言指引視頻
    的頭像 發(fā)表于 10-31 09:42 ?549次閱讀
    傳音TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)分割<b class='flag-5'>挑戰(zhàn)賽</b>雙料亞軍

    2025 EDA精英挑戰(zhàn)賽華大九天題發(fā)布

    中國(guó)研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡(jiǎn)稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國(guó)學(xué)位與研究生教育學(xué)會(huì)、中國(guó)科協(xié)青少年科技中心主辦的“ 中國(guó)研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-26 15:00 ?1637次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>華大九天<b class='flag-5'>賽</b>題發(fā)布

    2025 EDA精英挑戰(zhàn)賽紫光同創(chuàng)題發(fā)布

    中國(guó)研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡(jiǎn)稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國(guó)學(xué)位與研究生教育學(xué)會(huì)、中國(guó)科協(xié)青少年科技中心主辦的“ 中國(guó)研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-25 09:40 ?1649次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>紫光同創(chuàng)<b class='flag-5'>賽</b>題發(fā)布

    e絡(luò)盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設(shè)計(jì)挑戰(zhàn)賽

    安富利旗下e絡(luò)盟社區(qū)與 Würth Elektronik 合作推出全球設(shè)計(jì)挑戰(zhàn)賽。這項(xiàng)全新競(jìng)賽誠(chéng)邀工程師、創(chuàng)客和愛好者們使用 Würth Elektronik 先進(jìn)的 SMD LED(集成了 WL-ICLED 控制器)開發(fā)原型或測(cè)試裝置。
    的頭像 發(fā)表于 07-23 10:15 ?910次閱讀
    e絡(luò)盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設(shè)計(jì)<b class='flag-5'>挑戰(zhàn)賽</b>

    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍,推動(dòng)視頻畫質(zhì)升級(jí)

    近日,在計(jì)算機(jī)視覺領(lǐng)域最具影響力的國(guó)際競(jìng)賽CVPRNTIRE2025中,傳音多媒體團(tuán)隊(duì)與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊(duì)分別斬獲高效超分辨率挑戰(zhàn)賽
    的頭像 發(fā)表于 06-24 17:03 ?907次閱讀
    傳音多媒體團(tuán)隊(duì)攬獲<b class='flag-5'>CVPR</b> NTIRE 2025兩項(xiàng)<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動(dòng)視頻畫質(zhì)升級(jí)

    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍

    近日,在計(jì)算機(jī)視覺領(lǐng)域最具影響力的國(guó)際競(jìng)賽 CVPR NTIRE 2025中,傳音多媒體團(tuán)隊(duì)與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊(duì)分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?1625次閱讀
    傳音多媒體團(tuán)隊(duì)攬獲<b class='flag-5'>CVPR</b> NTIRE 2025兩項(xiàng)<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    ASML杯光刻「芯 」勢(shì)力知識(shí)挑戰(zhàn)賽正式啟動(dòng)

    ASML光刻「芯」勢(shì)力知識(shí)挑戰(zhàn)賽由全球半導(dǎo)體行業(yè)領(lǐng)先供應(yīng)商ASML發(fā)起,是一項(xiàng)面向中國(guó)半導(dǎo)體人才與科技愛好者的科普賽事。依托ASML在光刻領(lǐng)域的技術(shù)積累與行業(yè)洞察,賽事致力于為參賽者打造一個(gè)深度探索光刻技術(shù)的知識(shí)競(jìng)技窗口,同時(shí)培養(yǎng)優(yōu)秀科技「芯」勢(shì)力,共同推動(dòng)摩爾定律演進(jìn)。
    的頭像 發(fā)表于 06-23 17:04 ?1255次閱讀
    ASML杯光刻「芯 」勢(shì)力知識(shí)<b class='flag-5'>挑戰(zhàn)賽</b>正式啟動(dòng)

    NVIDIA榮獲CVPR 2025輔助駕駛國(guó)際挑戰(zhàn)賽冠軍

    NVIDIA 在本周美國(guó)田納西州舉辦的國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(CVPR)上榮獲“端到端輔助駕駛”賽道冠軍。這一消息是在“自主系統(tǒng)具身智能研討會(huì)”上宣布的。
    的頭像 發(fā)表于 06-16 14:44 ?924次閱讀

    解讀2025五岳杯量子計(jì)算挑戰(zhàn)賽銀獎(jiǎng)成果之一

    在由玻色量子協(xié)辦的第二屆APMCM“五岳杯”量子計(jì)算挑戰(zhàn)賽上,來自北京理工大學(xué)(BIT)的兩支參賽隊(duì)伍榮獲銀獎(jiǎng),其中一支隊(duì)伍就是QuBIT團(tuán)隊(duì)。該團(tuán)隊(duì)由北京理工大學(xué)管理學(xué)院張玉利教授指導(dǎo),依托玻色
    的頭像 發(fā)表于 04-28 13:55 ?1076次閱讀
    <b class='flag-5'>解讀</b>2025五岳杯量子計(jì)算<b class='flag-5'>挑戰(zhàn)賽</b>銀獎(jiǎng)成果之一

    e絡(luò)盟社區(qū)聯(lián)合 TDK 發(fā)起超聲波傳感器挑戰(zhàn)賽

    安富利旗下社區(qū) e絡(luò)盟攜手 TDK 發(fā)起新的設(shè)計(jì)挑戰(zhàn)賽,誠(chéng)邀工程師、創(chuàng)客及技術(shù)愛好者利用 TDK 防水超聲波測(cè)距傳感器開發(fā)創(chuàng)新項(xiàng)目,供實(shí)際應(yīng)用使用。
    的頭像 發(fā)表于 03-11 10:09 ?1025次閱讀
    e絡(luò)盟社區(qū)聯(lián)合 TDK 發(fā)起超聲波傳感器<b class='flag-5'>挑戰(zhàn)賽</b>