91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深蘭科技DeepBlueAI團(tuán)隊(duì)斬獲低分辨率視頻行為識(shí)別挑戰(zhàn)賽的冠軍

深蘭科技 ? 來(lái)源:DeepBlue深蘭科技 ? 作者:DeepBlue深蘭科技 ? 2021-06-30 10:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀近日,全球三大計(jì)算機(jī)視覺(jué)頂級(jí)會(huì)議之一CVPR如期舉行,深蘭科技DeepBlueAI團(tuán)隊(duì)斬獲TinyAction Challenge(低分辨率視頻行為識(shí)別挑戰(zhàn)賽)的冠軍。

TinyAction Challenge是第六屆動(dòng)作識(shí)別國(guó)際挑戰(zhàn)賽系列競(jìng)賽之一,該系列競(jìng)賽由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主辦,旨在推動(dòng)視頻理解的進(jìn)一步發(fā)展。

冠軍方案解讀

賽題介紹

TinyAction Challenge使用TinyVirat-v2[1]數(shù)據(jù)集,旨在提高低分辨率高噪聲等真實(shí)監(jiān)控場(chǎng)景下的視頻行為識(shí)別能力。比賽提供大量真實(shí)場(chǎng)景視頻片段及標(biāo)注,每個(gè)視頻片段中可能含有多個(gè)動(dòng)作,本質(zhì)是一個(gè)多標(biāo)簽的行為識(shí)別任務(wù),比賽結(jié)果采用precision、recall、F1-score等多個(gè)指標(biāo)來(lái)評(píng)測(cè)。

賽題難點(diǎn)

視頻分辨率很低,最小只有10x10像素尺度;

視頻尺度多樣,從10x10到128x128不等;

視頻質(zhì)量較差,含有大量噪聲;

視頻場(chǎng)景多樣,行為多樣,每個(gè)視頻可能含有多個(gè)行為。

解決方案

算法選擇上,團(tuán)隊(duì)廣泛嘗試了TSM[2]、TPN-Slowonly[3]等經(jīng)典算法,最終采用交互移除的CSN[4](ir-CSN)模型,在保證性能的前提下適當(dāng)減少計(jì)算量,同時(shí)減輕對(duì)數(shù)據(jù)的過(guò)擬合。

數(shù)據(jù)增強(qiáng)方面,訓(xùn)練時(shí)團(tuán)隊(duì)首先隨機(jī)調(diào)整尺度裁剪,再統(tǒng)一調(diào)整尺度到128x128,最后再隨機(jī)翻轉(zhuǎn)。而在測(cè)試時(shí),通過(guò)Tencrop,即對(duì)視頻幀及其水平翻轉(zhuǎn)在中心與四角區(qū)域分別裁剪求平均,有效提高了inference時(shí)單模型性能。

測(cè)試階段團(tuán)隊(duì)進(jìn)一步使用了五折交叉驗(yàn)證的模型融合方法。另外由于觀察到在比賽數(shù)據(jù)集的26類行為中有些類別是互斥的,因而對(duì)最終的結(jié)果添加了后處理規(guī)則,使得F1指標(biāo)進(jìn)一步提高0.6個(gè)點(diǎn)。通過(guò)一步步優(yōu)化,DeepBlueAI團(tuán)隊(duì)單模型的F1指標(biāo)即超過(guò)了第二名達(dá)到0.4447,并最終達(dá)到0.4782,實(shí)現(xiàn)大幅度領(lǐng)先。

總結(jié)

在本次比賽中,團(tuán)隊(duì)對(duì)任務(wù)及數(shù)據(jù)做了仔細(xì)的分析,合理地選擇了模型算法,進(jìn)行了精細(xì)的模型訓(xùn)練,同時(shí)在數(shù)據(jù)的后處理上做了大量的優(yōu)化,有效實(shí)現(xiàn)了低分辨率高噪聲視頻中行為識(shí)別,并最終獲得冠軍。相信隨著計(jì)算機(jī)視覺(jué)及多模態(tài)技術(shù)的深入發(fā)展,行為識(shí)別等視頻理解問(wèn)題能夠得到更好的解決,并獲得越來(lái)越廣泛的實(shí)際應(yīng)用。

參考文獻(xiàn):

[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394

[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.

[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.

[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47639
  • 高噪聲率
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    6086
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26205
  • CSN
    CSN
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    9008
  • 深蘭科技
    +關(guān)注

    關(guān)注

    1

    文章

    106

    瀏覽量

    6588

原文標(biāo)題:賽道 | CVPR2021深蘭冠軍方案解讀- TinyAction Challenge低分辨率視頻行為識(shí)別挑戰(zhàn)賽

文章出處:【微信號(hào):kmdian,微信公眾號(hào):深蘭科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍

    近日,國(guó)際語(yǔ)音與語(yǔ)言處理領(lǐng)域頂級(jí)賽事Interspeech 2026音頻推理挑戰(zhàn)賽結(jié)果正式揭曉。在這場(chǎng)首次將評(píng)估焦點(diǎn)從“答案正確性”轉(zhuǎn)向“推理過(guò)程質(zhì)量”的變革性賽事中,思必馳-上海交通大學(xué)聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)憑借創(chuàng)新的多智能體協(xié)同方案,在全球眾多頂尖科研
    的頭像 發(fā)表于 02-28 14:13 ?566次閱讀

    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰(zhàn)賽銀獎(jiǎng)

    Challenge(3DGS 重建挑戰(zhàn)賽)中憑借自研技術(shù)LiteGS出色的算法實(shí)力和軟硬件協(xié)同優(yōu)化能力,斬獲銀獎(jiǎng),再次證明摩爾線程在新一代圖形渲染技術(shù)上的深度積累與全球?qū)W術(shù)界的高度認(rèn)可。
    的頭像 發(fā)表于 12-22 18:01 ?1809次閱讀
    摩爾線程在SIGGRAPH Asia 2025<b class='flag-5'>斬獲</b>3DGS重建<b class='flag-5'>挑戰(zhàn)賽</b>銀獎(jiǎng)

    第三屆ICPC與華為挑戰(zhàn)賽冠軍杯圓滿結(jié)束

    近日,第三屆ICPC&華為挑戰(zhàn)賽冠軍杯在上海練秋湖研發(fā)中心閉幕,來(lái)自佐治亞理工學(xué)院的中國(guó)選手褚寫(xiě)庭獲得冠軍。這項(xiàng)賽事由ICPC(國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽)基金會(huì)和華為聯(lián)合舉辦,匯聚全球頂尖
    的頭像 發(fā)表于 11-19 16:15 ?971次閱讀

    電能質(zhì)量在線監(jiān)測(cè)裝置的暫態(tài)記錄分辨率如何影響故障類型識(shí)別

    、相位差),低分辨率則會(huì)讓特征模糊或丟失,直接導(dǎo)致故障類型誤判。具體影響可按核心分辨率指標(biāo)與故障識(shí)別邏輯拆解: 一、核心影響邏輯:分辨率決定 “故障特征的可
    的頭像 發(fā)表于 11-14 16:10 ?1894次閱讀
    電能質(zhì)量在線監(jiān)測(cè)裝置的暫態(tài)記錄<b class='flag-5'>分辨率</b>如何影響故障類型<b class='flag-5'>識(shí)別</b>?

    德州市政府領(lǐng)導(dǎo)蒞臨深蘭科技考察調(diào)研

    2025年11月5日,山東省德州市市委副書(shū)記、市長(zhǎng)朱開(kāi)國(guó)市政府考察團(tuán)一行蒞臨深蘭科技集團(tuán)上??偛靠疾煺{(diào)研。深蘭科技創(chuàng)始人、董事長(zhǎng)陳海波率團(tuán)隊(duì)熱情接待。雙方圍繞人工智能與機(jī)器人產(chǎn)業(yè)生態(tài)
    的頭像 發(fā)表于 11-07 17:04 ?1204次閱讀

    廊坊市政府領(lǐng)導(dǎo)蒞臨深蘭科技調(diào)研考察

    2025年11月4日,河北省廊坊市市長(zhǎng)劉媛市政府考察團(tuán)一行蒞臨深蘭科技集團(tuán)上海總部調(diào)研考察。深蘭科技集團(tuán)董事副總裁楊秀珂率團(tuán)隊(duì)熱情接待。雙方圍繞人工智能產(chǎn)業(yè)發(fā)展、技術(shù)應(yīng)用落地、機(jī)器人
    的頭像 發(fā)表于 11-05 17:57 ?1312次閱讀

    傳音TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)分割挑戰(zhàn)賽雙料亞軍

    近日,國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV 2025)舉辦了第七屆大型視頻目標(biāo)分割挑戰(zhàn)賽(LSVOS Challenge),傳音TEX AI團(tuán)隊(duì)憑借自主研發(fā)的創(chuàng)新技術(shù)方案,在復(fù)雜視頻目標(biāo)分割和
    的頭像 發(fā)表于 10-31 09:42 ?567次閱讀
    傳音TEX AI<b class='flag-5'>團(tuán)隊(duì)</b><b class='flag-5'>斬獲</b>ICCV 2025大型<b class='flag-5'>視頻</b>目標(biāo)分割<b class='flag-5'>挑戰(zhàn)賽</b>雙料亞軍

    山東大學(xué)與濟(jì)南市科技局領(lǐng)導(dǎo)蒞臨深蘭科技調(diào)研考察

    2025年10月27日,山東大學(xué)副校長(zhǎng)王美琴山東大學(xué)及濟(jì)南市科技局領(lǐng)導(dǎo)一行蒞臨深蘭科技集團(tuán)上海總部進(jìn)行調(diào)研考察,并與深蘭科技創(chuàng)始人兼董事長(zhǎng)陳海波及公司高層進(jìn)行了卓有成效的座談交流。
    的頭像 發(fā)表于 10-30 15:19 ?682次閱讀

    深蘭科技發(fā)布AI法務(wù)大模型產(chǎn)品

    近日,深蘭科技發(fā)布面向律所與企業(yè)法務(wù)部門(mén)的AI法務(wù)大模型產(chǎn)品——“深蘭律師辦公自動(dòng)化系統(tǒng)(AI版)”。通過(guò)AI技術(shù)賦能法律服務(wù)行業(yè),它能夠顯著提升法律文書(shū)處理效率與事務(wù)性工作自動(dòng)化水平,為律所和法務(wù)團(tuán)隊(duì)帶來(lái)全新的工作體驗(yàn)。
    的頭像 發(fā)表于 10-23 17:58 ?1094次閱讀

    分辨率對(duì)于模擬到數(shù)字轉(zhuǎn)換器有什么重要性

    96dB以上,而低分辨率ADC(如8位)僅約48dB。這意味著高分辨率ADC能同時(shí)處理強(qiáng)信號(hào)和弱信號(hào),避免弱信號(hào)被量化噪聲淹沒(méi)。信噪比(SNR)提升:分辨率每增加1位,理論SNR提升約6dB(實(shí)際因
    發(fā)表于 09-18 09:31

    如何構(gòu)建帶有VGA輸出的低分辨率熱成像

    在本文中,我們將介紹如何構(gòu)建帶有VGA輸出的低分辨率熱成像。該解決方案基于Melexis MLX90640紅外陣列、FPGA S7 50開(kāi)發(fā)板(AMD-Xilinx Spartan-7 FPGA,帶VGA輸出)。
    的頭像 發(fā)表于 07-15 11:06 ?4218次閱讀
    如何構(gòu)建帶有VGA輸出的<b class='flag-5'>低分辨率</b>熱成像

    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍,推動(dòng)視頻畫(huà)質(zhì)升級(jí)

    近日,在計(jì)算機(jī)視覺(jué)領(lǐng)域最具影響力的國(guó)際競(jìng)賽CVPRNTIRE2025中,傳音多媒體團(tuán)隊(duì)與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊(duì)分別斬獲高效超分辨率
    的頭像 發(fā)表于 06-24 17:03 ?919次閱讀
    傳音多媒體<b class='flag-5'>團(tuán)隊(duì)</b>攬獲CVPR NTIRE 2025兩項(xiàng)<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動(dòng)<b class='flag-5'>視頻</b>畫(huà)質(zhì)升級(jí)

    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍

    近日,在計(jì)算機(jī)視覺(jué)領(lǐng)域最具影響力的國(guó)際競(jìng)賽 CVPR NTIRE 2025中,傳音多媒體團(tuán)隊(duì)與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊(duì)分別斬獲 高效超分辨率
    的頭像 發(fā)表于 06-24 16:08 ?1637次閱讀
    傳音多媒體<b class='flag-5'>團(tuán)隊(duì)</b>攬獲CVPR NTIRE 2025兩項(xiàng)<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    分辨率 vs 噪聲 —— ADC的挑戰(zhàn)

    設(shè)計(jì)者常用高分辨率 ADC 以降低最低可量測(cè)單位(LSB),提高檢測(cè)精度。 比如一個(gè) 16 位 ADC 在 5V 范圍內(nèi), LSB ≈ 76 μV ;理想情況下可以檢測(cè)到微弱電信號(hào)。 問(wèn)題是: 若
    的頭像 發(fā)表于 06-23 07:38 ?1945次閱讀
    <b class='flag-5'>分辨率</b> vs 噪聲 —— ADC的<b class='flag-5'>挑戰(zhàn)</b>

    FX3板是否兼容2k和4k分辨率視頻數(shù)據(jù)流?

    我們希望使用 FPGA 對(duì) FX3 板進(jìn)行配置,該板提供分辨率為 3264 * 2448(有效分辨率)和 2560 * 1440(有效分辨率)的視頻流。 我之前參考了應(yīng)用說(shuō)明 AN
    發(fā)表于 05-23 06:35