91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌提出了一種稱為時(shí)間循環(huán)一致性學(xué)習(xí)的自監(jiān)督方法

nlfO_thejiangme ? 來源:lq ? 2019-10-01 16:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

視頻理解是計(jì)算機(jī)視覺中的重要任務(wù),近年來隨著深度學(xué)習(xí)特別是監(jiān)督學(xué)習(xí)的應(yīng)用視頻理解取得了飛速的發(fā)展,例如視頻行為分類和視頻片段總結(jié)等任務(wù)都取得了令人矚目的成果。

不過,現(xiàn)實(shí)生活中很多場景的應(yīng)用視頻片段需要不止一個(gè)標(biāo)簽來提供足夠的信息。舉個(gè)例子,機(jī)器人往杯子里倒水,一個(gè)簡單的“傾倒液體”標(biāo)簽不足以預(yù)測出杯子何時(shí)倒?jié)M,機(jī)器人需要逐幀追蹤杯中的水量。再比如說,在運(yùn)動(dòng)分析領(lǐng)域,棒球教練不僅僅想要看到投球的動(dòng)作,而是想精確地分析投手投出棒球離手的一瞬間,單一的視頻標(biāo)簽不足以完成這樣的視頻檢索任務(wù)。這意味著視頻理解模型需要逐幀理解視頻的能力。

然而如果使用監(jiān)督學(xué)習(xí)的方法將會使學(xué)習(xí)成本變得非常昂貴,這需要針對視頻里每一幀的動(dòng)作進(jìn)行細(xì)粒度的標(biāo)注,訓(xùn)練不同的動(dòng)作還需要新的標(biāo)注來提供監(jiān)督信號。但從機(jī)器人到運(yùn)動(dòng)分析等領(lǐng)域,細(xì)粒度的視頻理解有著很強(qiáng)的需求,那么如何在不需要大量標(biāo)簽的情況下對視頻進(jìn)行學(xué)習(xí)以理解細(xì)粒度的信息呢?

來自谷歌的研究人員們提出了一種稱為時(shí)間循環(huán)一致性學(xué)習(xí)(Temporal Cycle-Consistency Learning,TCC)的自監(jiān)督方法。通過學(xué)習(xí)不同樣本相似過程的表示來實(shí)現(xiàn)細(xì)粒度的時(shí)域視頻理解,為逐幀視頻檢索、動(dòng)作分析、視頻同步和多模態(tài)遷移提供了新的解決方案。

基于TCC的視頻表示學(xué)習(xí)

世間的萬事萬物發(fā)展的過程都有特定的規(guī)律,從嫩芽到參天大樹的植物生長到起床上班回家兩點(diǎn)一線的996工作,再到簡單倒水的動(dòng)作都在時(shí)間上滿足一定的順序。

多個(gè)不同實(shí)例的相同過程可以從視頻捕捉到的信息中找到對應(yīng)的聯(lián)系。全世界的人往容器中倒水動(dòng)作都差不多,無論對象是茶壺、酒瓶、水壺都有著相似的過程。其中傾倒液體的關(guān)鍵時(shí)刻在多個(gè)不同的視頻中都有著相同的特性——都需要舉起起一個(gè)容器向另一個(gè)容器中傾倒,而視頻中的其他特性則與拍攝的視角、光照、環(huán)境、尺度、容器以及速度有關(guān)。TCC的關(guān)鍵在于通過循環(huán)一致性的原則,從多個(gè)視頻中尋找出對應(yīng)的相同動(dòng)作。

算法的目標(biāo)在于訓(xùn)練出一個(gè)有效的幀編碼器來獲取對應(yīng)動(dòng)作的表示編碼。研究人員首先將兩個(gè)待配準(zhǔn)的視頻傳入編碼器中獲取對應(yīng)的嵌入信息,而后選擇兩個(gè)視頻來進(jìn)行TCC的訓(xùn)練,其中video1作為參考視頻,從中取出一幀并利用最鄰近方法在嵌入空間中找到video2中最為近似的一幀;而后以video2中找到的這一幀作為輸入,從新到嵌入空間中尋找video中對應(yīng)的幀(circle過程)。如果學(xué)習(xí)出的嵌入空間具有循環(huán)一致性的話,這一幀和先前輸入video1的參考幀應(yīng)該是同一幀。

上圖中可以看到,左邊的嵌入在循環(huán)檢索后對應(yīng)原來的幀,說明循環(huán)一致性得到滿足;而右邊的嵌入在循環(huán)檢索后獲取的幀與輸入的幀有差異,則表示這一嵌入的循環(huán)一致性沒有得到滿足,他們在嵌入空間中的差值就表示為循環(huán)一致性損失。模型的訓(xùn)練過程通過不斷提高對于每個(gè)視頻幀的語義理解來減小循環(huán)一致性誤差。充分訓(xùn)練后的TCC可以學(xué)習(xí)出時(shí)域的細(xì)粒度理解能力,并能夠有效對齊相關(guān)的視頻。

TCC學(xué)習(xí)到的表達(dá)

研究人員隨后驗(yàn)證了TCC學(xué)習(xí)到的表達(dá),是否有效理解了多個(gè)視頻中的相似動(dòng)作。實(shí)驗(yàn)在Penn Action數(shù)據(jù)集上進(jìn)行,研究人員將多個(gè)包含人體深蹲訓(xùn)練的視頻利用T后發(fā)現(xiàn)了空間可視化學(xué)習(xí)到的隱含特征。

左圖中亮度較高的點(diǎn)是當(dāng)前幀對應(yīng)的表示。紫色為輸入的參考視頻,其余為其他視頻中檢索到的最鄰近幀??梢钥吹诫m然各個(gè)視頻的角度、場景、主體不同,但對應(yīng)的嵌入表示和對應(yīng)的視頻幀卻以相同的趨勢在運(yùn)動(dòng),TCC有效地將深蹲動(dòng)作的不同過程進(jìn)行了編碼而無需顯式的人工標(biāo)注。

TCC的潛在應(yīng)用

由于這種方法可以有效學(xué)習(xí)逐幀視頻的遷移表達(dá)可廣泛應(yīng)用于小樣本視頻動(dòng)作分類、無監(jiān)督視頻對齊、多模態(tài)遷移和逐幀視頻檢索。

小樣本動(dòng)作階段分類。當(dāng)只有很少的標(biāo)注視頻樣本時(shí),TCC方法可以有效地將不同動(dòng)作階段進(jìn)行分類。研究人員將基于TCC的方法與監(jiān)督學(xué)習(xí)方法進(jìn)行比較,可以發(fā)現(xiàn)只用一個(gè)完全標(biāo)記的視頻樣本訓(xùn)練就可與監(jiān)督學(xué)習(xí)需要五十個(gè)標(biāo)注的視頻樣本訓(xùn)練獲得同樣的效果。下圖中可以看到TCC方法在兩種動(dòng)作識別中小樣本學(xué)習(xí)的良好表現(xiàn)。

對齊或同步視頻。當(dāng)視頻的數(shù)量增加時(shí)對齊或同步不同視頻間的動(dòng)作將會是耗時(shí)耗力的工作,但利用TCC多個(gè)視頻的同步可以利用參考視頻的幀來在每個(gè)目標(biāo)視頻中尋找最鄰近的幀實(shí)現(xiàn)對齊:

視頻標(biāo)簽/模態(tài)遷移。由于TCC可以在嵌入空間中找到每一幀對應(yīng)的最鄰近幀進(jìn)行視頻匹配,所以這種方法還可以將視頻對應(yīng)的元數(shù)據(jù)進(jìn)行遷移,包括時(shí)域語義標(biāo)簽或者音頻數(shù)據(jù)。研究人員展示了一個(gè)可以把倒水的聲音遷移到一段沒有聲音的視頻上,倒水的聲音別成功遷移到了倒牛奶的視頻上了,甚至放瓶子的聲音也很逼真!

逐幀視頻檢索。TCC還可以作為關(guān)鍵幀在嵌入空間中用于視頻中相似幀的檢索。學(xué)習(xí)出的嵌入表達(dá)具有很強(qiáng)的分辨能力,可以區(qū)分出某一個(gè)動(dòng)作前后的相鄰幀。

研究人員還將整個(gè)工作的代碼開源,不僅包括了TCC,還包括了多個(gè)先進(jìn)自監(jiān)督方法的實(shí)現(xiàn),將為會視頻理解的研究以及藝術(shù)家利用視頻同步進(jìn)行創(chuàng)作帶來很大的幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111630
  • 視頻
    +關(guān)注

    關(guān)注

    6

    文章

    2006

    瀏覽量

    75017
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1238

    瀏覽量

    26229

原文標(biāo)題:讀懂視頻的每分每秒,谷歌提出自監(jiān)督方法提升視頻細(xì)粒度理解能力

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    是德科技推出全新GDDR7發(fā)射端一致性測試解決方案

    是德科技(NYSE: KEYS )宣布推出全新GDDR7發(fā)射端一致性解決方案,該方案可加速圖形與人工智能(AI)應(yīng)用領(lǐng)域遵循JEDEC標(biāo)準(zhǔn)的驗(yàn)證進(jìn)程。
    的頭像 發(fā)表于 03-02 11:05 ?393次閱讀
    是德科技推出全新GDDR7發(fā)射端<b class='flag-5'>一致性</b>測試解決方案

    聚焦一致性:鋰電池分選技術(shù)的革新者與推動(dòng)者

    在動(dòng)力電池與儲能系統(tǒng)朝著更高能量密度、更長循環(huán)壽命邁進(jìn)的時(shí)代,單體電芯性能的 高度一致性 已成為決定電池包整體品質(zhì)與安全的基石。實(shí)現(xiàn)這種一致性的核心環(huán)節(jié),位于制造鏈的后段——鋰電池分
    的頭像 發(fā)表于 02-02 15:39 ?868次閱讀
    聚焦<b class='flag-5'>一致性</b>:鋰電池分選技術(shù)的革新者與推動(dòng)者

    比斯特通用分選機(jī)四線制測試技術(shù)保障電芯性能一致性

    電芯的性能一致性直接決定了終端產(chǎn)品的安全、續(xù)航能力與使用壽命,然而,受制于原材料差異、制造工藝波動(dòng)等因素,即使是同批次生產(chǎn)的電芯,其電壓、內(nèi)阻等關(guān)鍵參數(shù)仍存在微小偏差。深圳比斯特自動(dòng)化設(shè)備
    的頭像 發(fā)表于 01-29 16:20 ?200次閱讀
    比斯特通用分選機(jī)四線制測試技術(shù)保障電芯性能<b class='flag-5'>一致性</b>

    以太網(wǎng)一致性測試全解析:保障高性能網(wǎng)絡(luò)的關(guān)鍵技術(shù)

    在高速網(wǎng)絡(luò)設(shè)備的設(shè)計(jì)與制造中,以太網(wǎng)一致性測試是確保產(chǎn)品性能穩(wěn)定、符合行業(yè)標(biāo)準(zhǔn)的關(guān)鍵環(huán)節(jié)。我們能夠?yàn)榭蛻籼峁臏y試標(biāo)準(zhǔn)解讀到實(shí)際問題排查的全方位支持。本文將以100Base-TX和1000Base-T為例,系統(tǒng)介紹以太網(wǎng)一致性測試的核心內(nèi)容與標(biāo)準(zhǔn)依據(jù),幫助客戶理解測試的重
    的頭像 發(fā)表于 01-20 17:42 ?1172次閱讀
    以太網(wǎng)<b class='flag-5'>一致性</b>測試全解析:保障高性能網(wǎng)絡(luò)的關(guān)鍵技術(shù)

    ±0.4kHz精度探索:解析超聲切割核心部件的批次一致性管理

    在工業(yè)制造中,設(shè)備的長期穩(wěn)定性與核心部件性能的一致性密切相關(guān)。對于使用超聲波切割設(shè)備的用戶而言,可能遇到過這樣的情形:不同批次的設(shè)備或更換核心部件后,切割效果出現(xiàn)細(xì)微差異,需要重新調(diào)試。這背后,個(gè)
    的頭像 發(fā)表于 01-14 17:12 ?576次閱讀
    ±0.4kHz精度探索:解析超聲切割核心部件的批次<b class='flag-5'>一致性</b>管理

    儲能電池一致性,已成核心競爭力

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)隨著新型儲能以及長時(shí)儲能在儲能中占比越來越多,儲能電池的一致性問題開始凸顯。而所謂的一致性,是指同規(guī)格型號的電池在容量、內(nèi)阻、電壓、自放電率、溫度特性和衰減速度等關(guān)鍵
    的頭像 發(fā)表于 01-08 16:37 ?7114次閱讀

    比斯特1810B自動(dòng)分選機(jī)實(shí)現(xiàn)電池性能一致性的保障設(shè)備

    在動(dòng)力電池和儲能系統(tǒng)快速發(fā)展的當(dāng)下,電池性能一致性已成為衡量產(chǎn)品質(zhì)量的關(guān)鍵指標(biāo)。一致性將直接影響電池組的整體性能發(fā)揮,更關(guān)乎產(chǎn)品的安全可靠和使用壽命。深圳比斯特自動(dòng)化設(shè)備有限公司推出的1810B
    的頭像 發(fā)表于 01-06 17:06 ?568次閱讀
    比斯特1810B自動(dòng)分選機(jī)實(shí)現(xiàn)電池性能<b class='flag-5'>一致性</b>的保障設(shè)備

    有關(guān)100M、1000M以太網(wǎng)一致性測試問題探討交流

    100M、1000M以太網(wǎng)一致性測試
    的頭像 發(fā)表于 12-14 10:42 ?581次閱讀
    有關(guān)100M、1000M以太網(wǎng)<b class='flag-5'>一致性</b>測試問題探討交流

    電纜組件相位一致性的意義

    、技術(shù)本質(zhì):定義與量化指標(biāo) 相位一致性描述的是多通道電纜組件在相同頻率與輸入信號下,各通道輸出信號相位差的穩(wěn)定程度。核心衡量指標(biāo)包括: 相位偏差 :單通道相位的波動(dòng)范圍 通道間相位差 :多通道之間
    的頭像 發(fā)表于 11-27 13:41 ?378次閱讀
    電纜組件相位<b class='flag-5'>一致性</b>的意義

    請教大家下DP一致性測試問題

    請教大家下,DP的Vbios中已經(jīng)固定了預(yù)加重和Swing的值,DP的TX信號一致性測試項(xiàng)中Non Pre-Emphasis Level Test(Swing2/Swing0)-PLTPAT,這個(gè)測試項(xiàng)意思是Swing2與Swing0偏差嗎?已經(jīng)固定了Swing中,這
    發(fā)表于 11-12 15:57

    解決鋰電池一致性難題!景鋰新能源電池均衡儀為儲能安全/電動(dòng)車?yán)m(xù)航保駕護(hù)航

    解決鋰電池一致性難題!景鋰新能源電池均衡儀為儲能/電動(dòng)車電池續(xù)航保駕護(hù)航
    的頭像 發(fā)表于 11-06 11:00 ?726次閱讀

    鏡頭不一致的問題原因分析

    在機(jī)器視覺系統(tǒng)的視界,鏡頭一致性猶如維系整個(gè)生態(tài)的隱形生命線,貫穿于光學(xué)成像、圖像處理到智能決策的全鏈路,其細(xì)微波動(dòng)足以顛覆整個(gè)檢測系統(tǒng)的可靠。當(dāng)工業(yè)界熱衷于討論算法精度與算力突破時(shí),鏡頭這基礎(chǔ)光學(xué)元件的
    的頭像 發(fā)表于 09-11 09:45 ?1284次閱讀

    車用鋰離子電池機(jī)理建模與并聯(lián)模組不一致性研究

    車用鋰離子電池機(jī)理建模與并聯(lián)模組不一致性研究
    發(fā)表于 05-16 21:02

    堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫一致性

    及稀釋程度等關(guān)鍵參數(shù)對焊層質(zhì)量有直接影響,實(shí)時(shí)監(jiān)控熔池輪廓和溫度分布可及時(shí)預(yù)警缺陷并指導(dǎo)參數(shù)優(yōu)化,以保證焊層一致性與工藝穩(wěn)定性。今天起了解堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫一致性。 堆焊簡介 堆焊,又
    的頭像 發(fā)表于 04-24 17:15 ?716次閱讀
    堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫<b class='flag-5'>一致性</b>

    一致性校正與邊緣融合拼接

    電子發(fā)燒友網(wǎng)站提供《差一致性校正與邊緣融合拼接.pdf》資料免費(fèi)下載
    發(fā)表于 04-10 18:02 ?0次下載