91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

隨時隨地,追蹤每個像素,連遮擋都不怕的「追蹤一切」視頻算法來了

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:未知 ? 2023-06-11 21:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Tracking Everything Everywhere All at Once.

前段時間,Meta 發(fā)布「分割一切(SAM)」AI 模型,可以為任何圖像或視頻中的任何物體生成 mask,讓計算機視覺(CV)領(lǐng)域研究者驚呼:「CV 不存在了」。之后,CV 領(lǐng)域掀起了一陣「二創(chuàng)」狂潮,一些工作陸續(xù)在分割的基礎(chǔ)上結(jié)合目標(biāo)檢測、圖像生成等功能,但大部分研究是基于靜態(tài)圖像的。

現(xiàn)在,一項稱為「追蹤一切」的新研究為動態(tài)視頻中的運動估計提出了新方法,能夠準(zhǔn)確、完整地追蹤物體的運動軌跡。

該研究由來自康奈爾大學(xué)、谷歌研究院和 UC 伯克利的研究者共同完成。他們聯(lián)合提出了一種完整且全局一致的運動表征 OmniMotion,并提出一種新的測試時(test-time)優(yōu)化方法,對視頻中每個像素進行準(zhǔn)確、完整的運動估計。

04c39d40-085d-11ee-962d-dac502259ad0.png

  • 論文地址:https://arxiv.org/abs/2306.05422

  • 項目主頁:https://omnimotion.github.io/

有網(wǎng)友在推特上轉(zhuǎn)發(fā)了這項研究,僅一天時間就收獲了 3500 + 的點贊量,研究內(nèi)容大受好評。

從該研究發(fā)布的 demo 看,運動追蹤的效果非常好,例如追蹤跳躍袋鼠的運動軌跡:

蕩秋千的運動曲線:

還能交互式查看運動追蹤情況:

即使物體被遮擋也能追蹤運動軌跡,如狗在跑動的過程中被樹遮擋:

在計算機視覺領(lǐng)域,常用的運動估計方法有兩種:稀疏特征追蹤和密集光流。但這兩種方法各有缺點,稀疏特征追蹤不能建模所有像素的運動;密集光流無法長時間捕獲運動軌跡。

該研究提出的 OmniMotion 使用 quasi-3D 規(guī)范體積來表征視頻,并通過局部空間和規(guī)范空間之間的雙射(bijection)對每個像素進行追蹤。這種表征能夠保證全局一致性,即使在物體被遮擋的情況下也能進行運動追蹤,并對相機和物體運動的任何組合進行建模。該研究通過實驗表明所提方法大大優(yōu)于現(xiàn)有 SOTA 方法。

方法概述

該研究將幀的集合與成對的噪聲運動估計(例如光流場)作為輸入,以形成整個視頻的完整、全局一致的運動表征。然后,該研究添加了一個優(yōu)化過程,使其可以用任何幀中的任何像素查詢表征,以在整個視頻中產(chǎn)生平滑、準(zhǔn)確的運動軌跡。值得注意的是,該方法可以識別畫面中的點何時被遮擋,甚至可以穿過遮擋追蹤點。

OmniMotion 表征

傳統(tǒng)的運動估計方法(例如成對光流),當(dāng)物體被遮擋時會失去對物體的追蹤。為了在遮擋的情況下也能提供準(zhǔn)確、一致的運動軌跡,該研究提出全局運動表征 OmniMotion。

該研究試圖在沒有顯式動態(tài) 3D 重建的情況下準(zhǔn)確追蹤真實世界的運動。OmniMotion 表征將視頻中的場景表示為規(guī)范的 3D 體積,通過局部規(guī)范雙射(local-canonical bijection)映射成每個幀中的局部體積。局部規(guī)范雙射被參數(shù)化為神經(jīng)網(wǎng)絡(luò),并在不分離兩者的情況下捕獲相機和場景運動?;诖朔N方法,視頻可以被視為來自固定靜態(tài)相機局部體積的渲染結(jié)果。

wKgaomTYgtOAbH4KAAXBMZBqqCE495.png

由于 OmniMotion 沒有明確區(qū)分相機和場景運動,所以形成的表征不是物理上準(zhǔn)確的 3D 場景重建。因此,該研究稱其為 quasi-3D 表征。

OmniMotion 保留了投影到每個像素的所有場景點的信息,以及它們的相對深度順序,這讓畫面中的點即使暫時被遮擋,也能對其進行追蹤。

實驗及結(jié)果

定量比較

研究者將提出的方法與 TAP-Vid 基準(zhǔn)進行比較,結(jié)果如表 1 所示??梢钥闯?,在不同的數(shù)據(jù)集上,他們的方法始終能實現(xiàn)最佳的位置準(zhǔn)確性、遮擋準(zhǔn)確性和時序一致性。他們的方法可以很好地處理來自 RAFT 和 TAP-Net 的不同的成對對應(yīng)輸入,并且在這兩種基準(zhǔn)方法上提供了一致的改進。

0d73db26-085d-11ee-962d-dac502259ad0.png

定性比較

如圖 3 所示,研究者對他們的方法和基線方法進行了定性比較。新方法在(長時間)遮擋事件中顯示出了出色的識別和追蹤的能力,同時在遮擋期間為點提供合理的位置,并處理很大的攝像機運動視差。

wKgZomTYgxOAVFZRAAepLTl23yo522.png

消融實驗與分析

研究者利用消融實驗來驗證他們設(shè)計決策的有效性,結(jié)果如表 2 所示。

0e4b0f56-085d-11ee-962d-dac502259ad0.png

在圖 4 中,他們展示了由他們的模型生成的偽深度圖,以展示學(xué)習(xí)到的深度排序。

wKgaomTYgy6APHeiAAcuO0q5oxM428.png

需要注意的是,這些圖并不對應(yīng)于物理深度,然而,它們展示了僅使用光度和光流信號時,新方法能夠有效地確定不同表面之間的相對順序,這對于在遮擋中進行追蹤至關(guān)重要。更多的消融實驗和分析結(jié)果可以在補充材料中找到。


原文標(biāo)題:隨時隨地,追蹤每個像素,連遮擋都不怕的「追蹤一切」視頻算法來了

文章出處:【微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:隨時隨地,追蹤每個像素,連遮擋都不怕的「追蹤一切」視頻算法來了

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    電子凸輪同步追蹤的方案分析

    電子凸輪同步追蹤技術(shù)作為工業(yè)自動化領(lǐng)域的核心控制策略,其本質(zhì)是通過軟件算法模擬機械凸輪的運動特性,實現(xiàn)多軸間的高精度相位同步。該技術(shù)突破了傳統(tǒng)機械凸輪的物理限制,在包裝機械、印刷設(shè)備、數(shù)控機床等場景中展現(xiàn)出顯著優(yōu)勢。以下從技術(shù)原理、實現(xiàn)方案及行業(yè)應(yīng)用三個維度展開深度分析。
    的頭像 發(fā)表于 03-02 17:13 ?514次閱讀

    BLE SoC,如何助力管理者實現(xiàn)高效的資產(chǎn)追蹤?

    基于BLE SoC的資產(chǎn)追蹤方案,具備低功耗、高集成和生態(tài)成熟,實現(xiàn)高效資產(chǎn)定位與管理。
    的頭像 發(fā)表于 12-22 14:16 ?302次閱讀
    BLE SoC,如何助力管理者實現(xiàn)高效的資產(chǎn)<b class='flag-5'>追蹤</b>?

    藍牙定位追蹤技術(shù):從技術(shù)原理、核心優(yōu)勢詳解(

    藍牙定位追蹤技術(shù)利用RSSI或AoA/AoD,通過信標(biāo)、網(wǎng)關(guān)或多天線陣列實現(xiàn)室內(nèi)精準(zhǔn)定位,具備低功耗、低成本、易部署、抗干擾強等優(yōu)勢,廣泛應(yīng)用于工業(yè)、倉儲、樓宇等場景的人員與資產(chǎn)管理。
    的頭像 發(fā)表于 12-17 14:30 ?715次閱讀

    索尼基于時識科技Speck2f芯片打造可穿戴眼動追蹤系統(tǒng)

    傳統(tǒng)幀式相機長期受高功耗瓶頸制約,可穿戴設(shè)備難以實現(xiàn)持續(xù)眼動追蹤。近日,索尼研究團隊基于時識科技(SynSense)Speck2f芯片,成功研發(fā)出全球首個全集成、電池供電的可穿戴眼動追蹤系統(tǒng)。該方案
    的頭像 發(fā)表于 12-04 17:05 ?1099次閱讀

    設(shè)備管理進入 “手機時代”:隨時隨地盯生產(chǎn)成常態(tài)

    對于企業(yè)而言,擁抱設(shè)備管理的 “手機時代” 已不是選擇題,而是提升核心競爭力的必修課。套好用的手機端設(shè)備管理系統(tǒng),如同給每臺設(shè)備配備專屬 “管家”,讓管理者隨時隨地掌控生產(chǎn)脈搏,線人員告別繁瑣流程,最終實現(xiàn) “少停機、降成本
    的頭像 發(fā)表于 11-07 10:02 ?338次閱讀
    設(shè)備管理進入 “手機時代”:<b class='flag-5'>隨時隨地</b>盯生產(chǎn)成常態(tài)

    目標(biāo)追蹤的簡易實現(xiàn):模板匹配

    直不變的,當(dāng)目標(biāo)靠近或者遠離攝像頭的時候,在視頻中就會表現(xiàn)出目標(biāo)尺度大小的變化,這給算法的自適應(yīng)能力帶來了挑戰(zhàn);遮擋與消失,即目標(biāo)物體在運
    發(fā)表于 10-28 07:21

    拼多多商品推廣鏈接生成API:社交裂變的轉(zhuǎn)化追蹤利器

    ? 在社交電商時代,拼多多通過 商品推廣鏈接生成API 為商家提供了精準(zhǔn)的流量轉(zhuǎn)化解決方案。該工具不僅簡化了社交裂變活動的落地,更實現(xiàn)了全鏈路轉(zhuǎn)化效果追蹤,成為提升營銷效率的核心引擎。 、核心
    的頭像 發(fā)表于 09-08 16:22 ?758次閱讀
    拼多多商品推廣鏈接生成API:社交裂變的轉(zhuǎn)化<b class='flag-5'>追蹤</b>利器

    資產(chǎn)追蹤設(shè)備市場對Cat.1模組與NTN的融合需求

    的興起,Cat.1模組市場將呈現(xiàn)持續(xù)增長態(tài)勢。預(yù)計到2025年,全球Cat.1模組出貨量將突破1.8億片,其中資產(chǎn)追蹤領(lǐng)域占比超過30% ;到2030年,Cat.1模組在資產(chǎn)追蹤設(shè)備中的滲透率仍將保持在65%以上,主要依賴其成本優(yōu)勢和與NTN的協(xié)同方案。這
    的頭像 發(fā)表于 08-25 15:53 ?731次閱讀

    如何使用樹莓派與OpenCV實現(xiàn)面部和運動追蹤的云臺系統(tǒng)?

    大家好,這是個樹莓派和OpenCV的連載專題。使用樹莓派與OpenCV實現(xiàn)姿態(tài)估計和面部特征點追蹤使用樹莓派與OpenCV實現(xiàn)面部和運動追蹤的云臺系統(tǒng)使用樹莓派和OpenCV實現(xiàn)手部識別與手指識別
    的頭像 發(fā)表于 08-14 17:45 ?1643次閱讀
    如何使用樹莓派與OpenCV實現(xiàn)面部和運動<b class='flag-5'>追蹤</b>的云臺系統(tǒng)?

    用樹莓派追蹤400公里內(nèi)的飛機?

    都能掌握它們的詳細信息,包括它們之前的飛行軌跡。這一切都要歸功于樹莓派和FlightAwareProStick。將它們組合在起,你就能創(chuàng)建個PiAware系統(tǒng)
    的頭像 發(fā)表于 08-08 14:59 ?815次閱讀
    用樹莓派<b class='flag-5'>追蹤</b>400公里內(nèi)的飛機?

    資產(chǎn)追蹤與室內(nèi)導(dǎo)航

    面展現(xiàn)出巨大潛力。 :資產(chǎn)追蹤 資產(chǎn)追蹤是指通過技術(shù)手段實時監(jiān)控物理資產(chǎn)的位置、狀態(tài)和使用情況,幫助企業(yè)優(yōu)化資源利用,減少丟失或閑置。無論是醫(yī)療設(shè)備、物流貨物還是零售庫存,資產(chǎn)追蹤
    的頭像 發(fā)表于 07-04 18:22 ?550次閱讀

    RFID在資產(chǎn)追蹤中的應(yīng)用

    RFID是種通過無線電波進行數(shù)據(jù)讀寫和物體識別的技術(shù)。它由電子標(biāo)簽、讀寫器和天線組成,能夠?qū)崿F(xiàn)非接觸式的數(shù)據(jù)交互。相比傳統(tǒng)的條形碼技術(shù),RFID具有更高的效率、更強的抗污染能力和更遠的讀取距離
    的頭像 發(fā)表于 04-11 16:39 ?825次閱讀
    RFID在資產(chǎn)<b class='flag-5'>追蹤</b>中的應(yīng)用

    RFID在物流追蹤中的應(yīng)用

    RFID是種通過無線電波進行數(shù)據(jù)讀寫和物體識別的技術(shù)。它由標(biāo)簽、讀寫器和天線組成,能夠?qū)崿F(xiàn)非接觸式的數(shù)據(jù)交互。相比傳統(tǒng)的條形碼技術(shù),RFID具有更高的效率、更強的抗污染能力和更遠的讀取距離
    的頭像 發(fā)表于 04-03 15:03 ?1004次閱讀
    RFID在物流<b class='flag-5'>追蹤</b>中的應(yīng)用

    個樹莓派,是如何同時實現(xiàn)飛機追蹤、氣象監(jiān)測、家居控制?

    SwadeWhite設(shè)計了款非??岬腁DS-B飛機跟蹤器,內(nèi)置氣象站和家庭自動化功能。我們已經(jīng)看過不少樹莓派飛機追蹤項目,但這個項目絕對有點額外的東西。在Reddit上,制作者和開發(fā)者
    的頭像 發(fā)表于 03-24 14:51 ?744次閱讀
    <b class='flag-5'>一</b>個樹莓派,是如何同時實現(xiàn)飛機<b class='flag-5'>追蹤</b>、氣象監(jiān)測、家居控制?

    隨時隨地,輕松測量:在線投影圖像測量工具?

    在線投影圖像測量儀以其隨時隨地、輕松測量的特性,在工業(yè)生產(chǎn)的多種環(huán)境中展現(xiàn)出了強大的應(yīng)用價值。它不僅為企業(yè)提供了精準(zhǔn)可靠的測量解決方案,還助力企業(yè)提升生產(chǎn)效率、保障產(chǎn)品質(zhì)量,推動工業(yè)生產(chǎn)向智能化、數(shù)字化邁進。
    的頭像 發(fā)表于 03-10 11:29 ?1701次閱讀
    <b class='flag-5'>隨時隨地</b>,輕松測量:在線投影圖像測量工具?