91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰(zhàn)賽雙料亞軍

傳音控股 ? 來源:傳音控股 ? 2025-10-31 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,國際計算機視覺大會(ICCV 2025)舉辦了第七屆大型視頻目標分割挑戰(zhàn)賽(LSVOS Challenge),傳音TEX AI團隊憑借自主研發(fā)的創(chuàng)新技術(shù)方案,在復(fù)雜視頻目標分割和語言指引視頻目標分割兩個賽道中均榮獲全球第二名,擊敗眾多國內(nèi)外強隊,充分展示了團隊在復(fù)雜視頻理解與多模態(tài)視頻目標分割領(lǐng)域的深厚積累與世界級競爭力。

ICCV是由IEEE(電氣電子工程師協(xié)會)每兩年舉辦一次的研究大會,與計算機視覺模式識別會議(CVPR)和歐洲計算機視覺會議(ECCV)并稱為計算機視覺領(lǐng)域的三大頂級會議。LSVOS Challenge 作為國際計算機視覺領(lǐng)域的重要賽事之一,旨在推動視頻目標分割技術(shù)的創(chuàng)新與落地應(yīng)用,為多模態(tài)視頻理解、視頻編輯等方向的發(fā)展提供重要的學(xué)術(shù)研究與產(chǎn)業(yè)落地參考。本次賽事吸引了來自清華大學(xué)、牛津大學(xué)、上海交通大學(xué)、上海人工智能實驗室、漢陽大學(xué)、南京理工大學(xué)、香港中文大學(xué)(深圳)、武漢大學(xué)、加利福尼亞大學(xué)默塞德分校、南洋理工大學(xué)、德國亞琛工業(yè)大學(xué)、荷蘭埃因霍溫理工大學(xué)、網(wǎng)易等國內(nèi)外知名機構(gòu)團隊參賽。

復(fù)雜視頻目標分割任務(wù)旨在在跨越數(shù)百至數(shù)千幀的長時復(fù)雜視頻中,持續(xù)追蹤并精確分割特定目標,即使在目標多次消失重現(xiàn)、外觀劇烈變化、小尺寸目標、重度遮擋等困難場景下仍需保持時序一致性;語言指引視頻目標分割則需根據(jù)自然語言描述在視頻中定位并分割目標,既要理解外觀信息,還需對動作、時序和多模態(tài)語義進行匹配。兩個任務(wù)均具有高度不確定性與挑戰(zhàn)性,考驗算法在真實場景中的魯棒性、泛化能力及跨模態(tài)理解水平。本屆比賽分別使用 MOSE(長視頻+復(fù)雜場景分割)與 MeViS(動作描述驅(qū)動的目標分割)等高難度數(shù)據(jù)集進行評測,對參賽方案的整體表現(xiàn)提出了極高要求。

在 VOS 賽道中,傳音TEX AI團隊在SAM2Long 框架基礎(chǔ)上引入偽標簽增強的領(lǐng)域自適應(yīng)訓(xùn)練策略(如圖所示),先采用 SAM2Long(基礎(chǔ)模型來自 SAM2)生成 MOSE 測試集的高質(zhì)量偽標簽,再與訓(xùn)練集融合重新微調(diào) SAM2 以此縮小域差異。推理階段并行使用概念驅(qū)動的Segment Concept(SeC)模型,并通過級聯(lián)決策機制動態(tài)融合兩路預(yù)測結(jié)果,兼顧長時穩(wěn)定性與外觀變化適應(yīng)性,最終在 MOSE 測試集上取得J&F 0.8616的成績,距離冠軍僅差 0.0021 分。

249e59d4-b319-11f0-8c8f-92fbcf53809c.png

圖. 傳音TEX AI團隊在VOS任務(wù)上提出的算法技術(shù)方案示意圖

在 RVOS 賽道中,團隊在Sa2VA框架基礎(chǔ)上進行了深度優(yōu)化,提出Video-Language Checker(VLC)利用視覺多模態(tài)大語言模型 Qwen2.5-VL 驗證視頻語義與語言描述的一致性,將測試集進行分類;并設(shè)計Key-Frame Sampler(KFS)將首段連續(xù)采樣與全局均勻采樣結(jié)合,提升捕捉目標和保持時序上下文的能力;最終由強化的 SEG token 驅(qū)動 SAM2 對關(guān)鍵幀進行分割,并將結(jié)果傳播至全視頻,實現(xiàn)時序一致的分割輸出。在未進行額外微調(diào)或偽標簽訓(xùn)練的前提下,該方案在 MeViS 測試集獲得J&F 0.6465,位列第二 。

24f6342e-b319-11f0-8c8f-92fbcf53809c.png

圖. 傳音TEX AI團隊在RVOS任務(wù)上提出的算法技術(shù)方案示意圖

未來,團隊將進一步將視頻目標分割技術(shù)應(yīng)用到視頻與動圖(live Photos)的目標消除,通過算法智能填補缺失區(qū)域、去除干擾物、恢復(fù)復(fù)雜場景內(nèi)容,實現(xiàn)更加自然流暢的視覺呈現(xiàn)。該能力可賦能視頻編輯、老影片修復(fù)、運動場景遮擋消除及創(chuàng)意特效制作等多樣化應(yīng)用場景,傳音TEX AI 團隊將持續(xù)在視頻理解與目標分割技術(shù)領(lǐng)域攻堅突破,推動全球行業(yè)技術(shù)發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7807

    瀏覽量

    93197
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301384
  • 傳音控股
    +關(guān)注

    關(guān)注

    1

    文章

    130

    瀏覽量

    8500

原文標題:傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰(zhàn)賽雙料亞軍

文章出處:【微信號:TranssionHoldings,微信公眾號:傳音控股】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍

    近日,國際語音與語言處理領(lǐng)域頂級賽事Interspeech 2026音頻推理挑戰(zhàn)賽結(jié)果正式揭曉。在這場首次將評估焦點從“答案正確性”轉(zhuǎn)向“推理過程質(zhì)量”的變革性賽事中,思必馳-上海交通大學(xué)聯(lián)合實驗室團隊憑借創(chuàng)新的多智能體協(xié)同方案,在全球眾多頂尖科研
    的頭像 發(fā)表于 02-28 14:13 ?475次閱讀

    芯導(dǎo)科技榮獲控股2025年度鼎立支持獎

    斬獲2025鼎立支持獎”,這是控股對雙方多年合作成果的高度認可,更是對芯導(dǎo)科技在功率半導(dǎo)體領(lǐng)域綜合實力的充分肯定。
    的頭像 發(fā)表于 01-27 17:52 ?1092次閱讀

    “芯”年來襲 | 瑞薩邊緣AI線上技術(shù)月暨挑戰(zhàn)賽

    自1月7日起,瑞薩邊緣AI技術(shù)月活動將每周開啟一場在線技術(shù)交流,涵蓋MCU/MPU產(chǎn)品、應(yīng)用案例及開發(fā)實踐,并同步開啟瑞薩AI評測挑戰(zhàn)賽,借助教程資源及每周在線講解和答疑,幫助嵌入式開發(fā)者從入門學(xué)習(xí)到上手第一個
    的頭像 發(fā)表于 12-25 10:21 ?2237次閱讀
    “芯”年來襲 | 瑞薩邊緣<b class='flag-5'>AI</b>線上技術(shù)月暨<b class='flag-5'>挑戰(zhàn)賽</b>

    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰(zhàn)賽銀獎

    Challenge(3DGS 重建挑戰(zhàn)賽)中憑借自研技術(shù)LiteGS出色的算法實力和軟硬件協(xié)同優(yōu)化能力,斬獲銀獎,再次證明摩爾線程在新一代圖形渲染技術(shù)上的深度積累與全球?qū)W術(shù)界的高度認可。
    的頭像 發(fā)表于 12-22 18:01 ?1803次閱讀
    摩爾線程在SIGGRAPH Asia <b class='flag-5'>2025</b><b class='flag-5'>斬獲</b>3DGS重建<b class='flag-5'>挑戰(zhàn)賽</b>銀獎

    2025 全國人工智能應(yīng)用場景創(chuàng)新挑戰(zhàn)賽AI Agent全球?qū)m?b class='flag-5'>賽線下半決賽新聞發(fā)布會在深圳召開

    12月10日下午,以“智啟未來,星耀深圳”為主題的2025全國人工智能應(yīng)用場景創(chuàng)新挑戰(zhàn)賽AI Agent 全球?qū)m?b class='flag-5'>賽線下半決賽新聞發(fā)布會在深圳召開。本次發(fā)布會由CICAS?
    的頭像 發(fā)表于 12-10 18:11 ?1191次閱讀
    <b class='flag-5'>2025</b> 全國人工智能應(yīng)用場景創(chuàng)新<b class='flag-5'>挑戰(zhàn)賽</b><b class='flag-5'>AI</b> Agent全球?qū)m?b class='flag-5'>賽</b>線下半決賽新聞發(fā)布會在深圳召開

    東風(fēng)睿立達斬獲NEVC 2025中國新能源商用車挑戰(zhàn)賽六項大獎

    9月15日,NEVC2025第十屆中國新能源商用車挑戰(zhàn)賽頒獎盛典圓滿落幕。東風(fēng)睿立達以卓越表現(xiàn)橫掃六項大獎,包括“大面組全能金獎”及四項關(guān)鍵單項冠軍,成為本屆賽事中最耀眼的新能源商用車之星。
    的頭像 發(fā)表于 09-16 16:57 ?1023次閱讀

    攜手Google Cloud打造下一代AI智能生態(tài)

    近日,在備受矚目的谷歌開發(fā)者大會上,TEX AI總經(jīng)理史團委受邀發(fā)表主題演講,深入分享了
    的頭像 發(fā)表于 09-02 10:47 ?1165次閱讀

    2025 EDA精英挑戰(zhàn)賽華大九天題發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國學(xué)位與研究生教育學(xué)會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-26 15:00 ?1654次閱讀
    <b class='flag-5'>2025</b> EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>華大九天<b class='flag-5'>賽</b>題發(fā)布

    2025 EDA精英挑戰(zhàn)賽紫光同創(chuàng)題發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國學(xué)位與研究生教育學(xué)會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-25 09:40 ?1662次閱讀
    <b class='flag-5'>2025</b> EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>紫光同創(chuàng)<b class='flag-5'>賽</b>題發(fā)布

    地平線H-RDT模型斬獲CVPR 2025冠軍

    近日,在計算機視覺與模式識別領(lǐng)域頂級會議CVPR 2025舉辦的RoboTwin雙臂機器人競賽中,地平線機器人實驗室與清華大學(xué)計算機系朱軍團隊聯(lián)合提出的H-RDT憑強大性能和領(lǐng)先成功率,一舉斬獲真機
    的頭像 發(fā)表于 08-21 10:02 ?669次閱讀
    地平線H-RDT模型<b class='flag-5'>斬獲</b>CVPR <b class='flag-5'>2025</b>大<b class='flag-5'>賽</b>冠軍

    斬獲WMT 2025國際機器翻譯大賽四項冠軍

    近日,在由國際計算語言學(xué)協(xié)會(ACL)主辦的WMT 2025國際機器翻譯大賽中,在低資源印度語言翻譯任務(wù)(Low-Resource Indic Language Translation)中
    的頭像 發(fā)表于 08-06 18:21 ?1232次閱讀

    格靈深瞳六篇論文入選ICCV 2025

    近日,國際頂級會議ICCV 2025(計算機視覺國際大會)公布論文錄用結(jié)果,格靈深瞳團隊共有6篇論文入選。
    的頭像 發(fā)表于 07-07 18:23 ?1553次閱讀

    多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽亞軍,推動視頻畫質(zhì)升級

    近日,在計算機視覺領(lǐng)域最具影響力的國際競賽CVPRNTIRE2025中,多媒體團隊與上海交通大學(xué)圖像所MediaLab聯(lián)合團隊分別
    的頭像 發(fā)表于 06-24 17:03 ?916次閱讀
    <b class='flag-5'>傳</b><b class='flag-5'>音</b>多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE <b class='flag-5'>2025</b>兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠<b class='flag-5'>亞軍</b>,推動<b class='flag-5'>視頻</b>畫質(zhì)升級

    多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽亞軍

    近日,在計算機視覺領(lǐng)域最具影響力的國際競賽 CVPR NTIRE 2025中,多媒體團隊與上海交通大學(xué)圖像所MediaLab聯(lián)合團隊分別
    的頭像 發(fā)表于 06-24 16:08 ?1631次閱讀
    <b class='flag-5'>傳</b><b class='flag-5'>音</b>多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE <b class='flag-5'>2025</b>兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠<b class='flag-5'>亞軍</b>

    Denodo全新AI SDK認證發(fā)布,攜手大學(xué)挑戰(zhàn)賽共筑快速AI應(yīng)用開發(fā)新生態(tài)

    ,Denodo學(xué)術(shù)計劃2025年度大學(xué)挑戰(zhàn)賽“數(shù)據(jù)與人工智能驅(qū)動現(xiàn)實影響力”正式啟動,誠邀全球高校學(xué)子通過創(chuàng)新實踐,展示數(shù)據(jù)管理與AI技能,推動社會變革。 自2024年11月Denodo Platform
    的頭像 發(fā)表于 06-24 13:36 ?755次閱讀