91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

100多萬個視頻短片數(shù)據(jù)集來啦!

電子工程師 ? 來源:lp ? 2019-03-15 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

想象一下,如果我們必須向外星人解釋地球上發(fā)生的所有行為。我們可以為他們提供非小說類書籍或BBC紀錄片。我們可以嘗試口頭解釋什么是電臀舞。但是,實際上,沒有什么能比三秒鐘的視頻短片更好地傳達出這一行為的含義。

Falling Asleep(入睡,來自GIPHY網(wǎng)站)

感謝麻省理工學院和IBM的研究人員,我們現(xiàn)在有了一個做了清晰的標簽標記的數(shù)據(jù)集,其中包含有100多萬個視頻短片。這個數(shù)據(jù)集名為“Moments in Time”,已經(jīng)收集了地球上發(fā)生的數(shù)百種常見行為,有鮮花綻放的美麗時刻,也有令人尷尬的被絆倒和嘴啃泥場景。

Tripping(絆倒,來自GIPHY網(wǎng)站)

然而,Moments in Time的創(chuàng)建并不是為了提供一系列GIF動畫,而是為人工智能系統(tǒng)識別和理解視頻中的行為和事件打下基礎。迄今為止,大量標記過的圖像數(shù)據(jù)集,如用于物體識別的ImageNet和用于場景識別的Places,在開發(fā)更準確的圖像分類和理解模型中發(fā)揮了重要作用。

“視頻理解尤其是視頻中的行為識別,與圖像理解的情況是不同的?!盡IT-IBM沃森人工智能實驗室的首席研究員、創(chuàng)建Moments in Time的主管研究員Dan Gutfreund說?!半m然用標簽標記了行為的視頻數(shù)據(jù)集在Moments in Time之前就已經(jīng)存在,但它們比圖像數(shù)據(jù)集要小好幾個數(shù)量級。此外,它們是以人為中心的,有時還是針對特定領域的(比如體育)?!?/p>

因此,Gutfreund及其同事們力圖開發(fā)一個分類系統(tǒng),該系統(tǒng)可以涵蓋最常見的行為(不管這些行為是由人類、動物還是物體完成的,也不管它們是在什么環(huán)境下完成的)。他們首先列出了來自VerbNet的4500個最常用的動詞(VerbNet是由語言學家開發(fā)和使用的一個動詞知識庫)。

他們將動詞解析成語義相關的詞簇,然后從每個詞簇中選擇最常見的動詞。結果顯示英語是很冗余的一種語言。例如,洗浴、淋浴、沐浴、皂洗、洗發(fā)、修指甲、保濕和用牙線——這些都可以簡單地歸入“梳洗打扮”的范疇。在對動詞進行了細致的整合之后,研究團隊確定了339個用做Moments in Time基礎的關鍵動詞。

Grooming(梳洗打扮,來自GIPHY網(wǎng)站)

但是,當對視頻本身進行分類時,會遇到一系列獨特的挑戰(zhàn)。例如,描述某個東西正在“打開”(opening),那可能是一個人正在打開一扇門,也可能是一朵花正在綻放,甚至可能是一只卡通狗正在張開嘴。更重要的是,相同幀反向播放,實際上可以描述不同的行為(“關閉”,closing),這意味著捕捉視頻的時間線對于理解視頻和將其正確分類是至關重要的。

Opening(打開,來自GIPHY網(wǎng)站)

研究人員從網(wǎng)上挑選了與這339個動詞相關的視頻,將每個視頻的時長縮短到3秒。這些視頻短片被發(fā)送到眾包平臺Amazon Mechanical Turk上,該平臺上的用戶幫助對100多萬個視頻短片進行分類(他們只需點擊“是”或“否”來確認每個視頻短片中是否發(fā)生了指定的行為即可)。

每個標簽都經(jīng)過幾個用戶的驗證。關于該數(shù)據(jù)集如何創(chuàng)建的詳細信息,發(fā)表在了2月25日的IEEE Transactions on Pattern Analysis and Machine Intelligence上,文章標題為“Moments in Time Dataset: one million videos for event understanding”。

麻省理工學院計算機科學與人工智能實驗室(CSAIL)的Mathew Monfort是該項目的首席研究員,他指出,一些分類,比如“Walking”(步行)或“Cooking”(烹飪),是很簡單的,而另一些則不然?!癙laying Music”(演奏/播放音樂)可以是一個樂隊在舞臺上演奏,也可以是一個人在用收音機聽音樂。Monfort說:“具有這種視覺和聽覺多義性的類目的識別,對于當前的機器學習模型來說是非常具有挑戰(zhàn)性的?!?/p>

Playing Music(演奏/播放音樂,來自GIPHY網(wǎng)站)

在該數(shù)據(jù)集的下一版本中,該團隊計劃使用相同的視頻集合,并標記出每個視頻中發(fā)生的多個行為?!爱斘覀兛紤]視頻的本質時,很明顯需要更多的信息來恰當?shù)孛枋鲆粋€事件,而用一個行為標簽來訓練和評估模型是不完整的?!盡onfort說?!皩⒍鄠€標簽納入數(shù)據(jù)集應該可以顯著改善模型訓練,同時也為不同行為之間的關系問題以及如何對它們進行推理打開了大門?!?/p>

很快,更復雜的視頻可以通過機器學習算法分類,輕松自如。

不久之后,機器學習算法可能可以毫不費力地對更復雜的視頻加以分類。

機器學習(Machine Learning,來自GIPHY網(wǎng)站)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1819

    文章

    50190

    瀏覽量

    266315
  • 圖像分類
    +關注

    關注

    0

    文章

    97

    瀏覽量

    12521
  • 數(shù)據(jù)集

    關注

    4

    文章

    1238

    瀏覽量

    26241

原文標題:100多萬個視頻短片數(shù)據(jù)集來啦!

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Pico示波器如何實現(xiàn)通道同步采集

    每通道100kSa/s實時采集多臺8通道的機型通過軟件可以32通道同步采集,實時記錄與大容量文件存儲高速采集的大數(shù)據(jù)處理 以上是儀科技推薦的利用PICO示波器實現(xiàn)通道同步采集的方案
    發(fā)表于 03-17 11:28

    商湯Seko助力2026年度AI短片計劃全球啟動

    近日,商湯Seko在2026上海影視創(chuàng)制大會上隆重推出“創(chuàng)所未見·2026年度AI短片計劃”,3月10日起正式啟幕,面向全球征集優(yōu)秀AI短片作品!
    的頭像 發(fā)表于 03-14 16:51 ?2679次閱讀

    全球首個最大規(guī)??绫倔w視觸覺模態(tài)數(shù)據(jù)白虎-VTouch發(fā)布

    全球首個最大規(guī)??绫倔w視觸覺模態(tài)數(shù)據(jù)——白虎-VTouch(Vision-Based Tactile Sensor),總規(guī)模超過60,000分鐘。
    的頭像 發(fā)表于 01-29 14:41 ?634次閱讀

    NVIDIA推出多語種語音AI開放數(shù)據(jù)與模型

    新發(fā)布的 Granary 數(shù)據(jù)包含約 100 小時音頻,可用于訓練高精度、高吞吐量的 AI 音頻轉錄與翻譯模型。
    的頭像 發(fā)表于 09-23 15:34 ?1047次閱讀

    AI Cube如何導入數(shù)據(jù)?

    我從在線平臺標注完并且下載了數(shù)據(jù),也按照ai cube的要求修改了文件夾名稱,但是導入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發(fā)表于 08-11 08:12

    吉時利KEITHLEY DMM7510數(shù)字用表吉時利DMM7510七位半用表

    DMM7510 高精度、高分辨率數(shù)字用表 (DMM)、圖形觸摸屏顯示器和高速、高分辨率數(shù)字化器于一身,是第一款圖形采樣用表。其具有 pA 靈敏度和 1M 樣點/秒的采樣率,能
    發(fā)表于 07-24 11:01

    云訓練平臺數(shù)據(jù)過大無法下載數(shù)據(jù)至本地怎么解決?

    起因是現(xiàn)在平臺限制了圖片數(shù)量,想要本地訓練下載數(shù)據(jù)時發(fā)現(xiàn)只會跳出網(wǎng)絡異常的錯誤,請問這有什么解決辦法?
    發(fā)表于 07-22 06:03

    張飛FOC磁場定向控制有感、無感電機驅動視頻課程及STM32開發(fā)套件(共257)

    套餐三1)乘風篇-有感FOC視頻課程x1套(共124);2)揚帆起航派開發(fā)板x1塊;3)燒錄器x1;4)直流無刷電機x1;5)全套開源資料1x1套;¥498起
    的頭像 發(fā)表于 07-01 08:07 ?1409次閱讀
    張飛FOC磁場定向控制有感、無感電機驅動<b class='flag-5'>視頻</b>課程及STM32開發(fā)套件(共257<b class='flag-5'>集</b>)

    使用AICube導入數(shù)據(jù)點創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯誤日志** 但是使用示例的數(shù)據(jù)可以完成訓練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓練報錯網(wǎng)絡錯誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    Analog Devices Inc. ADTF3175 100像素飛行時間模塊數(shù)據(jù)手冊

    Analog Devices ADTF3175 100像素飛行時間模塊基于ADSD3100(一款100像素CMOS間接飛行時間 (ITF) 成像器,設計用于高分辨率3D深度傳感和視
    的頭像 發(fā)表于 06-16 11:02 ?893次閱讀
    Analog Devices Inc. ADTF3175 <b class='flag-5'>100</b><b class='flag-5'>萬</b>像素飛行時間模塊<b class='flag-5'>數(shù)據(jù)</b>手冊

    4K、模態(tài)、長視頻:AI視頻生成的下一戰(zhàn)場,誰在領跑?

    電子發(fā)燒友網(wǎng)報道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動最新視頻模型,支持文字與圖片輸入,可生成鏡頭無縫切換的1080P高品質
    的頭像 發(fā)表于 06-16 00:13 ?7418次閱讀

    正點原子Linux系列全新視頻教程來啦!手把手教你MP257開發(fā)板,讓您輕松入門!

    正點原子Linux系列全新視頻教程來啦!手把手教你MP257開發(fā)板,讓您輕松入門! 一、視頻觀看 正點原子手把手教你學STM32MP257-第1期:https://www.bilibili.com/video/BV1UtEiz
    發(fā)表于 05-16 10:42

    OpenHarmony應用開發(fā)精品課程第七期來啦

    OpenHarmony應用開發(fā)精品課程第七期來啦
    的頭像 發(fā)表于 04-15 14:15 ?792次閱讀
    OpenHarmony應用開發(fā)精品課程第七期<b class='flag-5'>來啦</b>

    正點原子ND1核輻射檢測儀支持檢測x,γ,β射線的輻射強度,高靈敏度J321蓋革-米勒計數(shù)管,支持約100輻射值記錄!

    ;高靈敏J321大蓋革管,準確可靠;ND1支持約100輻射值記錄,U盤數(shù)據(jù)導出,方便分析;支持手持感應功能,方便好用;報警方式與閾值可調(diào),不錯過危險警告;支持倒計時功能,3D感應,
    發(fā)表于 04-15 11:09