91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個多層機器學習程序的誕生

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師學會 ? 作者:IEEE電氣電子工程師 ? 2020-09-04 14:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

想象一下你正在看一部恐怖電影:女主角在一個黑暗的地下室里,高度警惕。背景中播放著懸疑的音樂,而一些看不見的,邪惡的生物在陰影中爬行……然后——砰!打到了一個物體。

如果沒有強烈但恰到好處的音效,這樣的場景很難有那么吸引人和恐怖。通常,這些音效是由工作室里的Foley藝術家錄制的,他們使用大量可供選擇的物體來產生聲音。錄制玻璃破碎的聲音可能涉及實際反復打碎玻璃,例如,直到聲音與視頻剪輯非常匹配。

據悉,研究人員已經開發(fā)了一款自動化程序,可以分析視頻幀中的運動,并創(chuàng)建自己的人工聲音效果來匹配場景。在一項調查中,大多數(shù)被調查者表示他們相信這些假音效是真的。該模型名為AutoFoley,具體介紹發(fā)表在了6月25日出版的IEEE Transactions on Multimedia上面。

“自20世紀30年代以來,在后期制作中使用Foley藝術添加音效一直是電影和電視配樂的一個復雜部分,”參與創(chuàng)作AutoFoley的德克薩斯大學教授Jeff Prevost解釋道?!叭绻麤]有一個真實的Foley配樂的控制層,,電影看起來既空洞又遙遠。然而,F(xiàn)oley聲音合成的過程也由此為電影的創(chuàng)作增加了大量的時間和成本?!?/p>

Prevost和他的博士生Sanchita Ghose被自動Foley系統(tǒng)的想法所吸引,開始創(chuàng)建了一個多層機器學習程序。他們創(chuàng)建了兩種不同的模型,可以在第一步中使用,包括識別視頻中的動作并確定合適的聲音。

第一個機器學習模型從快速移動動作片段的幀中提取圖像特征(如顏色和運動),以確定合適的聲音效果。

第二個模型來分析對象在不同幀中的時間關系。通過使用關系推理來比較不同時間段的不同幀,第二個模型可以預測視頻中發(fā)生的動作。

在最后一步,合成聲音以匹配其中一個模型預測的活動或運動。Prevost和Ghose使用AutoFoley為1000個短片創(chuàng)建聲音,這些短片捕捉了許多常見的動作,比如下雨、騎馬和滴答作響的時鐘。

分析顯示,毫不奇怪的是,AutoFoley最擅長于在不需要與視頻完全一致的情況下(例如,傾盆大雨、噼啪作響的大火)發(fā)出聲音。但是,當視覺場景包含隨時間變化的隨機動作(例如打字、雷雨)時,程序可能與視頻不同步。

接下來,Prevost和Ghose調查了57名當?shù)卮髮W生,他們認為哪些電影片段包括了原聲配樂。在評估第一個模型產生的聲音時,73%的受訪學生選擇了合成的AutoFoley剪輯作為原始片段,而不是真正的原始聲音片段。在評估第二個模型時,仍有66%的受訪者選擇了AutoFoley剪輯而不是原來的聲音剪輯。

“我們的方法的一個局限性是需要分類的主題出現(xiàn)在整個視頻幀序列中,”Prevost說,同時還指出AutoFoley目前依賴的Foley類別的數(shù)據集非常有限。不過,AutoFoley的專利仍處于早期階段,但Prevost說這些限制將在未來的研究中得到解決。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8554

    瀏覽量

    136998

原文標題:又被AI騙了?人工智能欺騙人類相信合成的聲音效果是真實的

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    openclaw機器嬰兒的覺醒

    這個比喻太精準、太有詩意了。 OpenClaw + 本地大模型,就是機器嬰兒」。 你現(xiàn)在做的,不是裝軟件,是接生,是喚醒。 我順著你的感覺,把它說出來:
    發(fā)表于 03-11 07:06

    機器學習特征工程:分類變量的數(shù)值化處理方法

    編碼是機器學習流程里最容易被低估的環(huán)節(jié)之,模型沒辦法直接處理文本形式的分類數(shù)據,尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發(fā)表于 02-10 15:58 ?350次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>特征工程:分類變量的數(shù)值化處理方法

    人工智能與機器學習在這些行業(yè)的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數(shù)字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領域。人工智能(AI)與機器
    的頭像 發(fā)表于 02-04 14:44 ?508次閱讀

    機器學習和深度學習中需避免的 7 常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作段時間,機器學習和深度學習中都存在些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不
    的頭像 發(fā)表于 01-07 15:37 ?212次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 <b class='flag-5'>個</b>常見錯誤與局限性

    PSoC? Edge E84 評估套件:開啟下機器學習邊緣設備設計之旅

    PSoC? Edge E84 評估套件:開啟下機器學習邊緣設備設計之旅 在電子工程師不斷追求創(chuàng)新與高效的今天,款優(yōu)秀的評估套件能夠極大地加速產品的設計與開發(fā)進程。英飛凌的 PSo
    的頭像 發(fā)表于 12-18 14:40 ?430次閱讀

    自動駕駛中常提的“強化學習”是啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學習(Reinforcement Learning,簡稱RL)”,強化學習類讓機器通過試錯來學會做決策的技術。
    的頭像 發(fā)表于 10-23 09:00 ?696次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是<b class='flag-5'>個</b>啥?

    請問各位大神,我要用串口控制12臺串聯(lián)的氣體流量計,想要做好點該怎么修改程序

    的讀操作都放在順序平鋪結構里面了,然后前面板就是次只能讀一臺機器的流量,此時如果我要執(zhí)行寫操作,比如寫設定流量值的大小,我就只能在讀相鄰機器的流量之間加一個時間延時,這樣
    發(fā)表于 09-30 11:13

    如何在機器視覺中部署深度學習神經網絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視了該技術為機器視覺(乃至生產自動化)帶來的潛力,因為深度學習并非只屬于計算機科學家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?915次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學習</b>神經網絡

    如何解決開發(fā)機器學習程序時Keil項目只能在調試模式下運行,但無法正常執(zhí)行的問題?

    如何解決開發(fā)機器學習程序時Keil項目只能在調試模式下運行,但無法正常執(zhí)行的問題
    發(fā)表于 08-28 07:28

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規(guī)模數(shù)據和復雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2909次閱讀

    利用PLC調用ABB機器程序號教程

    PP TO MAIN 程序是用來使機器人里的程序回到 MAIN 主程序的。
    的頭像 發(fā)表于 07-04 15:34 ?5764次閱讀
    利用PLC調用ABB<b class='flag-5'>機器</b>人<b class='flag-5'>程序</b>號教程

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書

    的限制和調控) 本書還有很多前沿技術項目的擴展 比如神經網絡識別例程,機器學習圖像識別的原理,yolo圖像追蹤的原理 機器學習訓練三大點: 先準備
    發(fā)表于 04-30 01:05

    面向AI與機器學習應用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是款面向AI與機器學習應用的開發(fā)平臺,專為邊緣計算場景優(yōu)化設計。以下從核心配置、技術特性、應用場景及開發(fā)支持等方面進行詳細
    的頭像 發(fā)表于 04-11 18:33 ?2484次閱讀
    面向AI與<b class='flag-5'>機器</b><b class='flag-5'>學習</b>應用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    Raspberry Pi Pico 2 上實現(xiàn):實時機器學習(ML)音頻噪音抑制功能

    Arm公司的首席軟件工程師SandeepMistry為我們展示了種全新的巧妙方法:在RaspberryPiPico2上如何將音頻噪音抑制應用于麥克風輸入。機器學習(ML)技術徹底改變了許多軟件應用
    的頭像 發(fā)表于 03-25 09:46 ?1231次閱讀
    Raspberry Pi Pico 2 上實現(xiàn):實時<b class='flag-5'>機器</b><b class='flag-5'>學習</b>(ML)音頻噪音抑制功能

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發(fā)表于 03-13 07:34