91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個可以預(yù)測活頁樂譜中和目標錄音匹配度最高的的位置的AI系統(tǒng)

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2020-12-07 11:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

音樂AI技術(shù)正在快速發(fā)展。

在預(yù)印平臺Arxiv.org上發(fā)布的一項研究中,約翰內(nèi)斯·開普勒大學(xué)林茨計算感知研究所和奧地利人工智能研究所的研究人員介紹了一個可以預(yù)測活頁樂譜中和目標錄音匹配度最高的的位置的AI系統(tǒng)。表面上,其對齊精度高于當前基于圖像的最新樂譜追蹤器。

樂譜追蹤技術(shù)是很多應(yīng)用程序的基礎(chǔ)。這些應(yīng)用包括自動伴奏、翻頁以及將現(xiàn)場表演與可視化圖像同步等等?,F(xiàn)有的系統(tǒng)要么依賴于固定長短的小片段樂譜圖像,要么需要光學(xué)音樂識別技術(shù)所提取出的計算機可讀的樂譜。但是這些研究人員的AI系統(tǒng)可以以獨特的方式觀察整頁樂譜,從而從頭到尾地追蹤任意長度的音樂表演。

這個研究團隊將樂譜追蹤當作一種圖像分割任務(wù)。根據(jù)特定時間的某個音樂表演,他們的系統(tǒng)針對當前正在播放的音樂相對應(yīng)的樂譜預(yù)測分段蒙版(即小片段)。研究人員說,僅僅利用固定大小音頻輸入的樂譜追蹤器無法在超過特定環(huán)境的情況下區(qū)分重復(fù)的音符,然而他們提出的AI系統(tǒng)在處理較長時間的樂譜時都不會有問題。

在實驗過程中,研究人員們從多模型樂譜數(shù)據(jù)集(MSMD)中獲取了一些復(fù)音鋼琴樣本,其中包括巴赫、莫扎特、貝多芬等多個作曲家的作品。在手動識別并且糾正一些對齊上的錯誤后,他們通過353對樂譜和MIDI音頻信息訓(xùn)練了AI系統(tǒng)。

該AI系統(tǒng)的另一位作者說,除了最高的門檻以外(沒搞懂highest threshold是啥),他們的系統(tǒng)擁有比基準線更高的性能,并能在時間差方面得出更精確的結(jié)果(即對于更嚴格的容錯率,百分比更高)。它偶爾也會產(chǎn)生一些錯誤,研究人員將其歸因于系統(tǒng)可能會在圖像紙上 “大幅跳躍”。但是他們斷言,種種試驗結(jié)果都表明這個AI系統(tǒng)在大多數(shù)情況下都是“非常精確的”。

“未來的工作會需要對掃描圖像或照片進行測試,以評估該AI系統(tǒng)在視覺領(lǐng)域的泛化能力?!毖芯咳藛T寫道,“成就功能更強大的系統(tǒng)的下一步是顯式或隱式地結(jié)合某種機制來處理樂譜和演奏中重復(fù)的音符。盡管我們也懷疑其性能會很大程度上取決于迄今為止音頻的隱式編碼。舉例來說,循環(huán)網(wǎng)絡(luò)中能夠存儲多大的聽覺環(huán)境將成為很重要的一個因素,但我們相信,我們所提出的方法能夠從合適的(經(jīng)受過訓(xùn)練的)的數(shù)據(jù)中很自然地獲得這種功能?!?/p>

音樂AI技術(shù)正在快速發(fā)展。OpenAI最近發(fā)布了一款叫做Jukebox的機器學(xué)習(xí)框架,它可以生成包括基本歌曲在內(nèi)的音樂作為各種音樂類型和音樂風(fēng)格的原始音頻。在2018年末,Google Brain的“Project Magenta”項目致力于“探索機器學(xué)習(xí)在創(chuàng)作過程中的作用”,提出了一個叫做“Musical Transformer”的模型。該模型能夠生成可識別的重復(fù)性歌曲。不僅如此,去年三月,谷歌發(fā)布了一種算法“Google Doodle”,讓用戶能夠創(chuàng)造向巴赫致敬的旋律。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    31

    文章

    3195

    瀏覽量

    85643
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26211
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1313

    瀏覽量

    25756

原文標題:研究人員的AI技術(shù)能夠?qū)崟r匹配活頁樂譜與MIDI音頻

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Transformer 入門:從零理解 AI 大模型的核心原理

    : 身高:175cm 體重:70kg 年齡:25歲 我們可以把這些數(shù)字排成排:[175, 70, 25],這就是向量! arduino 體驗
    發(fā)表于 02-10 16:33

    Ubuntu系統(tǒng)音頻調(diào)試指南:解決錄音異常問題

    在網(wǎng)安產(chǎn)品出貨國外的過程中,我們在 x86 平臺上遇到了 Ubuntu 系統(tǒng)錄音異常的情況 —— 安裝 Windows 系統(tǒng)錄音正常,但切換到 Ubuntu 24.04.3 版本后
    的頭像 發(fā)表于 02-05 13:41 ?186次閱讀
    Ubuntu<b class='flag-5'>系統(tǒng)</b>音頻調(diào)試指南:解決<b class='flag-5'>錄音</b>異常問題

    使用NORDIC AI的好處

    ,時延更低,系統(tǒng)在網(wǎng)絡(luò)不穩(wěn)定甚至離線時也能繼續(xù)工作。[Edge AI 概述] 提升隱私與可靠性 原始傳感器數(shù)據(jù)(如運動、生理信號等)可以留在本地,只上傳推理結(jié)果,有利于隱私與數(shù)據(jù)安全。 本地決策
    發(fā)表于 01-31 23:16

    大廠激戰(zhàn)錄音硬件,國產(chǎn)芯片加速端側(cè)AI競賽

    克等品牌掀起的硬件競賽背后,國產(chǎn)AI芯片也在“比拼”端側(cè)AI能力。 ? AI錄音硬件競賽:形態(tài)創(chuàng)新與市場競逐 安克 AI
    的頭像 發(fā)表于 01-23 09:29 ?6106次閱讀
    大廠激戰(zhàn)<b class='flag-5'>錄音</b>硬件,國產(chǎn)芯片加速端側(cè)<b class='flag-5'>AI</b>競賽

    目標追蹤的簡易實現(xiàn):模板匹配

    )*(720-50+1)= 826001 次。每次運算都會計算出 SAD 值,而我們只要找到這個最小的 SAD 值對應(yīng)的模板所在位置,就可以認為找到了幀圖像
    發(fā)表于 10-28 07:21

    提高條件分支指令預(yù)測正確率的方法

    “Gshare方法”。 BTB: 分支目標緩沖器(Branch Target Buffer,BTB)是用于存儲分支指令地址和目標地址的高速緩存,其常見于超標量處理器中,主要用于提
    發(fā)表于 10-22 08:22

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    學(xué)習(xí),AI可以智能識別和糾正信號錯誤。在2024年歐洲衛(wèi)星通信展上,展示的AI信號處理系統(tǒng)使衛(wèi)星通信的誤碼率從0.01%降至0.0001%,相當于每1000萬比特數(shù)據(jù)中,錯誤比特數(shù)從1
    發(fā)表于 10-11 16:01

    使用studio,最高版本的系統(tǒng)是4.0.3,用到LVGL,但是可選的版本是9.1的,不匹配怎么解決?

    使用studio搭建的系統(tǒng),選的是4.0.3版本,需要用到LVGL,但是版本沒的選,只有9.1最高的版本,系統(tǒng)匹配怎么辦?
    發(fā)表于 09-29 09:56

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    流體芯片 ⑤AI計算平臺 ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學(xué)習(xí)系統(tǒng) 2、面臨的挑戰(zhàn) ①需要造就
    發(fā)表于 09-17 11:45

    多種錄音筆錄音芯片方案推薦

    產(chǎn)品成本。唯創(chuàng)知音作為音頻芯片領(lǐng)域的知名廠商,推出了系列性能卓越的錄音芯片,為錄音筆的設(shè)計提供了多樣化且優(yōu)質(zhì)的解決方案。 二、多種錄音芯片推薦 (
    的頭像 發(fā)表于 08-06 16:48 ?1290次閱讀

    瘦客戶端解決方案:樹莓派電腦助力企業(yè)實現(xiàn)碳中和目標

    Losingthewires通過幫助企業(yè)轉(zhuǎn)向RaspberryPi管理的瘦客戶端,減少對臺式電腦的依賴,使商業(yè)世界更加可持續(xù),并助力企業(yè)實現(xiàn)碳中和目標
    的頭像 發(fā)表于 06-22 20:33 ?670次閱讀
    瘦客戶端解決方案:樹莓派電腦助力企業(yè)實現(xiàn)碳<b class='flag-5'>中和</b><b class='flag-5'>目標</b>!

    基于LockAI視覺識別模塊:C++多模板匹配

    多模板匹配種在圖像中同時尋找多個模板的技術(shù)。通過對每個模板逐進行匹配,找到與輸入圖像最相似的區(qū)域,并標記出匹配
    發(fā)表于 05-14 15:00

    基于LockAI視覺識別模塊:C++多模板匹配

    多模板匹配種在圖像中同時尋找多個模板的技術(shù)。通過對每個模板逐進行匹配,找到與輸入圖像最相似的區(qū)域,并標記出匹配
    的頭像 發(fā)表于 05-14 14:37 ?1632次閱讀
    基于LockAI視覺識別模塊:C++多模板<b class='flag-5'>匹配</b>

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+Agent的工作原理及特點

    感知系統(tǒng)從環(huán)境中收集信息并從中提取相關(guān)知識的能力,這類包括文本、圖像、聲音等。 2)規(guī)劃 規(guī)劃是指Agent為了實現(xiàn)某一目標而進行的決策過程,在該階段Agent會根據(jù)收集的信息制定出系列策略,并確定
    發(fā)表于 05-11 10:24

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    生態(tài)系統(tǒng)系統(tǒng)性革新,更需要高效、強力的開發(fā)者解決方案。為此,聯(lián)發(fā)科帶來了站式可視化智能開發(fā)工具——天璣開發(fā)工具集,包含AI應(yīng)用全流程開發(fā)工具Neuron Studio,并帶來全新升
    發(fā)表于 04-13 19:52