人工智能技術(shù)的精進(jìn)與開發(fā)無(wú)疑對(duì)人工智能的應(yīng)用至關(guān)重要,而人工智能除了在與生活強(qiáng)關(guān)聯(lián)方面的應(yīng)用,回應(yīng)少數(shù)群體的需求也將成為人工智能發(fā)展的必然方向。
近日,加州大學(xué)伯克利分校的研究人員表示,他們正在使用無(wú)聲語(yǔ)言和收集肌肉活動(dòng)的傳感器來(lái)訓(xùn)練人工智能。其中,無(wú)聲語(yǔ)言是用肌電圖(EMG)檢測(cè)的,電極則放在臉和喉嚨上。研究人員表示,該模型的重點(diǎn)是研究被稱之為“沉默語(yǔ)音”的模型,該模型可以檢測(cè)到人們想說(shuō)、但沒(méi)說(shuō)出聲的話。
研究人員相信,他們的方法可以為那些無(wú)法發(fā)出聲音的人提供大量的應(yīng)用,并且可以支持人工智能助手或其他對(duì)語(yǔ)音命令做出響應(yīng)的設(shè)備進(jìn)行沉默語(yǔ)音檢測(cè)。
盡管設(shè)想美好,但想真正實(shí)現(xiàn)卻并不容易:首先,在收集數(shù)據(jù)時(shí),研究者會(huì)先在實(shí)驗(yàn)者的臉上等部位貼8個(gè)貼片,每個(gè)貼片都是一個(gè)“監(jiān)視肌肉變化”的傳感器。
隨后,研究人員需要錄制一段實(shí)驗(yàn)者的有聲語(yǔ)音,并與肌電圖進(jìn)行對(duì)應(yīng)這種方法能夠?qū)⒓∪獾淖兓闆r、和語(yǔ)音的類型對(duì)應(yīng)起來(lái)。然后使用WaveNet解碼器生成音頻語(yǔ)音預(yù)測(cè)。在記錄數(shù)據(jù)的過(guò)程中,還要再錄制一段“對(duì)口型”的肌電圖,但不需要發(fā)聲,也就是“沉默語(yǔ)音”。
與用發(fā)聲肌電數(shù)據(jù)訓(xùn)練的基線相比,該方法在書中句子轉(zhuǎn)錄的單詞錯(cuò)誤率下降了64%到4%,錯(cuò)誤率比基線減少了95%。此外,為了推動(dòng)這一領(lǐng)域的進(jìn)一步研究,研究人員還開發(fā)了一個(gè)由近20小時(shí)面部肌電數(shù)據(jù)組成的數(shù)據(jù)集。
這項(xiàng)題為“無(wú)聲語(yǔ)音的數(shù)字發(fā)聲”的研究論文,在近日舉行的自然語(yǔ)言處理經(jīng)驗(yàn)方法(EMNLP)活動(dòng)上,獲得了最佳論文獎(jiǎng)。
研究小組的論文寫道:“數(shù)字化無(wú)聲語(yǔ)音有著廣泛的潛在應(yīng)用。”例如,它可以用來(lái)制造一種類似于藍(lán)牙耳機(jī)的設(shè)備,它允許人們?cè)诓桓蓴_周圍人的情況下進(jìn)行電話交談。而顯然,這種設(shè)備在環(huán)境噪音太大無(wú)法捕捉到可聽語(yǔ)音或保持沉默的環(huán)境中將具有重要作用。
編輯:hfy
-
人工智能
+關(guān)注
關(guān)注
1817文章
50102瀏覽量
265508
發(fā)布評(píng)論請(qǐng)先 登錄
中科曙光萬(wàn)卡超集群為“人工智能+”提供底層動(dòng)力
融合多場(chǎng)耦合效應(yīng):生成式人工智能技術(shù)演進(jìn)及其在航空發(fā)動(dòng)機(jī)復(fù)雜工程系統(tǒng)中的賦能機(jī)制研究
成都華微出席人工智能技術(shù)創(chuàng)新能力供需對(duì)接活動(dòng)
微軟與新思科技分享智能體人工智能技術(shù)的行業(yè)影響
航天宏圖人工智能技術(shù)深度賦能社會(huì)治理現(xiàn)代化
重磅來(lái)襲!2026全球人工智能終端展暨第七屆深圳人工智能展覽會(huì)
中科創(chuàng)達(dá)旗下創(chuàng)通聯(lián)達(dá)即將舉辦RUBIK Pi 3端側(cè)人工智能技術(shù)巡演
挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!
人工智能技術(shù)的現(xiàn)狀與未來(lái)發(fā)展趨勢(shì)
CES Asia 2025同期低空智能感知與空域管理技術(shù)論壇即將啟幕
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
中科曙光亮相2025全球人工智能技術(shù)大會(huì)
亞馬遜一年助力兩百萬(wàn)人提升人工智能技能的關(guān)鍵洞察
人工智能技術(shù)助力無(wú)聲語(yǔ)言研究
評(píng)論