91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

重慶大學(xué):研究用于語音識別和交互的機(jī)器學(xué)習(xí)輔助可穿戴傳感系統(tǒng)

傳感器專家網(wǎng) ? 2025-03-14 14:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

背景介紹

人體會產(chǎn)生豐富的生物信號,這些信號可以被人體檢測、數(shù)字化、分析并與外界設(shè)備交互。其中,人類的語音尤其具有豐富的時域、頻域和幅度信息傳輸能力。這種豐富的信息承載能力使聲音成為生物通信、人機(jī)交互(HMI)和物聯(lián)網(wǎng)IoT)應(yīng)用(包括智能家居、遠(yuǎn)程控制、身份識別和語音系統(tǒng))的重要組成部分。然而,基于空氣振動的語音通信容易受到背景噪聲(如路邊、商場、車站等嘈雜環(huán)境)和聲學(xué)介質(zhì)(如火災(zāi)、醫(yī)院、水下等特殊場景)的干擾和阻礙。此外,發(fā)聲過程依賴于器官的協(xié)調(diào)系統(tǒng),任何因肌萎縮側(cè)索硬化癥(ALS)、中風(fēng)、帕金森病或喉癌等疾病引起的損傷都會嚴(yán)重影響語音清晰度和識別效率。為了應(yīng)對這些挑戰(zhàn),研究人員開發(fā)了先進(jìn)的降噪算法和多麥克風(fēng)系統(tǒng)來增強(qiáng)語音處理能力。然而,這些解決方案的有效性受到聲音信號質(zhì)量和多特征參數(shù)復(fù)雜性的限制。例如,單麥克風(fēng)系統(tǒng)無法捕捉空間特征,難以提供高信噪比的音頻信號。雖然多麥克風(fēng)系統(tǒng)和相關(guān)算法可以改善語音信號處理,但它們需要復(fù)雜的工程設(shè)計并占用更多空間。

最近,基于面部和嘴唇運動的視覺語音識別已成為一種在嘈雜環(huán)境中增強(qiáng)語音感知的方法。雖然這種方法可以在具有挑戰(zhàn)性的聲學(xué)條件下提高語音感知質(zhì)量,但它需要額外的攝像頭,這增加了系統(tǒng)的復(fù)雜性并降低了實用性。近年來,直接監(jiān)測面部運動狀態(tài)的可連接傳感器作為無聲語音識別的解決方案引起了人們的關(guān)注。雖然面部特征可以在一定程度上補(bǔ)充音頻信號,但它們在捕捉音高、音色和聲音強(qiáng)度等聲學(xué)參數(shù)方面存在很大的局限性。相反,將傳感器直接放置在發(fā)聲器官區(qū)域是一種實現(xiàn)全面聲音信息收集的有效方法。用于監(jiān)測聲音信號的傳統(tǒng)可穿戴設(shè)備通常使用綁帶或粘性貼片附著在身體上。然而,它們的剛性和扁平形狀限制了實際應(yīng)用。柔性材料和傳感技術(shù)的發(fā)展為隱形皮膚可穿戴設(shè)備鋪平了道路。目前,安裝在發(fā)聲器官中的柔性傳感技術(shù)主要包括石墨烯、柔性表面肌電圖電極、壓阻和摩擦電。與傳統(tǒng)的剛性麥克風(fēng)相比,這些技術(shù)佩戴更舒適,可以無縫融入日?;顒又小1M管這些傳感器有諸多優(yōu)勢,但它們通常依賴于有線硬件,限制了它們在日常使用中的適應(yīng)性。

為了克服這些挑戰(zhàn),集成信號處理和傳輸單元的柔性可穿戴設(shè)備對于充分利用各種機(jī)電特性的潛力至關(guān)重要。微機(jī)電系統(tǒng) (MEMS) 制造技術(shù)的進(jìn)步為改善可穿戴設(shè)備的集成帶來了希望。一項值得注意的創(chuàng)新是將商用 MEMS 加速度計芯片整合到可穿戴設(shè)備中,從而能夠連續(xù)監(jiān)測機(jī)械聲音信號,例如語音、吞咽、呼吸和心臟運動。然而,目前的傳感器無法滿足寬頻帶范圍和平坦度的要求,限制了信號頻譜的能量分布。此外,檢測皮膚加速度只能提供肌肉運動模式數(shù)據(jù),而忽略了發(fā)聲器官的關(guān)鍵振動信息。由于缺乏生物特征信息,在監(jiān)測小幅度肌肉運動時,機(jī)械聲音信號相對較弱。這種限制對于皮膚組織較厚(例如甲狀腺腫大)或喉部受傷的用戶尤其不友好。因此,有必要開發(fā)一種新的便攜式語音交互系統(tǒng)來解決這些問題并提高用戶體驗和HMI。

本文亮點

1. 本工作提出了一種可穿戴無線柔性貼膚聲學(xué)傳感器(SAAS),能夠捕捉發(fā)聲器官的振動和皮膚運動,從而實現(xiàn)惡劣聲學(xué)環(huán)境下的語音識別和人機(jī)交互(HMI)。

2. 該系統(tǒng)采用壓電微機(jī)械超聲換能器(PMUT),具有高靈敏度(-198 dB)、寬帶寬(10 Hz-20 kHz)和優(yōu)異的平坦度(±0.5 dB)等特點。柔性封裝提高了佩戴時的舒適性和適應(yīng)性,同時與殘差網(wǎng)絡(luò)(ResNet)架構(gòu)的集成顯著提高了喉部語音特征的分類,準(zhǔn)確率超過 96%。

3. 在多個 HMI 場景中展示了 SAAS 的數(shù)據(jù)收集和智能分類能力。語音識別系統(tǒng)能夠通過深度學(xué)習(xí)模型以 99.8% 的準(zhǔn)確率識別參與者所說的日常句子。

圖文解析

wKgZPGfSu-SAWa47ABLWJVRB1_s612.png

圖1. 用于惡劣聲學(xué)環(huán)境下語音識別的無線、柔性、可附著式聲學(xué)傳感器。

a 實現(xiàn)HMI的語音識別系統(tǒng)示意圖。b 可附著式聲學(xué)傳感系統(tǒng)爆炸圖。c PMUT結(jié)構(gòu)示意圖。d 處理發(fā)聲器官振動和肌肉運動信號的步驟流程圖,包括信號處理、控制、無線通信和顯示終端。e SAAS在語音識別與交互中的應(yīng)用示意圖。

wKgZPGfSu-WARauxAAuLGS6ykyc681.png

圖2. 裝置設(shè)計原理及特性描述。

a 基于SOI晶片的聲學(xué)傳感器三維結(jié)構(gòu)剖面圖。b PZT、AlN、ScAlN及對應(yīng)三種形狀的聲學(xué)傳感器相關(guān)參數(shù)的有限元仿真對比。c PMUT正面(I)和背面(II)的照片。d 制備的聲學(xué)芯片的光學(xué)顯微鏡圖像和微元件的特寫細(xì)節(jié)。e 制備的聲學(xué)芯片的Mo/ScAlN/Mo薄膜結(jié)構(gòu)的SEM剖面圖。f 空氣中MEMS芯片的電阻抗幅值與相位的諧振頻率響應(yīng)。g 水中封裝后的MEMS傳感器在低頻寬帶范圍內(nèi)的靈敏度測試曲線。h 柔性器件在未變形(I)、扭曲(II)、彎曲(III)和拉伸(IV)下的圖像顯示。

wKgZPGfSu-WACEl5ABBU5EYCH4Y496.png

圖3. 惡劣聲學(xué)環(huán)境下的語音檢測對比實驗。

a 安靜環(huán)境(I)、嘈雜環(huán)境(II)和戴口罩(III)下同一項對比測試的照片。b 當(dāng)受試者在安靜環(huán)境(I)、嘈雜環(huán)境(II)和戴口罩(III)下說“CQU”時,SAAS顯示聲音信號的時域波形和頻譜信息。c 當(dāng)受試者在安靜環(huán)境(I)、嘈雜環(huán)境(II)和戴口罩(III)下說“CQU”時,商用參考麥克風(fēng)顯示聲音信號的時域波形和頻譜信息。d 受試者在9種喉部附著位置和動作下的照片。e 通過 SAAS 在 9 個喉嚨附著位置和動作中說“完美”時獲得的時域波形。

wKgZPGfSu-WAJ8vgAAlAGkSij_k494.png

圖4. 基于SAAS的身份識別演示。

a–c音素、聲調(diào)、同音詞分類任務(wù)的混淆矩陣。d通過數(shù)據(jù)采集、深度學(xué)習(xí)和實時顯示實現(xiàn)的身份識別系統(tǒng)示意圖。e不同參與者說“hello world”時的聲音信息。f身份識別的混淆矩陣。

wKgZPGfSu-aAIWdTAA7IXHVlAYs643.png

圖5. 使用SAAS控制虛擬游戲和機(jī)器狗。

a實時無線HMI控制系統(tǒng)示意圖。b吃豆人游戲中語音指令上下左右命令演示。c遠(yuǎn)程無線控制機(jī)器狗通過語音命令執(zhí)行動作:“站起來”、“跳舞”、“側(cè)翻”、“爬樓梯”。

wKgZPGfSu-aAbuxFAAnSMkFICqY403.png

圖6. 基于SAAS的語音識別系統(tǒng)在人機(jī)交互中的應(yīng)用。

a通過數(shù)據(jù)處理、分類和實時顯示實現(xiàn)的交互系統(tǒng)示意圖。b 使用卷積神經(jīng)網(wǎng)絡(luò)從參與者的日常對話中收集到的 10 個句子樣本的波形和相應(yīng)的頻譜圖。c 句子識別任務(wù)的混淆矩陣。d 60 個 epoch 迭代過程中訓(xùn)練和測試數(shù)據(jù)的歸一化準(zhǔn)確率。e 經(jīng)過 60 次 T-SNE 算法迭代處理后的特征向量矩陣。f 經(jīng)過 60 次 T-SNE 算法迭代處理后的特征向量矩陣。

來源:柔性傳感及器件

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1287

    瀏覽量

    57916
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116039
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136916
  • 可穿戴傳感器
    +關(guān)注

    關(guān)注

    2

    文章

    103

    瀏覽量

    13140
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,也叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?234次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識別</b>IC分類,<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片的工作原理

    香港理工大學(xué)、南方科技大學(xué):新型壓阻式石墨烯/CNC聲學(xué)傳感器,用于語音識別

    ? 可穿戴聲學(xué)傳感器通過校準(zhǔn)喉部振動并將其轉(zhuǎn)化為合成語音,為語言障礙者提供了有效的溝通解決方案。本文,香港理工大學(xué)Zhongqing SU、南方科技
    的頭像 發(fā)表于 11-27 18:28 ?338次閱讀
    香港理工<b class='flag-5'>大學(xué)</b>、南方科技<b class='flag-5'>大學(xué)</b>:新型壓阻式石墨烯/CNC聲學(xué)<b class='flag-5'>傳感</b>器,<b class='flag-5'>用于</b><b class='flag-5'>語音</b><b class='flag-5'>識別</b>

    全北國立大學(xué):研究可穿戴汗液傳感貼片,用于無創(chuàng)連續(xù)健康監(jiān)測

    全北國立大學(xué)Suraj Shinde 團(tuán)隊系統(tǒng)地探討了用于個性化醫(yī)療保健監(jiān)測的可穿戴汗液感應(yīng)貼片 (WSP) 的最新進(jìn)展,為將 WSP 集成到靈活的人機(jī)界面、個性化醫(yī)療保健解決方案和閉
    的頭像 發(fā)表于 11-24 16:18 ?1196次閱讀
    全北國立<b class='flag-5'>大學(xué)</b>:<b class='flag-5'>研究</b><b class='flag-5'>可穿戴</b>汗液<b class='flag-5'>傳感</b>貼片,<b class='flag-5'>用于</b>無創(chuàng)連續(xù)健康監(jiān)測

    中科院/重慶大學(xué):仿生“電子皮膚”獲突破!梯度模量設(shè)計讓傳感器實現(xiàn)“寬壓域、高靈敏、抗漂移”

    應(yīng)用。盡管已有研究通過微結(jié)構(gòu)或梯度設(shè)計提升性能,但多數(shù)仍面臨制備復(fù)雜、界面不穩(wěn)定或反應(yīng)不均等挑戰(zhàn)。 文章簡介 ? ? 近日, 中國科學(xué)院重慶綠色智能技術(shù)研究院 、 重慶大學(xué) 等機(jī)構(gòu)的
    的頭像 發(fā)表于 11-24 14:45 ?3321次閱讀
    中科院/<b class='flag-5'>重慶大學(xué)</b>:仿生“電子皮膚”獲突破!梯度模量設(shè)計讓<b class='flag-5'>傳感</b>器實現(xiàn)“寬壓域、高靈敏、抗漂移”

    華中科技大學(xué)研究面向水陸兩棲人體運動識別的柔性多維肌肉形變磁傳感陣列

    準(zhǔn)確的人體運動識別對于控制可穿戴機(jī)器人及虛擬/增強(qiáng)現(xiàn)實等人機(jī)交互系統(tǒng)至關(guān)重要,而捕獲人體運動特征的可穿戴
    的頭像 發(fā)表于 11-24 11:39 ?796次閱讀
    華中科技<b class='flag-5'>大學(xué)</b>:<b class='flag-5'>研究</b>面向水陸兩棲人體運動<b class='flag-5'>識別</b>的柔性多維肌肉形變磁<b class='flag-5'>傳感</b>陣列

    北京航空航天大學(xué):基于二維材料的可穿戴生物設(shè)備—從柔性傳感器到智能集成系統(tǒng)

    ,可高效集成于柔性傳感系統(tǒng)中。隨著具有獨特性能的二維材料的迅速發(fā)展,可穿戴傳感器在智能交互和集成功能方面展現(xiàn)出了新的應(yīng)用前景。本綜述整合了最
    的頭像 發(fā)表于 11-04 17:07 ?7155次閱讀
    北京航空航天<b class='flag-5'>大學(xué)</b>:基于二維材料的<b class='flag-5'>可穿戴</b>生物設(shè)備—從柔性<b class='flag-5'>傳感</b>器到智能集成<b class='flag-5'>系統(tǒng)</b>

    語音機(jī)器交互系統(tǒng):核心技術(shù)與應(yīng)用挑戰(zhàn)

    ? ? ? 語音機(jī)器交互系統(tǒng)是融合多學(xué)科技術(shù)的復(fù)雜工程,其核心目標(biāo)是實現(xiàn)人與機(jī)器間的自然、流暢語音
    的頭像 發(fā)表于 09-02 11:08 ?823次閱讀

    再掀語音交互革命,廣和通AI解決方案加速機(jī)器人聽覺進(jìn)化

    機(jī)器人世界里,感知是智能化的第一步,是機(jī)器人獲取環(huán)境信息,學(xué)習(xí)適應(yīng)并自主決策的前提。聽覺作為五感之一,深度融合AI,可幫助機(jī)器人實現(xiàn)高效感知、數(shù)據(jù)獲取、
    的頭像 發(fā)表于 08-26 17:44 ?886次閱讀

    深圳大學(xué):構(gòu)建“喉部地圖”法,柔性超靈敏碳陣列傳感器,用于語音識別

    with deep learning”的論文,研究提出一種“喉部地圖”,利用柔性碳陣列傳感器和基于深度學(xué)習(xí)的信號處理方法,以確定高精度語音識別
    的頭像 發(fā)表于 08-23 17:16 ?715次閱讀
    深圳<b class='flag-5'>大學(xué)</b>:構(gòu)建“喉部地圖”法,柔性超靈敏碳陣列<b class='flag-5'>傳感</b>器,<b class='flag-5'>用于</b><b class='flag-5'>語音</b><b class='flag-5'>識別</b>

    西南大學(xué),西華大學(xué),河北工業(yè)大學(xué),重慶大學(xué):基于雙介質(zhì)層的離子壓力傳感器耦合超高靈敏度和寬范圍檢

    人工智能的加速發(fā)展推動了對柔性可穿戴傳感器的需求,特別是在柔性機(jī)器人、醫(yī)療健康監(jiān)測和人機(jī)交互等應(yīng)用中。柔性可穿戴壓力
    的頭像 發(fā)表于 07-24 18:20 ?3084次閱讀
    西南<b class='flag-5'>大學(xué)</b>,西華<b class='flag-5'>大學(xué)</b>,河北工業(yè)<b class='flag-5'>大學(xué)</b>,<b class='flag-5'>重慶大學(xué)</b>:基于雙介質(zhì)層的離子壓力<b class='flag-5'>傳感</b>器耦合超高靈敏度和寬范圍檢

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運算性能,能夠高效處理語音機(jī)器人運行過程中的復(fù)雜任務(wù)。語音識別和合成需要大量的計算資源,該處理器可以快速對語音
    發(fā)表于 05-28 11:36

    詳細(xì)介紹機(jī)場智能指路機(jī)器人的工作原理

    免與行人發(fā)生碰撞,為旅客提供安全、舒適的引導(dǎo)服務(wù)。 智能交互系統(tǒng) 語音識別與理解 :智能指路機(jī)器人利用先進(jìn)的
    發(fā)表于 05-10 18:26

    北京理工大學(xué)研究眼機(jī)界面智能傳感硬件——從可穿戴到仿生

    ? 眼機(jī)交互界面(Eye-machine interface, EMI)作為沉浸式人機(jī)交互的重要一環(huán),已被應(yīng)用于VR/AR、自動駕駛、腦機(jī)接口、生物醫(yī)學(xué)等領(lǐng)域。但現(xiàn)有EMI傳感硬件正在
    的頭像 發(fā)表于 04-25 18:42 ?896次閱讀
    北京理工<b class='flag-5'>大學(xué)</b>:<b class='flag-5'>研究</b>眼機(jī)界面智能<b class='flag-5'>傳感</b>硬件——從<b class='flag-5'>可穿戴</b>到仿生

    max30100用于可穿戴健康的脈搏血氧儀和心率傳感器IC手冊

    電子發(fā)燒友網(wǎng)站提供《max30100用于可穿戴健康的脈搏血氧儀和心率傳感器IC手冊.pdf》資料免費下載
    發(fā)表于 03-24 09:49 ?3次下載

    基于WTVxxx語音芯片的智能清潔機(jī)器人語音交互系統(tǒng)設(shè)計方案介紹

    集成度、低功耗、多控制模式及傳感器擴(kuò)展能力,為智能清潔機(jī)器人提供了高效的語音交互解決方案。核心需求分析:1、實時狀態(tài)反饋:工作模式切換、電量提醒、故障報警等
    的頭像 發(fā)表于 03-06 08:27 ?828次閱讀
    基于WTVxxx<b class='flag-5'>語音</b>芯片的智能清潔<b class='flag-5'>機(jī)器人語音</b><b class='flag-5'>交互</b><b class='flag-5'>系統(tǒng)</b>設(shè)計方案介紹