91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)改變?nèi)藱C(jī)交互方式的全新切入點(diǎn):語(yǔ)音接口

電子設(shè)計(jì) ? 2018-03-06 18:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)音接口已經(jīng)成為一個(gè)改變?nèi)藱C(jī)交互方式的全新切入點(diǎn)。這些系統(tǒng)如何工作?打造這樣一款設(shè)備在硬件方面有什么要求?隨著語(yǔ)音控制接口變得越來(lái)越普及,德州儀器TI)的一位工程師對(duì)此技術(shù)進(jìn)行了深入的了解,并分享了其對(duì)這項(xiàng)技術(shù)的認(rèn)識(shí)和看法。

語(yǔ)音接口是什么?

語(yǔ)音識(shí)別技術(shù)自20世紀(jì)50年代起開始出現(xiàn)在我們身邊。那時(shí)貝爾實(shí)驗(yàn)室的工程師創(chuàng)建了一款可以識(shí)別單個(gè)數(shù)字的系統(tǒng)。然而,語(yǔ)音識(shí)別只是完整語(yǔ)音接口技術(shù)的一部分。語(yǔ)音接口包含傳統(tǒng)用戶接口的所有方面:它能呈現(xiàn)信息并為用戶提供一種操控方式。在語(yǔ)音接口中,操控或者甚至一些信息的呈現(xiàn)都將通過語(yǔ)音實(shí)現(xiàn)。在一些如按鈕或顯示屏等傳統(tǒng)的用戶接口上,也可能配置語(yǔ)音接口這一選項(xiàng)。

大部分人遇到的第一款語(yǔ)音接口設(shè)備很有可能是移動(dòng)電話,或者是個(gè)人電腦上非?;A(chǔ)的將語(yǔ)言轉(zhuǎn)換成文字的程序。然而,這些設(shè)備的運(yùn)行都非常緩慢、識(shí)別不精確且可識(shí)別的詞匯有限。

那是什么將語(yǔ)音識(shí)別從一種附屬性功能變成了計(jì)算機(jī)世界炙手可熱的技術(shù)呢?首先,如今的計(jì)算能力和算法性能都有顯著的提高(如果你對(duì)隱馬爾科夫模型有所了解,對(duì)此你會(huì)有更直觀的認(rèn)識(shí))。其次,云技術(shù)和大數(shù)據(jù)分析的應(yīng)用也改進(jìn)了語(yǔ)音識(shí)別效果,并且提高了識(shí)別的速度和準(zhǔn)確性。

為你的設(shè)備添加語(yǔ)音識(shí)別功能

一些人常常會(huì)對(duì)如何為項(xiàng)目添加某種語(yǔ)音接口存在疑問。實(shí)際上,TI供應(yīng)幾種不同的語(yǔ)音接口產(chǎn)品,包括ARM?處理器的Sitara?系列產(chǎn)品和C5000? DSP系列產(chǎn)品,這些產(chǎn)品都具備語(yǔ)音處理的能力。兩種系列的產(chǎn)品各有千秋,分別適用于不同的應(yīng)用。

在選擇DSP和ARM這兩種解決方案時(shí),考慮的關(guān)鍵因素在于這款設(shè)備能否或?qū)⑷绾卫迷普Z(yǔ)音平臺(tái)。當(dāng)中有三種應(yīng)用場(chǎng)景:第一種是離線,所有的處理過程都在本地設(shè)備上發(fā)生。第二種是在線,通過基于云端的語(yǔ)音處理設(shè)備,如亞馬遜的Alexa,谷歌助手或IBM Watson;第三種是兩者混合。

離線:車載語(yǔ)音控制

從目前的發(fā)展趨勢(shì)來(lái)看,人們似乎希望所有事物都能夠連接至互聯(lián)網(wǎng)。然而,無(wú)論是出于成本考慮或是缺乏可靠的網(wǎng)絡(luò)連接,在某些應(yīng)用中,連接網(wǎng)絡(luò)的意義其實(shí)不大。在現(xiàn)代的汽車應(yīng)用中,許多娛樂信息系統(tǒng)就采用了離線語(yǔ)音接口系統(tǒng)。這些語(yǔ)音接口系統(tǒng)通常只能使用有限的命令集,如“撥打電話”、“播放音樂”和“提高或降低音量”。雖然傳統(tǒng)處理器的語(yǔ)音識(shí)別算法取得了重大進(jìn)展,但仍有不盡如人意之處。遇到這樣的情況,例如C55xx等DSP可能夠?yàn)橄到y(tǒng)提供最佳的性能。

在線智能家庭中樞

關(guān)于語(yǔ)音接口的很多熱議主要圍繞于例如Google Home和亞馬遜 Alexa等互聯(lián)設(shè)備。由于亞馬遜允許第三方進(jìn)入其已配備Alex語(yǔ)音服務(wù)的語(yǔ)音處理生態(tài)系統(tǒng),他們?cè)谶@方面的發(fā)展備受矚目。另外,如Microsoft Azur等其它的云服務(wù)也可以提供語(yǔ)音識(shí)別服務(wù)和類似功能。值得注意的是,這些設(shè)備的聲音處理過程全部發(fā)生在云端。

是否值得為了這種便捷的集成而向語(yǔ)音服務(wù)供應(yīng)商提供上行數(shù)據(jù)完全取決于用戶。但是,云服務(wù)供應(yīng)商承擔(dān)了主要的工作,設(shè)備商需要做的很簡(jiǎn)單,實(shí)際上,由于接口的語(yǔ)音合成部分也發(fā)生在云端,Alexa只要完成最簡(jiǎn)單的功能,即播放并記錄錄音文件。既然不需要特別的信號(hào)處理功能,ARM處理器足以處理接口工作。這意味著,如果你的設(shè)備已配備ARM處理器,你就可能集成云計(jì)算語(yǔ)音接口。

事實(shí)上,關(guān)注Alexa等不能提供的服務(wù)也是非常重要的。Alexa不直接執(zhí)行任何一種設(shè)備控制或云集成。驅(qū)動(dòng)Alexa的許多“智能設(shè)備”都具備云計(jì)算功能,該功能由開發(fā)商提供,可以利用Alexa的語(yǔ)音處理能力將驅(qū)動(dòng)輸入至現(xiàn)有的云應(yīng)用。例如,如果你告訴Alexa需要訂一個(gè)披薩,你最喜愛的披薩店則需要為Alexa編制一項(xiàng)“技能”。該項(xiàng)技能是一個(gè)可以在你訂披薩時(shí)定義工作內(nèi)容的代碼。當(dāng)你每次訂披薩時(shí),Alexa都會(huì)調(diào)用該技能。該技能嵌入了可以為你下單的在線訂購(gòu)系統(tǒng)。同樣,智能家居設(shè)備制造商必須執(zhí)行Alexa如何與本地設(shè)備和在線服務(wù)相互作用的技能。亞馬遜自帶許多這樣的技能,加上第三方開發(fā)者提供的技能,即便你沒有開發(fā)任何技能,Alexa設(shè)備仍然可以非常有用。

混合:互聯(lián)自動(dòng)調(diào)溫器

有時(shí),即使沒有連接互聯(lián)網(wǎng),我們也有保證設(shè)備的某些基礎(chǔ)功能可以正常使用的需求。例如:在連不上網(wǎng)的時(shí)候,如果自動(dòng)調(diào)溫器不會(huì)自主調(diào)節(jié)溫度,這就會(huì)是一個(gè)很麻煩的問題。為避免這種問題的發(fā)生 ,一個(gè)好的產(chǎn)品設(shè)計(jì)師會(huì)設(shè)計(jì)一些本地的聲音處理功能,在功能上實(shí)現(xiàn)無(wú)縫銜接。為了實(shí)現(xiàn)此功能,系統(tǒng)必須具有DSP,例如用于本地語(yǔ)音處理的C55XX和用于將已連網(wǎng)的接口連接至云端的ARM處理器。

語(yǔ)音觸發(fā)又是什么?

你也許已經(jīng)注意到了,直到現(xiàn)在我們還沒有提及新一代語(yǔ)音助手真正神奇的地方:那就是始終關(guān)注“觸發(fā)詞匯”。它們將如何追蹤你在房間內(nèi)任意位置所發(fā)出的聲音,或是當(dāng)設(shè)備播放音頻時(shí),又如何聽到你的聲音?實(shí)現(xiàn)這些其實(shí)并沒有什么特別神奇的地方,只需要一些智能化軟件。這類軟件獨(dú)立于云端的語(yǔ)音接口,也能在系統(tǒng)離線的狀態(tài)下運(yùn)行。

這個(gè)系統(tǒng)最易理解的部分就是“喚醒詞匯”。喚醒詞匯是一個(gè)簡(jiǎn)單的本地語(yǔ)音識(shí)別程序,通過持續(xù)性采樣,在接收的音頻信號(hào)中尋找單個(gè)詞匯。由于大多數(shù)語(yǔ)音服務(wù)均樂意接受不含喚醒詞匯的音頻,因此該詞匯不需要指定任何特殊的語(yǔ)音平臺(tái)。因?yàn)閷?shí)現(xiàn)這種功能的要求相對(duì)較低,所以通過利用Sphinx或KITT.AI等開源數(shù)據(jù)庫(kù)在ARM處理器上即可完成操作。

為了聽到你在房間內(nèi)任意位置發(fā)出的聲音,語(yǔ)音識(shí)別設(shè)備采用一個(gè)叫波束成型的流程。最重要的是,通過對(duì)比不同聲音的到達(dá)時(shí)間和麥克風(fēng)間的距離來(lái)確定聲音的來(lái)源。一旦確認(rèn)了目標(biāo)聲音的位置,設(shè)備就會(huì)采用如空間濾波等音頻處理技術(shù)來(lái)進(jìn)一步減少噪音并增強(qiáng)信號(hào)質(zhì)量。波束成型的實(shí)現(xiàn)取決于麥克風(fēng)的布局。真正實(shí)現(xiàn)360度識(shí)別則需要一個(gè)非線性麥克風(fēng)陣列(通常是圓形)。對(duì)于壁掛式設(shè)備而言,僅需兩個(gè)麥克風(fēng)就能啟用180度的空間辨別。

語(yǔ)音助手的最后一招是采用自動(dòng)回波消除(AEC)。AEC在某種程度上類似于噪音消除耳機(jī),但應(yīng)用恰好相反。該算法是利用已知的音樂等輸出音頻信號(hào)來(lái)實(shí)現(xiàn)的。在噪音消除耳機(jī)利用這點(diǎn)來(lái)消除外部雜音,AEC消除了輸出信號(hào)對(duì)輸入信號(hào)在麥克風(fēng)上的影響。該設(shè)備能忽略自身產(chǎn)生的音頻,且無(wú)論揚(yáng)聲器播放何種內(nèi)容,其都仍然能接收。實(shí)現(xiàn)AEC需要大量的計(jì)算,其中在DSP中效果最佳。

為了實(shí)施喚醒識(shí)別、波束成型和AEC等以上提及的所有功能,則要求ARM處理器配合DSP共同工作:DSP增強(qiáng)了所有的信號(hào)處理功能,而ARM處理器控制設(shè)備邏輯和接口。DSP可在執(zhí)行輸入數(shù)據(jù)管路方面發(fā)揮重要的作用,由此最大限度地減少處理的延遲,從而提供更好的用戶體驗(yàn)。ARM可以自由運(yùn)行如Linux等高級(jí)操作系統(tǒng)以控制其它設(shè)備。這樣高級(jí)的功能全部發(fā)生在本地,若使用云服務(wù),將只接收包含最終處理結(jié)果的單個(gè)語(yǔ)音文件。

結(jié)論

語(yǔ)音接口似乎已收獲了超高的人氣,并且將在未來(lái)很長(zhǎng)一段時(shí)間內(nèi)以不同形式出現(xiàn)在我們的生活中。盡管有多種不同的處理方式可以實(shí)現(xiàn)語(yǔ)音接口服務(wù),但無(wú)論你的應(yīng)用需要何種裝置,TI都可以為你提供理想的選擇。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1291

    瀏覽量

    58008
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116134
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    10寸人機(jī)交互裝置引領(lǐng)開關(guān)柜智能運(yùn)維新時(shí)代

    蜀瑞創(chuàng)新推出的人機(jī)交互裝置,以10寸觸摸大彩屏為核心,將十余項(xiàng)功能融于體,正引領(lǐng)著開關(guān)柜人機(jī)交互的深刻變革。
    的頭像 發(fā)表于 03-19 10:03 ?323次閱讀
    10寸<b class='flag-5'>人機(jī)交互</b>裝置引領(lǐng)開關(guān)柜智能運(yùn)維新時(shí)代

    從“人機(jī)交互”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)

    從“人機(jī)交互”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)
    的頭像 發(fā)表于 03-05 11:36 ?195次閱讀
    從“<b class='flag-5'>人機(jī)交互</b>”到“數(shù)字預(yù)演”:詳解 HMI、SCADA 與虛擬調(diào)試的閉環(huán)架構(gòu)

    2026年,如何快速找到適合你企業(yè)的AI+MES切入點(diǎn)?

    2026年,成功的制造企業(yè)不再是那些擁有最多機(jī)器人的企業(yè),而是那些能夠利用AI+MES系統(tǒng),讓數(shù)據(jù)在生產(chǎn)全流程中自動(dòng)流動(dòng)、自動(dòng)決策、自動(dòng)優(yōu)化的企業(yè)。對(duì)于管理者而言,現(xiàn)在的核心任務(wù)不是“要不要做”,而是“如何快速找到適合自身行業(yè)的AI+MES切入點(diǎn)”。
    的頭像 發(fā)表于 02-27 10:40 ?145次閱讀

    中科創(chuàng)達(dá)旗下Rightware攜手高通發(fā)布智能汽車人機(jī)交互解決方案

    在2026年國(guó)際消費(fèi)電子展(CES 2026)上,中科創(chuàng)達(dá)旗下Rightware攜手高通技術(shù)公司正式發(fā)布了款具有開創(chuàng)性的智能汽車人機(jī)交互(HMI)解決方案——IntelliSphere
    的頭像 發(fā)表于 01-16 14:59 ?2031次閱讀

    端到端語(yǔ)音交互革命:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    總監(jiān)孫穎欣在地瓜機(jī)器人的DDC2025 人機(jī)交互分論壇上指出,大模型時(shí)代的交互方式經(jīng)歷了三個(gè)關(guān)鍵階段的演進(jìn):第階段是文本、
    發(fā)表于 12-01 01:07 ?1786次閱讀
    端到端<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>革命:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    CIE全國(guó)RISC-V創(chuàng)新應(yīng)用大賽 呼吸機(jī)人機(jī)交互系統(tǒng)

    原有呼吸機(jī)人機(jī)交互系統(tǒng)基于 imx6Q 芯片進(jìn)行設(shè)計(jì)開發(fā),為進(jìn)步優(yōu)化系統(tǒng)性能、降低硬件成本,并拓展硬件的擴(kuò)展性與兼容性,本次試用選擇進(jìn)迭時(shí)空的 MUSE Pi Pro 開發(fā)板進(jìn)行適配改造,目標(biāo)
    發(fā)表于 11-12 15:07

    眼電EOG人機(jī)交互會(huì)是未來(lái)交互種主流嗎?

    HUIYING基于眼電的人機(jī)交互系統(tǒng)概述基于眼電(EOG)的人機(jī)交互系統(tǒng)(HMI)的研發(fā)源于對(duì)非侵入式、高精度且持久可穿戴的醫(yī)療輔助設(shè)備的需求。傳統(tǒng)人機(jī)交互方式如觸摸屏、操縱桿或基于肌
    的頭像 發(fā)表于 11-07 18:01 ?6075次閱讀
    眼電EOG<b class='flag-5'>人機(jī)交互</b>會(huì)是未來(lái)<b class='flag-5'>交互</b>的<b class='flag-5'>一</b>種主流嗎?

    重構(gòu)未來(lái)自適應(yīng)人機(jī)交互的創(chuàng)新技術(shù)

    人機(jī)交互的概念可以追溯到工業(yè)革命時(shí)期,在當(dāng)時(shí)機(jī)器開始取代人類勞動(dòng)。然而,直到20世紀(jì)中葉,人機(jī)交互領(lǐng)域才受到廣泛關(guān)注。人機(jī)界面(HMI)是人與機(jī)器之間交互的關(guān)鍵
    的頭像 發(fā)表于 10-31 16:30 ?1359次閱讀
    重構(gòu)未來(lái)自適應(yīng)<b class='flag-5'>人機(jī)交互</b>的創(chuàng)新技術(shù)

    邊聊安全 | 人機(jī)交互對(duì)功能安全的影響

    上海磐時(shí)PANSHI“磐時(shí),做汽車企業(yè)的安全智庫(kù)”人機(jī)交互對(duì)功能安全的影響HMI,HumanMachineInterface,也就是大家熟知的人機(jī)接口。近年來(lái),HMI的功能也隨著汽車智能化的發(fā)展
    的頭像 發(fā)表于 09-05 16:21 ?21次閱讀
    邊聊安全 | <b class='flag-5'>人機(jī)交互</b>對(duì)功能安全的影響

    串口屏:重塑人機(jī)交互的開發(fā)革命

    在智能設(shè)備蓬勃發(fā)展的今天,人機(jī)界面已成為產(chǎn)品差異化的關(guān)鍵。傳統(tǒng)GUI開發(fā)需要耗費(fèi)大量時(shí)間在底層驅(qū)動(dòng)和圖形算法上,而串口屏的出現(xiàn),正在徹底改變現(xiàn)狀。 技術(shù)突破:讓交互開發(fā)回歸本質(zhì) 串
    發(fā)表于 08-28 14:56

    人機(jī)交互:連接人類與數(shù)字世界的橋梁

    )等技術(shù)的發(fā)展,人機(jī)交互已經(jīng)從傳統(tǒng)的鍵盤鼠標(biāo)操作,演進(jìn)為語(yǔ)音識(shí)別、手勢(shì)控制、腦機(jī)接口等更自然、更智能的交互方式。 ?
    的頭像 發(fā)表于 08-11 15:21 ?2134次閱讀

    蘇州唯理科技神經(jīng)腕帶肌電臂環(huán)人機(jī)交互演示

    人機(jī)交互
    jf_74911425
    發(fā)布于 :2025年07月08日 22:02:34

    聲智科技全球首發(fā)新一代人機(jī)交互框架

    Moore與Anish Acharya在深度訪談中系統(tǒng)闡釋了"語(yǔ)音交互將成為AI應(yīng)用最具突破潛力的核心接口"這戰(zhàn)略判斷,明確指出在消費(fèi)級(jí)市場(chǎng),語(yǔ)
    的頭像 發(fā)表于 05-12 10:28 ?1152次閱讀
    聲智科技全球首發(fā)新<b class='flag-5'>一代人機(jī)交互</b>框架

    聲學(xué)技術(shù)如何重構(gòu)人機(jī)交互生態(tài)

    人機(jī)交互的底層邏輯。隨著非線性聲學(xué)計(jì)算與強(qiáng)化學(xué)習(xí)的深度融合,聲音交互正從“聽得見”邁向“聽得懂”,并逐漸成為 AI 時(shí)代的重要接口。
    的頭像 發(fā)表于 04-14 13:50 ?1526次閱讀

    零知開源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機(jī)器人是個(gè)基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項(xiàng)目以ESP32開發(fā)板為核心,結(jié)合語(yǔ)音喚醒、自然語(yǔ)言處理、音頻解碼播放及圖形化
    的頭像 發(fā)表于 03-29 15:33 ?1.3w次閱讀
    零知開源——ESP32<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)(AI小智)開發(fā)教程