91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音喚醒技術(shù)的對比,語音喚醒技術(shù)哪家強(qiáng)

語音技術(shù)智能匯 ? 來源:語音技術(shù)智能匯 ? 作者:語音技術(shù)智能匯 ? 2022-03-23 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編輯導(dǎo)語:

隨著語音交互技術(shù)的日漸成熟,越來越多的智能硬件都選擇增加語音能力作為產(chǎn)品賣點(diǎn)之一。但是,設(shè)備在進(jìn)入語音交互工作狀態(tài)的時候,需要先進(jìn)行喚醒操作。

常見的喚醒語音交互的操作有按鍵或者觸屏形式,但是,為了進(jìn)一步降低學(xué)習(xí)成本和操作復(fù)雜度,也有不少的智能硬件選擇通過語音喚醒的方式來激活交互功能。

本文將綜合對比市面上各家提供的語音喚醒技術(shù)相關(guān)指標(biāo),可以幫助你快速掌握語音喚醒技術(shù)的情況。

一、語音喚醒技術(shù)的相關(guān)核心指標(biāo)

1、喚醒率

語音喚醒的主要目的既然是激活設(shè)備進(jìn)入交互工作狀態(tài),那么,喚醒率的高低就顯得額外重要了。理論上,最好的狀態(tài)就是我只要說一次喚醒詞,設(shè)備就能立即響應(yīng)。不過,受說話人與設(shè)備距離、發(fā)音標(biāo)準(zhǔn)、噪聲等各種各樣的因素,實(shí)際工作中比較難達(dá)到次次響應(yīng)的完美工作狀態(tài)。

一般來說,在近距離的安靜場景下,市面上的技術(shù)都能夠做到喚醒率在95%以上。

不過,消費(fèi)者的實(shí)際使用場景是較復(fù)雜的,因此,需要模擬不同的應(yīng)用場景進(jìn)行實(shí)測,才能得到最后的喚醒率指標(biāo)。

2、誤喚醒率

指設(shè)備被非喚醒詞喚醒的概率,誤喚醒率越高,效果越不好。

大家在日常生活中可能會經(jīng)常碰到,放在家里的智能音箱,大晚上莫名其妙答一句“我在”,把人嚇個半死;還有如果家里用的智能電視,喚醒手機(jī)語音助手的時候,不是同一個喚醒詞,電視也會蹦出一句“我在”。

這就是典型的誤喚醒場景,一般用24小時被誤喚醒多少次來衡量。

3、響應(yīng)時長

主要是指用戶說完喚醒詞后,設(shè)備給出反饋的耗時,一般越短越好。

而反饋的形式則比較多樣,可以通過語音應(yīng)答響應(yīng)、也可以通過亮屏或者指示燈閃爍響應(yīng)。統(tǒng)計(jì)來看,如果是亮屏或者指示燈閃爍響應(yīng),控制在200ms以內(nèi)用戶體驗(yàn)較好;如果是語音應(yīng)答響應(yīng),太快反而體驗(yàn)不好,一般控制在500ms左右更佳。

4、功耗

主要是針對電池供電設(shè)備,理論上越低越好,這樣,設(shè)備的使用時長不會受到太大的影響。

因?yàn)閱拘训?a target="_blank">工作原理是會持續(xù)檢測聲音中是否包含喚醒詞的特定片段,所以,會持續(xù)耗電。

為了進(jìn)一步降低功耗,部分產(chǎn)品也會采取DSP來完成語音喚醒,再通過AP層兜底的模式,保證喚醒和功耗的均衡。

總結(jié):語音喚醒的技術(shù)指標(biāo),除了與算法相關(guān)之外,還與智能硬件的結(jié)構(gòu)設(shè)計(jì)、芯片算力、使用場景等息息相關(guān)。最后的實(shí)際效果,則應(yīng)以實(shí)際測試效果為準(zhǔn),參考下圖:

二、語音喚醒技術(shù)對比

該對比信息均從互聯(lián)網(wǎng)公開渠道獲取,相關(guān)信息來源于提供商官網(wǎng)公開信息,如其官網(wǎng)有更新,請以更新信息為準(zhǔn)。(PS:百度搜索關(guān)鍵詞“語音喚醒”)

poYBAGI6i66AIXdTAAn5A2rKJxY710.png

三、喚醒詞的區(qū)別

喚醒詞的定義實(shí)際是比較廣泛,至少包含了四種使用場景:品牌喚醒詞(如,小飛小飛)、離線命令詞(如,我要聽周杰倫的歌)、云端命令詞(如,我要聽周杰倫的歌)、免喚醒詞(如,下一首、暫停)。這些使用場景,實(shí)際上都是使用了喚醒詞的原理,只是喚醒后執(zhí)行不同的動作。

四、語音喚醒項(xiàng)目實(shí)施要點(diǎn)

1、喚醒詞評估

大部分服務(wù)商都提供了喚醒詞評估服務(wù),不過,有部分服務(wù)商對喚醒詞有一定的限制。因此,在選擇喚醒詞的時候,需要充分考慮品牌、發(fā)音特點(diǎn)、詞語等因素,綜合確定最終的喚醒詞。

2、確認(rèn)測試環(huán)境和工具

以以往交付的喚醒項(xiàng)目來看,主要測試的環(huán)境包括:外噪場景測試、自噪場景測試、安靜場景測試和誤喚醒測試。

3、聲音采集

根據(jù)產(chǎn)品主要面向的使用人群,采集真人發(fā)音音頻。

示例:【某某投影儀音頻采集需求】

  • 采集人數(shù)200人,總音頻2000句
  • 男女比=1:1
  • 一人10句
  • 語速快:中:慢=1:3:1
  • 年齡兒童:青年:中年=1:3:1
  • 區(qū)域:北上廣深
  • 普通話

4、測試音頻處理

包括去除破音的音頻、去除時長>1.7s的測試音頻、音頻幅度歸一化。

5、數(shù)據(jù)記錄表

根據(jù)實(shí)測結(jié)果,如實(shí)填寫表格中對應(yīng)測試結(jié)果,完成項(xiàng)目驗(yàn)收。

如果需要更深入地咨詢了解,可添加筆者V:HolaAI,詳細(xì)交流。

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    512

    瀏覽量

    29679
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    352

    瀏覽量

    29175
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    MAC CE技術(shù)為什么能調(diào)整語音編碼速率

    隨著NR網(wǎng)絡(luò)的快速發(fā)展,5G語音業(yè)務(wù)快速增加,5G支持高清語音,需要從技術(shù)上讓語音編碼適應(yīng)網(wǎng)絡(luò)覆蓋的技術(shù),商用外場這種訴求越發(fā)強(qiáng)烈,VoNR
    的頭像 發(fā)表于 12-19 16:52 ?689次閱讀
    MAC CE<b class='flag-5'>技術(shù)</b>為什么能調(diào)整<b class='flag-5'>語音</b>編碼速率

    新品 | Module ASR,AI智能離線語音模塊

    新的指令。內(nèi)置AEC(回聲消除),有效去除回聲和噪聲干擾,提升語音識別準(zhǔn)確性。產(chǎn)品出廠時預(yù)設(shè)了53條英文喚醒詞和反饋命令詞,支持通過UART指令或語音關(guān)鍵詞喚醒設(shè)
    的頭像 發(fā)表于 12-05 18:15 ?692次閱讀
    新品 | Module ASR,AI智能離線<b class='flag-5'>語音</b>模塊

    智能語音識別控制器是什么?圖形中文編程,多路設(shè)備控制

    智能語音識別控制器是一種融合語音識別技術(shù)、物聯(lián)網(wǎng)通信技術(shù)與設(shè)備控制模塊的智能終端設(shè)備,核心功能是將人類自然語言指令轉(zhuǎn)化為設(shè)備可執(zhí)行的電信號,實(shí)現(xiàn)對各類終端設(shè)備的
    的頭像 發(fā)表于 12-03 16:35 ?694次閱讀

    揭秘AI玩具“聽得清”的秘密!這幾款語音前端芯片撐起交互體驗(yàn)天花板

    、混響,而主控SoC的算力/功耗/實(shí)時性都扛不住這些7×24的AEC+NR+Beamforming+喚醒運(yùn)算;前端芯片把“干凈的人聲”先截出來,再送給主控或云端,才能保證打斷喚醒、低誤觸發(fā)、低功耗三樣同時成立。 ? 因此,目前AI玩具中,一款好的
    的頭像 發(fā)表于 10-17 08:42 ?1w次閱讀

    強(qiáng)智能語音技術(shù)重新定義車載交互邊界

    強(qiáng)憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術(shù)
    的頭像 發(fā)表于 07-11 14:00 ?1178次閱讀

    智芯科超低功耗離線語音喚醒芯片的應(yīng)用場景

    想讓設(shè)備無需聯(lián)網(wǎng)也能秒速響應(yīng)語音指令?我們的超低功耗離線語音喚醒芯片正是答案!采用前沿技術(shù),待機(jī)能耗近乎“休眠”,續(xù)航焦慮一掃而空,智能穿戴、智能家居等設(shè)備電量更持久。
    的頭像 發(fā)表于 07-08 10:24 ?1363次閱讀

    告別 “起床氣”!NV340D 語音芯片解鎖電子鬧鐘喚醒新體驗(yàn)!

    在快節(jié)奏的現(xiàn)代生活中,電子鬧鐘作為我們每天清晨的“喚醒伙伴”,其重要性不言而喻。如今,隨著科技的飛速發(fā)展,電子鬧鐘也在不斷進(jìn)化,功能日益豐富。而這背后,離不開關(guān)鍵技術(shù)——語音芯片的強(qiáng)力支持
    的頭像 發(fā)表于 07-05 11:09 ?1272次閱讀
    告別 “起床氣”!NV340D <b class='flag-5'>語音</b>芯片解鎖電子鬧鐘<b class='flag-5'>喚醒</b>新體驗(yàn)!

    芯知識|廣州唯創(chuàng)電子WT2003H語音芯片:智能低功耗,喚醒隨心控

    在電池供電或?qū)拿舾械?b class='flag-5'>語音應(yīng)用場景中,WT2003H語音芯片憑借其精心設(shè)計(jì)的雙模式低功耗休眠架構(gòu),為開發(fā)者提供了靈活高效的節(jié)能解決方案,顯著延長設(shè)備續(xù)航時間。核心低功耗模式解析深度休眠模式
    的頭像 發(fā)表于 06-30 08:52 ?588次閱讀
    芯知識|廣州唯創(chuàng)電子WT2003H<b class='flag-5'>語音</b>芯片:智能低功耗,<b class='flag-5'>喚醒</b>隨心控

    語音助手只能聊天?啟明云端AI語音交互方案偷偷修煉了音樂才藝!

    設(shè)備演示:技術(shù)落地的全景呈現(xiàn)在實(shí)測場景中,搭載樂鑫科技ESP32-S3芯片的“賽博地平線”手辦伴侶率先登場,響應(yīng)指令。通過深度整合豆包大模型,用戶通過喚醒詞即可實(shí)現(xiàn)
    的頭像 發(fā)表于 06-27 18:03 ?929次閱讀
    <b class='flag-5'>語音</b>助手只能聊天?啟明云端AI<b class='flag-5'>語音</b>交互方案偷偷修煉了音樂才藝!

    AI語音開發(fā)板AiPi-PalChatV1教程:常見問題

    集成度、高性價比等特性,支持 離線語音喚醒語音打斷 功能。 此款開發(fā)板結(jié)合 2W/8Ω 揚(yáng)聲器與雙供電模式(Type-C + 電池),適用于快速部署語音交互能力的硬件創(chuàng)新場景,如
    的頭像 發(fā)表于 06-18 15:27 ?1098次閱讀
    AI<b class='flag-5'>語音</b>開發(fā)板AiPi-PalChatV1教程:常見問題

    可編程SLIC語音芯片哪家好?

    在當(dāng)今數(shù)字化快速發(fā)展的時代,語音芯片的應(yīng)用越來越廣泛,而可編程SLIC(用戶線路接口電路)語音芯片更是憑借其獨(dú)特的優(yōu)勢,受到眾多行業(yè)的青睞。那么,面對眾多的選擇,哪家的可編程SLIC語音
    的頭像 發(fā)表于 06-12 13:55 ?755次閱讀
    可編程SLIC<b class='flag-5'>語音</b>芯片<b class='flag-5'>哪家</b>好?

    小安AI語音板,“廣西表哥”強(qiáng)勢上線!

    集成度、高性價比等特性,支持 離線語音喚醒語音打斷 功能。 此款開發(fā)板結(jié)合 2W/8Ω 揚(yáng)聲器與雙供電模式(Type-C + 電池),適用于快速部署語音交互能力的硬件創(chuàng)新場景,如
    的頭像 發(fā)表于 06-10 17:30 ?757次閱讀
    小安AI<b class='flag-5'>語音</b>板,“廣西表哥”強(qiáng)勢上線!

    芯資訊|基于廣州唯創(chuàng)電子語音芯片的煙霧報(bào)警器語音方案技術(shù)解析

    了三大煙霧報(bào)警器語音方案,覆蓋傳統(tǒng)、高集成度與智能化需求,為不同場景提供靈活選擇。以下從技術(shù)特性、應(yīng)用場景及行業(yè)價值三方面展開分析。一、方案對比技術(shù)特性方案類型核
    的頭像 發(fā)表于 04-21 08:54 ?733次閱讀
    芯資訊|基于廣州唯創(chuàng)電子<b class='flag-5'>語音</b>芯片的煙霧報(bào)警器<b class='flag-5'>語音</b>方案<b class='flag-5'>技術(shù)</b>解析

    強(qiáng)信息入選2024語音識別技術(shù)公司TOP30榜單

    強(qiáng)憑借在語音識別領(lǐng)域多年的技術(shù)積淀與持續(xù)的創(chuàng)新突破,成功入選“2024語音識別技術(shù)公司TOP30”榜單。作為行業(yè)標(biāo)桿,普
    的頭像 發(fā)表于 04-18 17:25 ?1219次閱讀

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機(jī)器人是一個基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項(xiàng)目以ESP32開發(fā)板為核心,結(jié)合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實(shí)現(xiàn)人機(jī)交互功能
    的頭像 發(fā)表于 03-29 15:33 ?1.2w次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b>交互系統(tǒng)(AI小智)開發(fā)教程