91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音控制的算法和硬件功率上升

龍獻(xiàn)益 ? 來源:uwjfuwer ? 作者:uwjfuwer ? 2022-07-15 15:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語音控制和語音界面已經(jīng)開始無情地滲透到幾乎所有的消費(fèi)邊緣設(shè)備類別。語音識別算法AI 加速器硬件的進(jìn)步意味著該技術(shù)甚至可以用于智能家居設(shè)備(甚至是一些愚蠢的設(shè)備)等功率和成本受限的應(yīng)用程序。

從用戶端來看,智能家居設(shè)備語音控制背后的驅(qū)動(dòng)力是顯而易見的。

PicoVoice 首席執(zhí)行官 Alireza Kenarsari-Anhari 告訴 EE Times:“易用性和便利性是目前的主要驅(qū)動(dòng)力?!?很容易想象當(dāng)你想要一杯咖啡時(shí),你可以從辦公桌上對著家庭辦公室的咖啡機(jī)大喊大叫,或者拿著一籃濕衣服向滾筒式烘干機(jī)口述訂單。

我們假設(shè)像這些非便攜式的智能設(shè)備可以永久訪問家庭的 WiFi 連接——那么為什么不在云中進(jìn)行這種語音處理呢?

在這種情況下,邊緣人工智能的趨勢主要是由隱私驅(qū)動(dòng)的,Kenarsari-Anhari 說這是消費(fèi)者的擔(dān)憂,但對一些企業(yè)來說是必須的??煽啃允橇硪粋€(gè)驅(qū)動(dòng)因素:“如果您的 WiFi 不工作,您的洗衣機(jī)停止工作是否有意義?” 他說。

在某些情況下,延遲也很重要;某些應(yīng)用程序確實(shí)需要語音工作負(fù)載處理的實(shí)時(shí)保證,例如游戲。

成本是語音邊緣處理的另一個(gè)重要驅(qū)動(dòng)因素,因?yàn)樵谠浦刑幚磉@些語音數(shù)據(jù)需要花錢。每次使用云 API 時(shí)都付費(fèi)的商業(yè)模式不適用于家電和消費(fèi)電子等成本低且每天可能多次使用的用例。

PicoVoice 的 AI 語音到文本推理引擎被設(shè)計(jì)為在低于 1 美元的微控制器上獨(dú)立于云運(yùn)行,旨在在原本不可行的應(yīng)用程序中實(shí)現(xiàn)語音控制。這可能包括消費(fèi)類可穿戴設(shè)備和可聽設(shè)備,它們正處于需要基于微控制器的語音解決方案可以實(shí)現(xiàn)的功率效率和成本效率的交叉點(diǎn)。Kenarsari-Anhari 說,功率和成本優(yōu)化的解決方案還可以釋放工業(yè)、安全和醫(yī)療應(yīng)用的機(jī)會(huì)。

該公司最近推出了 Shepherd,這是一個(gè)用于在微控制器上構(gòu)建語音應(yīng)用程序的無代碼平臺(tái),可與該公司的模型創(chuàng)建軟件 PicoVoice Console 配合使用。Shepherd 支持 ST 和 NXP 的流行 Arm Cortex-M 微控制器,并支持正在開發(fā)的其他設(shè)備。

“我認(rèn)為語音是一個(gè)界面——如果你可以在不編碼的情況下構(gòu)建你的 GUI 或網(wǎng)站,也許使用 WordPress,以類似的方式構(gòu)建語音界面是下一個(gè)合乎邏輯的步驟,”Kenarsari-Anhari 說?!癝hepherd 正在授權(quán)產(chǎn)品經(jīng)理和 UX 設(shè)計(jì)師構(gòu)建原型并快速迭代,但我們的目標(biāo)是擴(kuò)大其目標(biāo)用戶群。如果每個(gè)人都可以建立自己的助手會(huì)怎樣?將其命名為他們想要的名稱 - 而不是 Alexa!——并賦予它他們想要的個(gè)性?!?/p>

雖然開發(fā)自然語言處理模型并在沒有專業(yè)軟件的情況下實(shí)現(xiàn)它們是完全可能的,但這條路線并不適合所有人。

“當(dāng)然可以——蘋果、亞馬遜、谷歌和微軟做到了,”他說?!斑@真的是關(guān)于一個(gè)企業(yè)是否有資源,是否致力于圍繞它建立一個(gè)組織,是否有能力等待幾年?!?/p>

未來的趨勢

語音正在成為下一代技術(shù)用戶的首選界面,Syntiant 的首席執(zhí)行官 Kurt Busch 在去年夏天接受 EE Times 采訪時(shí)表示。

Busch 描述了他最小的孩子是如何使用智能手機(jī)上的語音界面與他的朋友發(fā)短信的,他可以閱讀,但對于寫作和拼寫還太小。

“他的哥哥姐姐們發(fā)短信,但他這一代人比他們早幾年有了手機(jī),”布施說?!半S著時(shí)間的流逝,對于他這一代和年輕一代來說,他們的默認(rèn)界面是與它交談?!?/p>

Busch 的觀點(diǎn)是,語音將成為“未來的觸摸屏”,設(shè)備內(nèi)處理首先在具有鍵盤或鼠標(biāo)的設(shè)備中提供快速響應(yīng)的界面,然后在白色家電中提供。

Syntiant 的芯片是專門的 AI 加速器,旨在處理功耗預(yù)算低至極低的消費(fèi)電子設(shè)備中的語音 AI 工作負(fù)載。迄今為止,這家初創(chuàng)公司已在全球出貨超過 1000 萬顆芯片,其中大部分已進(jìn)入手機(jī)以實(shí)現(xiàn)始終在線的關(guān)鍵字檢測。最新的 Syntiant 芯片NDP120可以識別“OK Google”等熱詞,以低于 280 μW 的功率激活 Google 助手。

在未來,Busch 還看到語音控制能夠?yàn)槊總€(gè)人實(shí)現(xiàn)連接和訪問技術(shù)。

“我們將聲音視為技術(shù)的偉大民主化者,”布希說?!笆澜缟嫌?30 億人每天靠 2 美元過活。我的假設(shè)是那些人沒有互聯(lián)網(wǎng)接入,可能沒有通過教育系統(tǒng)。這里的自然界面是[speech]。這就是您如何將技術(shù)帶入當(dāng)今未與技術(shù)交互的第三個(gè)世界。我們看到發(fā)展中國家對語音優(yōu)先應(yīng)用程序產(chǎn)生了濃厚的興趣,以獲取以前可能無法訪問的社會(huì)群體,不僅從費(fèi)用的角度來看,而且從舒適的角度來看?!?/p>

市場分割

Knowles 的物聯(lián)網(wǎng)高級總監(jiān) Vikram Shirastava 告訴 EE Times,一個(gè)與語音一樣快速增長的市場的危險(xiǎn)在于,它可能會(huì)迅速變得極其分散,而不僅僅是硬件產(chǎn)品線。

“市場變得支離破碎,比如說,使用的是什么語音識別引擎?” 希拉斯塔瓦說?!笆袌鰰?huì)變得支離破碎,這取決于您是與電視 SoC 集成還是內(nèi)部是簡單的 MCU,例如微波爐。您會(huì)根據(jù)操作系統(tǒng)或聲學(xué)環(huán)境獲得碎片——它只是家嗎?是外面的門鈴嗎?不可能有一種萬能的解決方案。你必須找到這些垂直領(lǐng)域的共同點(diǎn),并嘗試相應(yīng)地解決語音整合問題。”

Knowles 有一個(gè)基于 DSP 的語音控制解決方案,它打算為不同的垂直行業(yè)推出版本。它的方法是將市場碎片歸為具有共同點(diǎn)的市場——例如,家庭控制、電視條形音箱和遙控器可能屬于同一組——然后開發(fā)針對該組應(yīng)用進(jìn)行優(yōu)化的解決方案。Shirastava 將這種方法稱為“比統(tǒng)包低一級”,它提供統(tǒng)包的可擴(kuò)展性,但增加了一些靈活性。

“我們必須有一些不同的版本來解決這種碎片化的某個(gè)方面,以便我們能夠覆蓋我們想要追求的垂直領(lǐng)域,”他說。

Knowles 最近發(fā)布的 AISonic 藍(lán)牙標(biāo)準(zhǔn)解決方案是一款用于藍(lán)牙連接設(shè)備(如智能揚(yáng)聲器、智能家居設(shè)備、可穿戴設(shè)備和車載語音助手)的語音識別開發(fā)套件。該套件基于 Knowles 的 IA8201 雙核 DSP 芯片,該芯片專為神經(jīng)網(wǎng)絡(luò)處理而設(shè)計(jì),功耗遠(yuǎn)低于應(yīng)用處理器。例如,該芯片可以在 50 mW 以下同時(shí)處理用于關(guān)鍵字定位、源分類、波束形成、聲學(xué)回聲消除 (AEC) 和源方向估計(jì)的單獨(dú) AI 模型。這是通過在 Tensilica DSP 內(nèi)核上用于音頻和 AI 處理的近 400 條自定義指令的指令集擴(kuò)展實(shí)現(xiàn)的,這反過來又允許降低時(shí)鐘頻率以節(jié)省功耗。

語音最終會(huì)成為大多數(shù)消費(fèi)類電子產(chǎn)品的默認(rèn)用戶界面嗎?看起來確實(shí)是這樣。先進(jìn)、高效的 AI 語音控制算法、使開發(fā)人員能夠輕松集成語音的開發(fā)環(huán)境以及不斷增長的能源和成本效益硬件解決方案生態(tài)系統(tǒng)的組合已經(jīng)出現(xiàn),使這一切成為可能。



審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98082
  • 功率
    +關(guān)注

    關(guān)注

    14

    文章

    2120

    瀏覽量

    75616
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    512

    瀏覽量

    29679
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    探索SPOC?+2多通道SPI高端功率控制器:從硬件搭建到軟件應(yīng)用

    探索SPOC?+2多通道SPI高端功率控制器:從硬件搭建到軟件應(yīng)用 作為電子工程師,我們經(jīng)常會(huì)遇到各種需要精確控制功率的場景。今天,我將和大
    的頭像 發(fā)表于 12-20 14:25 ?813次閱讀

    安信可小智AI語音模組實(shí)測:實(shí)現(xiàn)語音控制關(guān)燈

    以下作品由安信可社區(qū)用戶 zzbinfo 制作 ? 這次評測的是安信可科技出品的Ai-WV01-32S的小智AI語音模組。 將從 開箱、配網(wǎng)、語音測試 ,到最終通過 串口指令控制 一個(gè)真實(shí)的LED燈
    的頭像 發(fā)表于 11-19 16:09 ?1087次閱讀
    安信可小智AI<b class='flag-5'>語音</b>模組實(shí)測:實(shí)現(xiàn)<b class='flag-5'>語音</b><b class='flag-5'>控制</b>關(guān)燈

    基于安信可Ai-WV01-32S模組打造的小智語音硬件

    基于安信可 Ai-WV01-32S 模組打造的小智語音硬件。
    的頭像 發(fā)表于 11-13 17:33 ?1550次閱讀
    基于安信可Ai-WV01-32S模組打造的小智<b class='flag-5'>語音</b><b class='flag-5'>硬件</b>

    什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點(diǎn))

    離線語音識別芯片,是一種集成了語音信號采集、前端處理和本地識別功能的專用集成電路,無須聯(lián)網(wǎng)也可以進(jìn)行語音控制。它內(nèi)設(shè)先進(jìn)的數(shù)字信號處理模塊及人工智能
    的頭像 發(fā)表于 10-31 15:27 ?518次閱讀

    廣州唯創(chuàng)電子WTK6900H-32N語音識別芯片:AI降噪算法助力抽油煙機(jī)精準(zhǔn)語音控制 | 語音IC廠家

    語音識別領(lǐng)域深厚的技術(shù)積累,推出的WTK6900H-32N語音識別芯片結(jié)合創(chuàng)新的AI語音降噪算法,成功攻克了這一技術(shù)難題,為智能廚房的發(fā)展打開了新的局面。一、突
    的頭像 發(fā)表于 10-30 09:17 ?391次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N<b class='flag-5'>語音</b>識別芯片:AI降噪<b class='flag-5'>算法</b>助力抽油煙機(jī)精準(zhǔn)<b class='flag-5'>語音</b><b class='flag-5'>控制</b> | <b class='flag-5'>語音</b>IC廠家

    復(fù)雜的軟件算法硬件IP核的實(shí)現(xiàn)

    Compiler)將算法編譯轉(zhuǎn)化為可綜合的 Verilog 文本,進(jìn)而通過 FPGA 在硬件上實(shí)現(xiàn)算法。 1.C to Hardware 技術(shù)簡介 AltiumDesigner
    發(fā)表于 10-30 07:02

    BLDC與PMSM電機(jī)控制算法的聯(lián)系與區(qū)別

    降低了硬件成本和傳感器故障風(fēng)險(xiǎn),但存在技術(shù)門檻高、位置估算有延遲和誤差、動(dòng)態(tài)響應(yīng)性能不及帶傳感器FOC等缺點(diǎn)。其控制精度和魯棒性通常介于六步換相法和有傳感器FOC之間。 三、 算法與電機(jī)的典型搭配
    發(fā)表于 10-27 09:23

    AI的核心操控:從算法硬件的協(xié)同進(jìn)化

    ? ? ? ?人工智能(AI)的核心操控涉及算法、算力和數(shù)據(jù)三大要素的深度融合,其技術(shù)本質(zhì)是通過硬件與軟件的協(xié)同優(yōu)化實(shí)現(xiàn)對復(fù)雜任務(wù)的自主決策與執(zhí)行。這一過程依賴多層技術(shù)棧的精密配合,從底層的芯片架構(gòu)
    的頭像 發(fā)表于 09-08 17:51 ?993次閱讀

    增加語音控制功能關(guān)注這幾顆芯片輕松搞定

    增加語音控制功能關(guān)注這幾顆芯片輕松搞定 目前感覺幾乎所有的頭部或者非頭部的產(chǎn)品都在爭先恐后的上語音控制功能,產(chǎn)品單價(jià)高的上離在線AI對話功能,產(chǎn)品單價(jià)低的上離線
    的頭像 發(fā)表于 08-19 16:46 ?934次閱讀

    瑞芯微RK3576語音識別算法

    字符序列。與說話人識別及說話人確認(rèn)不同,后者嘗試識別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。我們的語音算法是基于Whisper是OpenAI設(shè)計(jì)的。Whis
    的頭像 發(fā)表于 08-15 15:13 ?2196次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b>識別<b class='flag-5'>算法</b>

    語音輸出模塊是什么?自控語音播報(bào)

    :接收來自云平臺(tái)(如單片機(jī)/PLC/電腦)的指令,輸入可能是:文本數(shù)據(jù)(例如:"溫度過高")、預(yù)存語音編碼(如MP3/WAV文件的數(shù)字信號)、控制指令(觸發(fā)預(yù)置語音片段) 2.語音合成
    的頭像 發(fā)表于 08-13 15:20 ?932次閱讀

    信號發(fā)生器如何與波束賦形算法配合優(yōu)化?

    優(yōu)化方法1. 硬件級配合:信號發(fā)生器與MIMO測試平臺(tái)集成 系統(tǒng)架構(gòu): 信號發(fā)生器 → 功率放大器 → MIMO信道仿真器 → 待測設(shè)備(DUT,含波束賦形算法) → 數(shù)據(jù)分析儀 關(guān)鍵組件: 多
    發(fā)表于 08-08 14:41

    語音控制模塊工作原理

    語音控制芯片或者說模塊的應(yīng)用前景越來越廣泛,無論是設(shè)計(jì)方案還是廠家生產(chǎn)的產(chǎn)品在越來越多越來越頻繁的使用語音控制芯片。當(dāng)然行業(yè)內(nèi)更多的是稱呼為語音
    的頭像 發(fā)表于 06-17 11:49 ?1386次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>控制</b>模塊工作原理

    電機(jī)技術(shù)資料—BLDC 電機(jī)控制算法

    電機(jī)時(shí),冰箱和空調(diào)壓縮機(jī)也需要無傳感器控制。 死區(qū)的插入和補(bǔ)充 許多不同的控制算法都被用以提供對于BLDC電機(jī)的控制。典型地, 將功率晶體管
    發(fā)表于 04-01 16:43

    SVPWM的原理及法則推導(dǎo)和控制算法詳解

    SVPWM 是近年發(fā)展的一種比較新穎的控制方法,是由三相功率逆變器的六個(gè)功率開關(guān)元件組成的特定開關(guān)模式產(chǎn)生的脈寬調(diào)制波,能夠使輸出電流波形盡 可能接近于理想的正弦波形??臻g電壓矢量 PWM 與傳統(tǒng)
    發(fā)表于 03-14 14:51