在設(shè)計(jì)智能音箱和其他語音功能的設(shè)備,例如可穿戴設(shè)備、可聽覺設(shè)備時(shí),開發(fā)者面臨的首要挑戰(zhàn)是如何讓麥克風(fēng)準(zhǔn)確有效地檢測 “Alexa ”和 “Hey Google ”等喚醒詞,以便在云端處理。
當(dāng)DSP Group推出支持語音的語音系統(tǒng)級(jí)芯片(SoC)DBM10時(shí),EDN向該公司SmartVoice芯片的產(chǎn)品經(jīng)理Yosi Brosh提出了這個(gè)問題。這款基于DSP和神經(jīng)網(wǎng)絡(luò)(NN)加速器的雙核SoC,針對(duì)電池設(shè)備中的語音和傳感器處理進(jìn)行了優(yōu)化,如可聽、可穿戴設(shè)備、真正的無線立體聲(TWS)耳機(jī)和智能家居遙控器等。

上圖:用于語音智能產(chǎn)品的DBM10芯片宣稱的采用平臺(tái)方式,具有全面的軟件框架支持。
Brosh表示,像亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)這樣的云平臺(tái)對(duì)在芯片上配置寄存器不感興趣。相反,這些云服務(wù)關(guān)注的是語音算法如何高效檢測喚醒詞。Brosh說“他們希望算法能夠檢測到喚醒詞,而不需要工程師花費(fèi)大量時(shí)間研究和配置芯片上的寄存器?!?/p>
因此,DSP Group開發(fā)了一個(gè)API,使語音檢測算法很容易集成到云服務(wù)中。他補(bǔ)充道;“在某種程度上,云服務(wù)提供商的語音算法成為芯片的黑匣子?!?/p>
通常的做法是,設(shè)備制造商發(fā)布帶有麥克風(fēng)設(shè)置的軟件代碼,并告訴算法提供商如何在麥克風(fēng)驅(qū)動(dòng)中集成算法。以DSP Group的DBM10芯片為例,它使用語音固件采集音頻,使語音采集算法的集成變得高效簡單。
DSP Group一直在與十幾家云公司密切合作,其中包括阿里巴巴、亞馬遜、百度、谷歌和三星,同時(shí)在其芯片上移植他們的語音算法。據(jù)Brosh介紹,該公司在某些情況下還提供一套完整的軟件。
該芯片能夠?yàn)橄到y(tǒng)設(shè)計(jì)人員提供簡單的部署路徑,Brosh表示,公司對(duì)運(yùn)行在DBM10語音接口芯片上軟件的支持一直提供到生產(chǎn)層面,“系統(tǒng)工程師不需要編寫一行代碼”。
這就是為什么DSP Group稱其DBM10芯片為完整解決方案的原因。該SoC通過通用DSP和名為nNetLite的神經(jīng)網(wǎng)絡(luò)處理器對(duì)音頻算法以及傳感AI算法進(jìn)行了優(yōu)化。除此以外DSP Group還提供運(yùn)行在Wi-Fi芯片上用于與DBM10芯片進(jìn)行通信的額外驅(qū)動(dòng)程序。
SoC還具有跨平臺(tái)的工具鏈,支持所有常用的人工智能(AI)和機(jī)器學(xué)習(xí)(ML)框架,以簡化算法部署。工程師們可以開發(fā)、訓(xùn)練和測試算法,然后將算法以標(biāo)準(zhǔn)格式保存,工具鏈會(huì)將其提取并創(chuàng)建一個(gè)圖像,下載到SoC中。
上圖:nNetLite編譯器可以快速優(yōu)化、修剪和部署任何框架的AI/ML模型到DBM10 SoC。
該SoC的外形尺寸很小,只有4平方毫米,可以進(jìn)入像智能手表這樣的極小設(shè)備。同樣,在SoC的神經(jīng)網(wǎng)絡(luò)nNetLite引擎上運(yùn)行的始終處于開啟狀態(tài)的wake word算法只消耗幾微瓦的電能。
編輯:lyn
-
語音
+關(guān)注
關(guān)注
3文章
405瀏覽量
39810 -
算法
+關(guān)注
關(guān)注
23文章
4785瀏覽量
98116 -
云服務(wù)
+關(guān)注
關(guān)注
0文章
860瀏覽量
40701
原文標(biāo)題:簡化云服務(wù)的語音檢測算法部署
文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
什么是企業(yè)云服務(wù)器-云計(jì)算
Cypress賽普拉斯FRAM增強(qiáng)車載黑匣子EDR抗干擾能力
深度解析ISO27017云服務(wù)信息安全管理體系認(rèn)證咨詢代辦機(jī)構(gòu)推薦排名TOP5
ISO27017云服務(wù)信息安全管理體系認(rèn)證辦理咨詢代辦公司機(jī)構(gòu)口碑榜!
由Memfault賦能的Nordic-nRF Cloud云服務(wù)將硬核加持物聯(lián)網(wǎng)通信應(yīng)用
智能核心網(wǎng)如何助力通信服務(wù)提供商發(fā)展業(yè)務(wù)
打破“黑匣子”:RFID技術(shù)實(shí)現(xiàn)危險(xiǎn)生物樣本全程可視化與無感溯源
Jtti云服務(wù)器上怎么部署網(wǎng)站嗎
如何將設(shè)USB存儲(chǔ)設(shè)備設(shè)為只讀?
飛音科技成為普華基礎(chǔ)軟件開源小滿認(rèn)證服務(wù)提供商
推進(jìn)一款實(shí)用型的OTP語音芯片
極海半導(dǎo)體榮獲2025年度創(chuàng)新車規(guī)級(jí)芯片提供商
航芯榮獲「2025年度芯片安全性能優(yōu)秀提供商」獎(jiǎng)項(xiàng)
云服務(wù)提供商的語音算法成為芯片的黑匣子
評(píng)論