91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

離線語音進入快車道,啟英泰倫發(fā)布全新AI語音芯片!

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-08-05 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)語音識別人工智能的重要分支之一,早在2010年開始就得到發(fā)展,并且逐漸在各個領域成熟應用。不過AI語音芯片和算法的研發(fā)仍然面臨眾多難題,不少企業(yè)為此堅持研究,不斷對技術(shù)和產(chǎn)品進行迭代升級,以求取得突破。

啟英泰倫是國內(nèi)領先的AI語音芯片企業(yè),日前,該公司正式發(fā)布了全新的第三代智能語音芯片系列,相比于上一代產(chǎn)品,這款芯片創(chuàng)下了算力更高、高度集成和算法新高的記錄,進一步解決了業(yè)界長久以來難以突破的難題。

AI語音芯片研發(fā)面臨哪些難題

近幾年,AI語音芯片在智能家居、智能車載、智能穿戴等領域的滲透率快速提升,未來隨著技術(shù)的不斷迭代,AI語音芯片在各領域的滲透率和市場規(guī)模將會持續(xù)擴大。

智能家居方面,當前隨著AI語音芯片的價格已經(jīng)大幅下降,越來越多的廠商傾向于采用AI語音芯片,來替代傳統(tǒng)的AP及MCU芯片和IOT芯片,如今AI語音芯片在風扇、茶吧機、取暖桌、空調(diào)、插座等眾多領域已經(jīng)開始大規(guī)模批量應用。根據(jù)調(diào)研數(shù)據(jù)預測,未來5年AI語音芯片在智能家居領域的市場規(guī)模將能達到每年2.5億顆。

智能汽車方面,目前智能汽車中的語音交互多是在云端進行識別處理,然而云端的方式存在無法實時響應、網(wǎng)絡無連接時不能使用等問題,因此業(yè)界認為端側(cè)語音芯片將會很好的補充云端芯片的不足,預計未來端側(cè)AI語音芯片在車載領域的市場需求每年能達到1億顆左右。

智能穿戴方面,未來隨著芯片尺寸越來越小,成本越來越低,AI語音芯片在穿戴設備上的應用將會越來越多,預計該市場對AI語音芯片的市場需求每年會在千萬顆左右。

除了上述市場之外,AI語音芯片還可以在醫(yī)療設備、機器人、工業(yè)檢測等領域得到應用,整體來看,預計未來幾年AI語音芯片的市場規(guī)模將會快速發(fā)展到每年5到10億顆,隨著應用不斷拓寬和滲透率不斷提升,市場規(guī)??赡苓€將持續(xù)不斷提升。

雖然存在較大的市場,然而企業(yè)在AI語音識別芯片和算法的研發(fā)也面臨眾多需要不斷攻克的難題,在此次發(fā)布會上,啟英泰倫創(chuàng)始人兼CEO何云鵬提到了幾點:



1、各種應用場景存在復雜的背景噪聲,會影響識別,比如廚電的煙機噪聲、炒菜聲,客廳的電視聲、音樂聲,會場的多人聲、賣場的高音喇叭聲等;2、人類語言種類繁多,如果考慮各地的方言口音,幾乎沒辦法通過大數(shù)據(jù)訓練模型,來滿足所有地域口音的識別;3、人類語言的表達非常豐富,要想在設備端實現(xiàn)對任意語言表達的意圖理解,也十分困難。

同時,電子設備的發(fā)展往往要求在性能或價格上,能夠不斷改進,這些對于AI語音芯片的研發(fā)來說,都是比較大的挑戰(zhàn)。

算法、芯片上不斷升級,攻克一個個難題


如何解決這些難題呢?一直以來,啟英泰倫堅持在芯片和算法兩方面不斷發(fā)力,力求攻克一個個業(yè)內(nèi)難題。截至目前,啟英泰倫的技術(shù)平臺BNPU(腦神經(jīng)網(wǎng)絡處理器)已經(jīng)迭代三次,從BNPU1.0,BNPU2.0,到BNPU3.0。何云鵬表示,每一代BNPU的問世,都是離線語音芯片和算法的一次突破和語音應用的助推。



具體來看,集成BNPU1.0的一代芯片C11006/CI1002,實現(xiàn)的是端側(cè)語音識別,這是行業(yè)首款集成神經(jīng)網(wǎng)絡處理器的語音AI芯片,是離線語音產(chǎn)業(yè)應用興起的標志;集成BNPU2.0的二代芯片CI1102/CI1103及CI1122,不僅實現(xiàn)了離線語音識別功能,還實現(xiàn)了離線聲紋識別和命令詞自學習等功能。

每顆芯片的迭代,集成度不斷增加,成本快速下降,算法功能不斷提升。據(jù)何云鵬介紹,集成度上,二代系列芯片集成了Audio CODEC、Flash等單元,增加了雙麥陣增強處理能力;成本上,一代芯片CI1006成本價為50到90元,CI1102下降到30到40元,二代芯片CI1102/CI1103為15元到25,CI1122下降到了10元到15元之間;算法上,正常安靜家居環(huán)境下,識別都達到98%以上,65dB左右中強環(huán)境噪聲下也能實現(xiàn)較好的識別效果。

發(fā)布全新三代芯片,端側(cè)NLP技術(shù)實現(xiàn)自然語音交互

盡管過去幾年在算法和芯片上不斷提升,逐漸解決了業(yè)界面臨的一些難題,然而整個行業(yè)仍然存在極難克服的問題,比如:1、離線語音仍然是以命令詞為主,對于用戶來說,如果命令詞多的話,就會很難記?。?、電視新聞,多人聲環(huán)境,以及噪聲強度達到75dB以上的復雜強噪聲環(huán)境的識別存在困難;3、離線命令詞自學習的效果,與大數(shù)據(jù)訓練模型效果仍然存在明顯差距,這使得方言問題沒有得到徹底解決。

為了攻克這些難題,啟英泰倫經(jīng)過三年時間研發(fā),最終帶來BNPU3.0版本,并基于此發(fā)布了三代兩大系類芯片,一大系列是三代智能語音MCU13;另一大系列是智能語音IOT 23。

相比之前的芯片,三代系列芯片具有更高算力、更高集成度,更高性能。首先看CI13系列芯片,算力方面,該系列內(nèi)置BNPU 3.0,支持DSP指令擴展的RISC CPU兩大內(nèi)核,主頻高達240MHz,具有640KB SRAM,而二代芯片主頻是160MHz,內(nèi)置BNPU2.0,512KB SRAM。



集成度方面,CI13系列芯片集成了Audio Codec模擬MIC接口、數(shù)字PDM麥克DMIC接口、通用ADC及MCU常見串口、PWM、GPIO等接口,還集成了4線NOR Flash、3路LDO PMU、高精度RC振蕩器等。

通過接上MIC,簡單的語音識別應用,外圍電路僅需十幾個電阻電容,多數(shù)情況下可以不需要加晶振;通過串口可以擴展上位機MCU,或WiFi、BLE、2.4G射頻芯片;通過通用ADC或IIC可以輸入溫度、濕度等傳感器信號;通過PWM或其它GPIO,可以實現(xiàn)對開關控制、電機控制、SPI屏或段碼屏顯示控制、紅外收發(fā)控制等。這樣,CI13系列芯片既可以作為語音識別或語音信號處理的專用芯片,也可以作為帶語音識別功能的MCU主控芯片。



算法方面,CI13系列芯片幾乎支持全部信號處理和識別技術(shù),包括單麥自適應降噪、降混響、回聲消除、DOA、波束形成、盲源分離、語音活動檢測等傳統(tǒng)信號技術(shù)。

除了具有二代芯片的語音識別、聲紋識別外,三代CI13系列芯片還支持基于深度學習的降噪技術(shù)(深度降噪)、人聲分離技術(shù)(深度分離)、以及離線NLP技術(shù)。深度降噪技術(shù)能在信噪比-5dB 到-10dB的環(huán)境噪聲下將人聲提取出來,實現(xiàn)良好識別。

端側(cè)NLP技術(shù)在原來的聲學模型、語言模型的基礎上增加了意圖模型,該意圖模型采用聯(lián)合規(guī)則和統(tǒng)計訓練的模型來實現(xiàn)端側(cè)語音識別+語義理解。端側(cè)NLP技術(shù)具備上下文關聯(lián)、多輪對話、意圖理解等云端NLP的功能,該技術(shù)的突破,使得設備徹底不需要依賴云端,也可以實現(xiàn)自然隨心的語音交互。



接下來看三代芯片CI23系列CI2305 和CI2306,CI23系列芯片在語音功能和性能與CI13系列芯片相同,主要增加集成了WiFi和BLE,形成語音+WiFi+BLE三合一單芯片,其中CI2305支持離線語音+IOT,CI2306還支持將語音上傳,實現(xiàn)離線語音+在線語音+IOT功能。

何云鵬認為對設備控制交互在本地計算會更好,這樣可以解決云端計算帶來的響應延遲太大體驗差,斷網(wǎng)無法使用及用戶隱私泄露風險,以及云端建設和運營成本太高等問題。

除了不斷升級芯片算法性能,降低芯片方案成本,啟英泰倫還持續(xù)提升應用開發(fā)平臺和合作生態(tài)建設,努力降低AI語音應用的門檻。

據(jù)啟英泰倫介紹,經(jīng)過近7年發(fā)展,公司已經(jīng)積累B端客戶超過5000名,平臺開發(fā)者超過了1萬名,使用啟英泰倫智能語音平臺的在校AI學員超過10萬名?,F(xiàn)在,離線語音方案的年裝機量超過2000萬,并正快速向上億年裝機量發(fā)展。

小結(jié)

經(jīng)過過去這些年的發(fā)展,語音交互逐漸進入人們的生活,并帶來極大的便利,然而不可否認的是,背景噪聲大影響語音識別的準確性,命令詞太多容易記不住等問題依然存在,而啟英泰倫發(fā)布的第三代語音芯片,通過算力、集成度、算法的不斷升級,完美解決了這些問題,隨著各項難題的進一步突破,預計未來AI語音芯片將會在更多的場景中得到更好的應用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54031

    瀏覽量

    466467
  • 啟英泰倫
    +關注

    關注

    1

    文章

    57

    瀏覽量

    1717
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    越南語離線語音識別方案# 語音交互 #離線語音 #語音芯片

    語音芯片
    啟英泰倫
    發(fā)布于 :2026年03月02日 14:18:29

    西班牙語語音識別方案# 語音交互 #語音識別 #AI語音芯片 #

    語音芯片
    啟英泰倫
    發(fā)布于 :2026年03月02日 14:14:23

    俄語離線語音識別方案# # 語音交互 #人工智能 #俄語語音識別

    語音芯片
    啟英泰倫
    發(fā)布于 :2026年03月02日 14:12:10

    離線語音芯片哪些品牌好用?如何選擇?

    隨著智能家居市場的快速發(fā)展,語音交互已成為主流控制方式之一。離線語音芯片因其本地處理、即時響應、高隱私性等特點,正成為越來越多智能設備的首選。目前市場上可供選擇的
    的頭像 發(fā)表于 01-27 15:10 ?164次閱讀

    新品 | Module ASR,AI智能離線語音模塊

    ModuleASR是一款基于CI1302芯片設計的AI智能離線語音模塊。配備麥克風用于清晰音頻采集,并內(nèi)置揚聲器提供高質(zhì)量的音頻反饋。同時支持中途
    的頭像 發(fā)表于 12-05 18:15 ?702次閱讀
    新品 | Module ASR,<b class='flag-5'>AI</b>智能<b class='flag-5'>離線</b><b class='flag-5'>語音</b>模塊

    AI在此10 成立10周年啦!

    聽懂這聲“你好”并作出回應時這背后很可能就跳動著一顆由我們賦予的“中國芯”下面是交出的十年答卷2015年●在成都高新區(qū)注冊成立,致力于端側(cè)A
    的頭像 發(fā)表于 11-25 09:29 ?678次閱讀
    <b class='flag-5'>AI</b>在此10 <b class='flag-5'>啟</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>倫</b>成立10周年啦!

    什么是離線語音識別芯片離線語音識別芯片有哪些優(yōu)點)

    離線語音識別芯片,是一種集成了語音信號采集、前端處理和本地識別功能的專用集成電路,無須聯(lián)網(wǎng)也可以進行語音控制。它內(nèi)設先進的數(shù)字信號處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?527次閱讀

    喜報 | 獲得2025年成都市企業(yè)技術(shù)中心認定!

    近日,成都市經(jīng)濟和信息化局公布了2025年度市級企業(yè)技術(shù)中心認定名單,(國家專精特新“小巨人”企業(yè))憑借在人工智能語音
    的頭像 發(fā)表于 09-28 17:10 ?1044次閱讀
    喜報 | <b class='flag-5'>啟</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>倫</b>獲得2025年成都市企業(yè)技術(shù)中心認定!

    哪些離線語音芯片適用于家電設備

    ?哪些離線語音芯片適用于家電設備?選擇適用于家電設備的離線語音芯片時,需綜合考量家電的使用環(huán)境、
    的頭像 發(fā)表于 08-06 17:27 ?873次閱讀
    哪些<b class='flag-5'>離線</b><b class='flag-5'>語音</b><b class='flag-5'>芯片</b>適用于家電設備

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無需依賴網(wǎng)絡即可實現(xiàn)智能功能的特性,在一些網(wǎng)絡條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型
    發(fā)表于 07-04 11:14

    開發(fā)案例 | 用CI1302 AI語音開發(fā)板4步打造智能語音床頭小夜燈,手殘黨也能玩轉(zhuǎn)開發(fā)!

    。最近一直在琢磨,怎么給家里的小夜燈加點"黑科技",讓它不再只是個普通的照明工具。直到發(fā)現(xiàn)了的CI13XX系列AI
    的頭像 發(fā)表于 06-13 14:53 ?1889次閱讀
    開發(fā)案例 | 用CI1302 <b class='flag-5'>AI</b><b class='flag-5'>語音</b>開發(fā)板4步打造智能<b class='flag-5'>語音</b>床頭小夜燈,手殘黨也能玩轉(zhuǎn)開發(fā)!

    亮相成都人工智能專場路演,發(fā)布具身智能新戰(zhàn)略!

    "語音入口"到"機器人大腦":端側(cè)AI芯片的三步躍遷在路演中,
    的頭像 發(fā)表于 06-06 17:56 ?1131次閱讀
    <b class='flag-5'>啟</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>倫</b>亮相成都人工智能專場路演,<b class='flag-5'>發(fā)布</b>具身智能新戰(zhàn)略!

    NRK3301 AI語音芯片:玩具語音交互革新方案

    玩具AI語音芯片開發(fā)在玩具智能化浪潮中,九芯電子的NRK3301AI語音芯片憑借卓越性能與獨特藍
    的頭像 發(fā)表于 05-09 13:49 ?1020次閱讀
    NRK3301 <b class='flag-5'>AI</b><b class='flag-5'>語音</b><b class='flag-5'>芯片</b>:玩具<b class='flag-5'>語音</b>交互革新方案

    喜訊丨入選2025成都硬科技企業(yè)撲克牌榜單

    科技企業(yè)撲克牌”榜單。經(jīng)過指標模型評選、線上公眾投票、專家委員會評審三輪篩選,作為人工智能語音
    的頭像 發(fā)表于 04-18 17:23 ?1084次閱讀
    喜訊丨<b class='flag-5'>啟</b><b class='flag-5'>英</b><b class='flag-5'>泰</b><b class='flag-5'>倫</b>入選2025成都硬科技企業(yè)撲克牌榜單