91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于語(yǔ)音識(shí)別在人工智能時(shí)代作用和分析介紹

英特爾物聯(lián)網(wǎng) ? 來(lái)源:djl ? 2019-09-11 10:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能時(shí)代,語(yǔ)音識(shí)別

神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)

語(yǔ)音識(shí)別技術(shù)方便于長(zhǎng)輩們?nèi)谌牒A繑?shù)據(jù)的互聯(lián)網(wǎng)時(shí)代,成為長(zhǎng)輩們與外界交流的一大利器。不過(guò),千萬(wàn)不要認(rèn)為在未來(lái)人工智能時(shí)代中的語(yǔ)音識(shí)別僅僅是單純運(yùn)用到手機(jī)聊天中的識(shí)別錄入文字。語(yǔ)音識(shí)別技術(shù)隨著深度學(xué)習(xí)及高性能計(jì)算的不斷發(fā)展,正逐漸從實(shí)驗(yàn)室邁向工業(yè)領(lǐng)域。

語(yǔ)音識(shí)別簡(jiǎn)史

1952年,美國(guó)AT&T貝爾實(shí)驗(yàn)室開發(fā)出了第一個(gè)基于電子計(jì)算機(jī)的語(yǔ)音識(shí)別系統(tǒng)Audrey,其可以識(shí)別10個(gè)英文數(shù)字,準(zhǔn)確率為98%;進(jìn)入60年代,語(yǔ)音識(shí)別領(lǐng)域的兩大突破是線性預(yù)測(cè)編碼,以及動(dòng)態(tài)時(shí)間規(guī)整技術(shù);

在60年代后期,隱馬爾可夫模型被Leonard E. Baum等人提出,HMM的提出是語(yǔ)音識(shí)別歷史上的一個(gè)重大突破,使當(dāng)時(shí)語(yǔ)音識(shí)別的錯(cuò)誤率大大降低;李開復(fù)等人則在1988年第一次實(shí)現(xiàn)了基于HMM的大詞匯量語(yǔ)音識(shí)別系統(tǒng)Sphinx。

另一方面,早在上世紀(jì)80年代,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)被引入語(yǔ)音識(shí)別。起初人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)多為簡(jiǎn)單的多層感知機(jī),但受限于當(dāng)時(shí)的計(jì)算能力以及語(yǔ)音數(shù)據(jù)的稀少,人工神經(jīng)網(wǎng)絡(luò)并沒(méi)有在識(shí)別率上帶來(lái)很大的提升。

近年來(lái),隨著計(jì)算能力的提升和語(yǔ)音數(shù)據(jù)的增加,神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于語(yǔ)音識(shí)別任務(wù)中。深度神經(jīng)網(wǎng)絡(luò)技術(shù)的出現(xiàn),也進(jìn)一步提高了大規(guī)模連續(xù)語(yǔ)音識(shí)別的性能,目前已經(jīng)成為學(xué)術(shù)界和工業(yè)界研究的熱點(diǎn)內(nèi)容之一。

語(yǔ)音識(shí)別的技術(shù)支持

目前,在語(yǔ)音識(shí)別領(lǐng)域廣泛采用的神經(jīng)網(wǎng)絡(luò)有時(shí)延神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)以及基于長(zhǎng)短期記憶的RNN等。

通常將這些深度神經(jīng)網(wǎng)絡(luò)模型與HMM模型結(jié)合構(gòu)建完整的聲學(xué)模型,并結(jié)合語(yǔ)言模型等提升語(yǔ)音識(shí)別性能。

在語(yǔ)言模型方面,雖然傳統(tǒng)的N元模型一直是主流技術(shù),但基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型從2012年開始被較為廣泛的研究,如RNN-LM、LSTM-LM等。

鑒于基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型的計(jì)算量較大,一般先利用N元模型初始化,然后再用基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型重打分,即神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型并不直接用于解碼,而是在基線系統(tǒng)解碼結(jié)果的基礎(chǔ)上進(jìn)行得分重估。

同時(shí),RNN-CTC的出現(xiàn)使得語(yǔ)音識(shí)別擺脫了傳統(tǒng)方法中聲學(xué)模型、語(yǔ)言模型、解碼器等模塊化的束縛,通過(guò)采用對(duì)輸入輸出序列直接建模的方法,只需訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)模型即可進(jìn)行識(shí)別,因此被稱為端到端語(yǔ)音識(shí)別。

端到端的模型可以解決傳統(tǒng)方法中各個(gè)模型訓(xùn)練目標(biāo)不一致的問(wèn)題。另外,由于實(shí)際中可獲取的文本數(shù)據(jù)比語(yǔ)音數(shù)據(jù)多得多,所以往往還會(huì)用文本數(shù)據(jù)訓(xùn)練一個(gè)更好的語(yǔ)言模型,與CTC神經(jīng)網(wǎng)絡(luò)結(jié)合使用。

深度神經(jīng)網(wǎng)絡(luò)用于人工智能應(yīng)用的問(wèn)題在于其實(shí)時(shí)率等性能指標(biāo)還需有待提高,但是端到端語(yǔ)音識(shí)別開辟了人工智能的一個(gè)新方向,而且訓(xùn)練的過(guò)程相對(duì)簡(jiǎn)單,因此人工智能方向上的端到端識(shí)別將會(huì)是未來(lái)的技術(shù)趨勢(shì)之一。此外人工智能再進(jìn)一步改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)、改進(jìn)訓(xùn)練方法,逐步使人工智能性能達(dá)到工業(yè)水平和要求,進(jìn)入商用階段指日可待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI人工智能語(yǔ)音識(shí)別控制模塊:自定義命令詞,全維度落地應(yīng)用場(chǎng)景

    AI人工智能語(yǔ)音識(shí)別控制模塊是一種集成了語(yǔ)音識(shí)別、自然語(yǔ)言處理和智能控制功能的電子設(shè)備或系統(tǒng)。用
    的頭像 發(fā)表于 12-03 16:34 ?976次閱讀

    人工智能時(shí)代,如何打造網(wǎng)絡(luò)安全“新范式”

    在當(dāng)今信息化迅速發(fā)展的時(shí)代,5G、大數(shù)據(jù)、云計(jì)算、深度學(xué)習(xí)等新興技術(shù)的廣泛應(yīng)用,帶來(lái)了前所未有的網(wǎng)絡(luò)安全挑戰(zhàn)。人工智能技術(shù)的崛起,為網(wǎng)絡(luò)安全領(lǐng)域提供了新的解決方案,尤其在威脅識(shí)別、告警分析
    的頭像 發(fā)表于 12-02 16:05 ?492次閱讀

    語(yǔ)音識(shí)別芯片有哪些(語(yǔ)音識(shí)別芯片AT680系列)

    人工智能技術(shù)飛速發(fā)展的今天,語(yǔ)音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語(yǔ)音芯片不同,
    的頭像 發(fā)表于 11-14 17:11 ?1397次閱讀

    什么是離線語(yǔ)音識(shí)別芯片(離線語(yǔ)音識(shí)別芯片有哪些優(yōu)點(diǎn))

    離線語(yǔ)音識(shí)別芯片,是一種集成了語(yǔ)音信號(hào)采集、前端處理和本地識(shí)別功能的專用集成電路,無(wú)須聯(lián)網(wǎng)也可以進(jìn)行語(yǔ)音控制。它內(nèi)設(shè)先進(jìn)的數(shù)字信號(hào)處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?528次閱讀

    如何選擇合適的語(yǔ)音識(shí)別芯片型號(hào)

    語(yǔ)音識(shí)別芯片(又稱語(yǔ)音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語(yǔ)音芯片相比,其最大特點(diǎn)是能夠主
    的頭像 發(fā)表于 10-30 16:32 ?633次閱讀

    【產(chǎn)品介紹】Altair RapidMiner數(shù)據(jù)分析人工智能平臺(tái)

    AltairRapidMiner賦能組織解鎖數(shù)據(jù)洞察,運(yùn)用數(shù)據(jù)分析和先進(jìn)的人工智能自動(dòng)化,提供可擴(kuò)展的面向未來(lái)的解決方案。Altair數(shù)據(jù)分析人工智能平臺(tái)包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)科學(xué)、ML
    的頭像 發(fā)表于 09-18 17:56 ?861次閱讀
    【產(chǎn)品<b class='flag-5'>介紹</b>】Altair RapidMiner數(shù)據(jù)<b class='flag-5'>分析</b>與<b class='flag-5'>人工智能</b>平臺(tái)

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    我們所有的 SoC 都能用于邊緣人工智能。例子包括: 預(yù)測(cè)性維護(hù)和樓宇自動(dòng)化系統(tǒng) 在每個(gè)節(jié)點(diǎn)上進(jìn)行本地?cái)?shù)據(jù)分析智能傳感器網(wǎng)絡(luò) 遙控器和可穿戴設(shè)備的動(dòng)作和手勢(shì)識(shí)別 用于
    發(fā)表于 08-31 20:54

    AI 邊緣計(jì)算網(wǎng)關(guān):開啟智能時(shí)代的鑰匙?—龍興物聯(lián)

    順暢地通向云端,實(shí)現(xiàn)設(shè)備與云端之間高效的數(shù)據(jù)傳輸與交互。通過(guò)融合先進(jìn)的邊緣計(jì)算和人工智能技術(shù),AI 邊緣計(jì)算網(wǎng)關(guān)能夠在靠近數(shù)據(jù)源的網(wǎng)絡(luò)邊緣,對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)處理和精準(zhǔn)分析,進(jìn)而實(shí)現(xiàn)智能化決策,大大減少
    發(fā)表于 08-09 16:40

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺、深度視覺、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺、深度視覺、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理器的11個(gè)誤解

    應(yīng)用,以及哪些是真實(shí)情況而哪些只是炒作,仍存在諸多誤解。GPU是最佳的人工智能處理器盡管GPU在人工智能的實(shí)現(xiàn)過(guò)程中發(fā)揮了關(guān)鍵作用,而且如今它們的應(yīng)用也極為廣泛,但將其推
    的頭像 發(fā)表于 08-07 13:21 ?1089次閱讀
    <b class='flag-5'>關(guān)于</b><b class='flag-5'>人工智能</b>處理器的11個(gè)誤解

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語(yǔ)音視覺識(shí)別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無(wú)需依賴網(wǎng)絡(luò)即可實(shí)現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場(chǎng)景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型
    發(fā)表于 07-04 11:14

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模
    發(fā)表于 07-04 11:10

    明遠(yuǎn)智睿SSD2351開發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    人工智能快速發(fā)展的今天,語(yǔ)音機(jī)器人逐漸成為人們生活和工作中的得力助手。明遠(yuǎn)智睿SSD2351開發(fā)板憑借強(qiáng)大性能與豐富功能,為語(yǔ)音機(jī)器人的發(fā)展注入新動(dòng)力,成為該領(lǐng)域的變革力量。 SSD2351開發(fā)板
    發(fā)表于 05-28 11:36

    人工智能視覺識(shí)別技術(shù)的應(yīng)用領(lǐng)域及場(chǎng)景

    人工智能視覺識(shí)別技術(shù)的應(yīng)用領(lǐng)域及場(chǎng)景
    的頭像 發(fā)表于 03-14 11:41 ?2994次閱讀