亚洲无码av毛片,黄色亚州在线免费观看视频,www香蕉视频在线观看

語(yǔ)音識(shí)別技術(shù)方便于長(zhǎng)輩們?nèi)谌牒Ａ繑?shù)據(jù)的互聯(lián)網(wǎng)時(shí)代，成為長(zhǎng)輩們與外界交流的一大利器。不過(guò)，千萬(wàn)不要認(rèn)為在未來(lái)人工智能時(shí)代中的語(yǔ)音識(shí)別僅僅是單純運(yùn)用到手機(jī)聊天中的識(shí)別錄入文字。語(yǔ)音識(shí)別技術(shù)隨著深度學(xué)習(xí)及高性能計(jì)算的不斷發(fā)展，正逐漸從實(shí)驗(yàn)室邁向工業(yè)領(lǐng)域。

語(yǔ)音識(shí)別簡(jiǎn)史

1952年，美國(guó)AT&T貝爾實(shí)驗(yàn)室開發(fā)出了第一個(gè)基于電子計(jì)算機(jī)的語(yǔ)音識(shí)別系統(tǒng)Audrey，其可以識(shí)別10個(gè)英文數(shù)字，準(zhǔn)確率為98%；進(jìn)入60年代，語(yǔ)音識(shí)別領(lǐng)域的兩大突破是線性預(yù)測(cè)編碼，以及動(dòng)態(tài)時(shí)間規(guī)整技術(shù)；

在60年代后期，隱馬爾可夫模型被Leonard E. Baum等人提出，HMM的提出是語(yǔ)音識(shí)別歷史上的一個(gè)重大突破，使當(dāng)時(shí)語(yǔ)音識(shí)別的錯(cuò)誤率大大降低；李開復(fù)等人則在1988年第一次實(shí)現(xiàn)了基于HMM的大詞匯量語(yǔ)音識(shí)別系統(tǒng)Sphinx。

另一方面，早在上世紀(jì)80年代，人工神經(jīng)網(wǎng)絡(luò)已經(jīng)被引入語(yǔ)音識(shí)別。起初人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)多為簡(jiǎn)單的多層感知機(jī)，但受限于當(dāng)時(shí)的計(jì)算能力以及語(yǔ)音數(shù)據(jù)的稀少，人工神經(jīng)網(wǎng)絡(luò)并沒(méi)有在識(shí)別率上帶來(lái)很大的提升。

近年來(lái)，隨著計(jì)算能力的提升和語(yǔ)音數(shù)據(jù)的增加，神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于語(yǔ)音識(shí)別任務(wù)中。深度神經(jīng)網(wǎng)絡(luò)技術(shù)的出現(xiàn)，也進(jìn)一步提高了大規(guī)模連續(xù)語(yǔ)音識(shí)別的性能,目前已經(jīng)成為學(xué)術(shù)界和工業(yè)界研究的熱點(diǎn)內(nèi)容之一。

語(yǔ)音識(shí)別的技術(shù)支持

目前，在語(yǔ)音識(shí)別領(lǐng)域廣泛采用的神經(jīng)網(wǎng)絡(luò)有時(shí)延神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)以及基于長(zhǎng)短期記憶的RNN等。

通常將這些深度神經(jīng)網(wǎng)絡(luò)模型與HMM模型結(jié)合構(gòu)建完整的聲學(xué)模型，并結(jié)合語(yǔ)言模型等提升語(yǔ)音識(shí)別性能。

在語(yǔ)言模型方面，雖然傳統(tǒng)的N元模型一直是主流技術(shù)，但基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型從2012年開始被較為廣泛的研究，如RNN-LM、LSTM-LM等。

鑒于基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型的計(jì)算量較大，一般先利用N元模型初始化，然后再用基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型重打分，即神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型并不直接用于解碼，而是在基線系統(tǒng)解碼結(jié)果的基礎(chǔ)上進(jìn)行得分重估。

同時(shí)，RNN-CTC的出現(xiàn)使得語(yǔ)音識(shí)別擺脫了傳統(tǒng)方法中聲學(xué)模型、語(yǔ)言模型、解碼器等模塊化的束縛，通過(guò)采用對(duì)輸入輸出序列直接建模的方法，只需訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)模型即可進(jìn)行識(shí)別，因此被稱為端到端語(yǔ)音識(shí)別。

端到端的模型可以解決傳統(tǒng)方法中各個(gè)模型訓(xùn)練目標(biāo)不一致的問(wèn)題。另外，由于實(shí)際中可獲取的文本數(shù)據(jù)比語(yǔ)音數(shù)據(jù)多得多，所以往往還會(huì)用文本數(shù)據(jù)訓(xùn)練一個(gè)更好的語(yǔ)言模型，與CTC神經(jīng)網(wǎng)絡(luò)結(jié)合使用。

深度神經(jīng)網(wǎng)絡(luò)用于人工智能應(yīng)用的問(wèn)題在于其實(shí)時(shí)率等性能指標(biāo)還需有待提高，但是端到端語(yǔ)音識(shí)別開辟了人工智能的一個(gè)新方向，而且訓(xùn)練的過(guò)程相對(duì)簡(jiǎn)單，因此人工智能方向上的端到端識(shí)別將會(huì)是未來(lái)的技術(shù)趨勢(shì)之一。此外人工智能再進(jìn)一步改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)、改進(jìn)訓(xùn)練方法，逐步使人工智能性能達(dá)到工業(yè)水平和要求，進(jìn)入商用階段指日可待。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4838

瀏覽量
107876
語(yǔ)音識(shí)別

語(yǔ)音識(shí)別

+關(guān)注

關(guān)注
39

文章
1812

瀏覽量
116074
人工智能

人工智能

+關(guān)注

關(guān)注
1818

文章
50120

瀏覽量
265605

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

關(guān)于語(yǔ)音識(shí)別在人工智能時(shí)代作用和分析介紹

評(píng)論