91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度端對(duì)端語(yǔ)音識(shí)別專利揭秘

汽車玩家 ? 來(lái)源: 愛(ài)集微 ? 作者: 愛(ài)集微 ? 2020-01-08 11:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

百度公司提出的端對(duì)端神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行語(yǔ)音識(shí)別,成功的代替了手工工程化部件的流水線操作,這讓整個(gè)語(yǔ)音識(shí)別技術(shù)更加便捷,而使用神經(jīng)網(wǎng)絡(luò)來(lái)抽取輸入端的特征信息相當(dāng)于人功抽取特征則更加全面。

集微網(wǎng)消息,近年來(lái),語(yǔ)音識(shí)別技術(shù)得到了迅猛的發(fā)展,這得益于人工智能的快速發(fā)展,其中最為主要的學(xué)業(yè)界的各大神經(jīng)網(wǎng)絡(luò)的出現(xiàn),包括基礎(chǔ)的序列神經(jīng)網(wǎng)絡(luò)模型RNN、LSTM和GRU。語(yǔ)音識(shí)別技術(shù)也已經(jīng)進(jìn)入到各行各業(yè)中,如工業(yè)、家電、通信汽車電子等。于是,對(duì)于語(yǔ)音識(shí)別技術(shù)的要求也將更加嚴(yán)格了,更傾向于走向準(zhǔn)確化和便捷化。

以往,構(gòu)建語(yǔ)音識(shí)別模型主要是使用HMM的序列模型,再使用手工工程化部件來(lái)實(shí)現(xiàn)整個(gè)流水線操作,并且對(duì)于不同的語(yǔ)言的語(yǔ)音需要重新構(gòu)建模型的結(jié)果特征。對(duì)此,國(guó)內(nèi)語(yǔ)音識(shí)別技術(shù)第一梯隊(duì)公司百度便提出了使用端對(duì)端的神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行語(yǔ)音識(shí)別工作,該專利為“端對(duì)端語(yǔ)音識(shí)別”(專利號(hào):CN107408111A)。

首先,小編在這先介紹一下神經(jīng)網(wǎng)絡(luò)端對(duì)端的學(xué)習(xí)方式。對(duì)于語(yǔ)音識(shí)別來(lái)說(shuō),端到端深度學(xué)習(xí)做的是,訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò),輸入就是一段音頻,輸出直接是聽(tīng)寫文本。其中這里的端表示輸入源數(shù)據(jù)端,另外一端是神經(jīng)網(wǎng)絡(luò)處理的結(jié)果也就是我們最終需要的目標(biāo)。這種訓(xùn)練學(xué)習(xí)的方式能應(yīng)對(duì)多種語(yǔ)言的語(yǔ)音識(shí)別的場(chǎng)景構(gòu)建,因?yàn)閮H僅是需要改變輸入端和輸出端,深度神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)并不需要根據(jù)語(yǔ)言的語(yǔ)音不同而改變。

專利中提出的端對(duì)端的深度學(xué)習(xí)模型的架構(gòu)圖如圖1所示。該架構(gòu)包括訓(xùn)練以攝取語(yǔ)譜并生成文本的遞歸神經(jīng)網(wǎng)絡(luò)模型。首先,使用一個(gè)或更多個(gè)卷積層對(duì)語(yǔ)譜進(jìn)行特征提取,緊接著,使用一個(gè)或多個(gè)遞歸層(雙向GRU神經(jīng)網(wǎng)絡(luò))對(duì)語(yǔ)譜的特征進(jìn)行時(shí)序建模。最后再使用全連接層將遞歸層獲取的語(yǔ)譜信息進(jìn)行全連接作為CTC(鏈結(jié)式時(shí)間分類算法:重點(diǎn)解決輸入數(shù)據(jù)與給定標(biāo)簽的對(duì)齊問(wèn)題)的輸入,經(jīng)過(guò)Softmax計(jì)算輸出各個(gè)文本標(biāo)簽的概率。

圖1端對(duì)端深度學(xué)習(xí)模型架構(gòu)圖

經(jīng)過(guò)上述端對(duì)端深度學(xué)習(xí)模型構(gòu)建后,專利中還給出了端對(duì)端深度學(xué)習(xí)模型的訓(xùn)練方法,如圖2所示。

百度端對(duì)端語(yǔ)音識(shí)別專利揭秘

圖2 端對(duì)端深度學(xué)習(xí)模型訓(xùn)練方法圖

首先需要為模型設(shè)置好,輸入端和輸出端,對(duì)于語(yǔ)音識(shí)別技術(shù)來(lái)說(shuō),輸入端為一時(shí)間序列頻譜幀的話語(yǔ)X,輸出端是與話語(yǔ)X具有相關(guān)聯(lián)的真實(shí)標(biāo)簽Y。

構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型(包括一個(gè)或多個(gè)卷積層和一個(gè)或多個(gè)遞歸層的模型)用來(lái)預(yù)測(cè)一個(gè)或多個(gè)字符也就是我們輸出端的標(biāo)簽。

根據(jù)網(wǎng)絡(luò)模型的輸出端的標(biāo)簽的概率分布與真實(shí)標(biāo)簽的誤差計(jì)算損失函數(shù),提供損失函數(shù)推出標(biāo)簽預(yù)測(cè)的誤差,再使用梯度反向傳播算法更新模型參數(shù)。從而達(dá)到網(wǎng)絡(luò)模型學(xué)習(xí)的目的。

百度公司提出的端對(duì)端神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行語(yǔ)音識(shí)別,成功的代替了手工工程化部件的流水線操作,這讓整個(gè)語(yǔ)音識(shí)別技術(shù)更加便捷,而使用神經(jīng)網(wǎng)絡(luò)來(lái)抽取輸入端的特征信息相當(dāng)于人功抽取特征則更加全面,這讓整個(gè)語(yǔ)音識(shí)別技術(shù)更加準(zhǔn)確。從這兩方面來(lái)看,端對(duì)端的神經(jīng)網(wǎng)絡(luò)模型確實(shí)是讓語(yǔ)音識(shí)別技術(shù)走向了便捷化,準(zhǔn)確化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2377

    瀏覽量

    94888
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116058
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會(huì)現(xiàn)場(chǎng),文心大模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1300次閱讀

    百度地圖開(kāi)放平臺(tái)與400萬(wàn)開(kāi)發(fā)者共赴智能時(shí)空新未來(lái)

    二十年星辰大海,十五載開(kāi)放引航。2025年,百度地圖迎來(lái)服務(wù)用戶的二十周年,其開(kāi)放平臺(tái)亦走過(guò)了與開(kāi)發(fā)者并肩同行的十五個(gè)春秋。在近期舉行的“2025百度地圖開(kāi)發(fā)者盛典”上,百度地圖開(kāi)放平臺(tái)回顧了從提供基礎(chǔ)地圖API,演進(jìn)為以AI為
    的頭像 發(fā)表于 01-23 09:03 ?705次閱讀
    <b class='flag-5'>百度</b>地圖開(kāi)放平臺(tái)與400萬(wàn)開(kāi)發(fā)者共赴智能時(shí)空新未來(lái)

    MediaTek攜手合作伙伴推動(dòng)側(cè)語(yǔ)音識(shí)別落地

    在《王者榮耀》等多人競(jìng)技游戲中,語(yǔ)音溝通是團(tuán)隊(duì)配合的核心。但網(wǎng)絡(luò)不穩(wěn)定、噪聲環(huán)境等問(wèn)題會(huì)影響識(shí)別準(zhǔn)確
    的頭像 發(fā)表于 12-28 15:30 ?1208次閱讀

    百度健康升級(jí)發(fā)布文心健康管家

    面臨醫(yī)療資源分布不均、就診流程繁瑣、就醫(yī)信息不均等難題,“想讓每個(gè)家庭都擁有專屬醫(yī)生”成為百度健康的愿景。
    的頭像 發(fā)表于 12-23 15:01 ?695次閱讀

    語(yǔ)音交互革命:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著大模型技術(shù)的迅猛發(fā)展,人機(jī)交互正經(jīng)歷從“工具式響應(yīng)”向“擬人化陪伴”的深刻變革。在這一進(jìn)程中,語(yǔ)音交互作為最自然的人機(jī)溝通方式。 ? 百度智能云泛科技行業(yè)解決方案
    發(fā)表于 12-01 01:07 ?1729次閱讀
    <b class='flag-5'>端</b>到<b class='flag-5'>端</b><b class='flag-5'>語(yǔ)音</b>交互革命:<b class='flag-5'>百度</b>智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    百度世界大會(huì)亮點(diǎn) 五年五芯 百度宣布打造最硬AI云

    自2006年以來(lái),百度世界大會(huì)已連續(xù)舉辦近20屆,百度世界大會(huì)是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級(jí)別盛事,作為百度年度最重要的的戰(zhàn)略、技術(shù)、產(chǎn)品發(fā)布會(huì),自2006年以來(lái)
    的頭像 發(fā)表于 11-13 15:47 ?1620次閱讀

    百度世界2025進(jìn)行中 百度昆侖芯超節(jié)點(diǎn)亮相 性能巨幅提升

    百度世界大會(huì)是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級(jí)別盛事,作為百度年度最重要的的戰(zhàn)略、技術(shù)、產(chǎn)品發(fā)布會(huì),自2006年以來(lái)已連續(xù)舉辦19年,持續(xù)為行業(yè)搭建起交流前沿技術(shù)、碰撞創(chuàng)新
    的頭像 發(fā)表于 11-13 11:51 ?1251次閱讀

    語(yǔ)音交互數(shù)據(jù) 精準(zhǔn)賦能語(yǔ)音大模型進(jìn)階

    語(yǔ)音大模型從“能識(shí)別”向“懂語(yǔ)境”跨越的關(guān)鍵階段,高質(zhì)量場(chǎng)景化語(yǔ)音數(shù)據(jù)已成為制約技術(shù)突破的核心瓶頸。傳統(tǒng)語(yǔ)音識(shí)別數(shù)據(jù)集采用孤立標(biāo)注,在
    的頭像 發(fā)表于 09-11 17:17 ?744次閱讀

    百度智能云發(fā)布全球首批AI數(shù)字員工

    沒(méi)錯(cuò),在今天的百度AI Day開(kāi)放日現(xiàn)場(chǎng),這么溜的同事們正式上崗!
    的頭像 發(fā)表于 08-12 09:47 ?1720次閱讀

    廣和通發(fā)布自研側(cè)語(yǔ)音識(shí)別大模型FiboASR

    7月,全球領(lǐng)先的無(wú)線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語(yǔ)音識(shí)別大模型FiboASR。該模型專為側(cè)設(shè)備上面臨的面對(duì)面實(shí)時(shí)對(duì)話及多人會(huì)議場(chǎng)景深度優(yōu)化,在低延遲語(yǔ)音交互、
    的頭像 發(fā)表于 08-04 11:43 ?1599次閱讀

    百度地圖重磅發(fā)布地圖AI開(kāi)放平臺(tái)

    近日,在WGDC25全球時(shí)空智能大會(huì)上,百度地圖重磅發(fā)布地圖AI開(kāi)放平臺(tái)。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術(shù)全面開(kāi)放,向開(kāi)發(fā)者深度開(kāi)放四大核心能力和五大場(chǎng)景解決方案。
    的頭像 發(fā)表于 05-26 11:26 ?1762次閱讀

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們?cè)谖錆h舉辦了Create2025百度AI開(kāi)發(fā)者大會(huì),與全球各地的5000多名開(kāi)發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展。
    的頭像 發(fā)表于 04-30 10:14 ?1337次閱讀

    上汽大眾與百度地圖達(dá)成戰(zhàn)略合作

    近日,上海國(guó)際車展期間,百度地圖與上汽大眾舉行科技X生態(tài)戰(zhàn)略合作伙伴簽約儀式,雙方將基于百度領(lǐng)先的車道級(jí)地圖產(chǎn)品,為上汽大眾千萬(wàn)車主打造更安全、高效的智能化出行體驗(yàn)。上汽大眾總經(jīng)理陶海龍、百度副總裁尚國(guó)斌等出席簽約儀式。
    的頭像 發(fā)表于 04-29 17:28 ?1238次閱讀

    百度AI榮獲2025愛(ài)迪生獎(jiǎng)金獎(jiǎng)和銀獎(jiǎng)

    剛剛,百度AI在「2025愛(ài)迪生獎(jiǎng)」中獲得一金一銀兩項(xiàng)大獎(jiǎng)。
    的頭像 發(fā)表于 04-08 15:43 ?982次閱讀

    百度地圖在汽車智能化領(lǐng)域的應(yīng)用實(shí)踐

    近日,在中國(guó)電動(dòng)汽車人會(huì)論壇(2025)的智能汽車創(chuàng)新技術(shù)與產(chǎn)業(yè)論壇,百度地圖事業(yè)部副總經(jīng)理劉增剛發(fā)表主旨演講,分享了百度地圖在汽車智能化浪潮中價(jià)值思考和應(yīng)用實(shí)踐。他表示:“25年汽車智能化的競(jìng)賽
    的頭像 發(fā)表于 04-03 15:02 ?2329次閱讀