91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

劍橋語(yǔ)音博士俞凱解讀智能語(yǔ)音技術(shù)

思必馳 ? 來(lái)源:djl ? 作者:思必馳 ? 2019-08-05 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 智能語(yǔ)音技術(shù)發(fā)展與siri

智能語(yǔ)音技術(shù)發(fā)展過(guò)程可以理解為兩個(gè)階段,第一是輸入和輸出階段,即識(shí)別與合成,第二是理解和思考階段,即語(yǔ)義理解、對(duì)話(huà)系統(tǒng)、人工智能反饋。并且每一個(gè)細(xì)分領(lǐng)域均為單獨(dú)研究,例如語(yǔ)音識(shí)別、自然語(yǔ)言處理、聲紋處理,語(yǔ)義解析等等。

siri 目前最大的優(yōu)勢(shì)在于語(yǔ)義單項(xiàng)理解的算法,在一個(gè)限定的領(lǐng)域下,siri表現(xiàn)確實(shí)很好,但在整個(gè)語(yǔ)音領(lǐng)域內(nèi),尤其不限定領(lǐng)域和語(yǔ)音識(shí)別不穩(wěn)定的情況下,顯得有些后勁不足,這也與目前技術(shù)有關(guān)。而思必馳與siri不同的地方在與交互的理論,目前思必馳以任務(wù)型對(duì)話(huà)為目標(biāo),并專(zhuān)注于此。

2 一體化綜合解決技術(shù)增強(qiáng)用戶(hù)體驗(yàn)

目前的智能語(yǔ)音基本是單獨(dú)模塊定義單獨(dú)的功能,例如語(yǔ)義理解、語(yǔ)音識(shí)別模塊,彼此之間沒(méi)有控制與調(diào)度,這也是造成目前語(yǔ)音延遲現(xiàn)象的部分原因,而造成延遲另外的原因是語(yǔ)音的處理、理解、交互系統(tǒng)設(shè)計(jì)方式。

用戶(hù)最希望的是智能語(yǔ)音界面能像人與人的交流一樣,語(yǔ)音能夠迅速反饋。但目前,雖然單獨(dú)語(yǔ)音識(shí)別很多單位都能做的很快,但組裝成交互系統(tǒng)之后就大都無(wú)法做到這一點(diǎn)了。目前思必馳推出的一體化解決方案,針對(duì)利于用戶(hù)體驗(yàn)方面進(jìn)行優(yōu)化,達(dá)到端到端的用戶(hù)體驗(yàn),優(yōu)化整個(gè)控制流程,在識(shí)別的基礎(chǔ)上同時(shí)進(jìn)行輸出,達(dá)到一個(gè)快速智能反饋的效果。我們是面向終端用戶(hù)體驗(yàn)去做語(yǔ)音交互優(yōu)化,而不僅僅提供一個(gè)模塊而已。

3 人性化交互的智能語(yǔ)音方向

未來(lái)的智能語(yǔ)音交互發(fā)展方向一定是混合發(fā)展模式,將以用戶(hù)為中心,綜合應(yīng)用全面的語(yǔ)音技術(shù),而不僅僅是單純的語(yǔ)音識(shí)別。第一,智能語(yǔ)音技術(shù)會(huì)與環(huán)境、語(yǔ)境自適應(yīng)的結(jié)合;第二,語(yǔ)音的發(fā)展在自然場(chǎng)景下應(yīng)用會(huì)越來(lái)越多,例如在高噪聲環(huán)境中的處理是未來(lái)的一個(gè)方向;第三,結(jié)合上下文的語(yǔ)義理解以及端到端的語(yǔ)音交互解決。目前單獨(dú)的識(shí)別以不能解決所有問(wèn)題與滿(mǎn)足用戶(hù)需求,將識(shí)別、理解、對(duì)話(huà)的交互控制等融合,提供整套的解決方案才是最終的方向。

人工智能層面的語(yǔ)音技術(shù)中,單純的識(shí)別率是以科研指標(biāo)為中心,而人工智能角度與工程科研指標(biāo)在某些方面截然不同。而我們一直以用戶(hù)為中心,面向指標(biāo)是令人工智能語(yǔ)音真正人性化,在多類(lèi)環(huán)境下準(zhǔn)確識(shí)別并反饋,以個(gè)性化色彩進(jìn)行交流。語(yǔ)音交互的未來(lái)應(yīng)當(dāng)是面向用戶(hù),人性化的智能交互,而非過(guò)去模塊化的交互。

俞凱博士背景:擁有劍橋大學(xué)語(yǔ)音識(shí)別專(zhuān)業(yè)的學(xué)術(shù)背景,也是國(guó)內(nèi)學(xué)術(shù)界“青年***”里唯一一位來(lái)自智能語(yǔ)音技術(shù)行業(yè)領(lǐng)域的語(yǔ)音專(zhuān)家,曾多次獲得美國(guó)國(guó)家標(biāo)準(zhǔn)局和美國(guó)國(guó)防部語(yǔ)音識(shí)別評(píng)測(cè)冠軍,是國(guó)際最早的認(rèn)知型人機(jī)口語(yǔ)對(duì)話(huà)系統(tǒng)原型的主要實(shí)現(xiàn)者,在上海交通大學(xué)創(chuàng)建了智能語(yǔ)音實(shí)驗(yàn)室。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50129

    瀏覽量

    265658
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    11

    文章

    826

    瀏覽量

    50286
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    400

    瀏覽量

    15998
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    語(yǔ)音識(shí)別IC分類(lèi),語(yǔ)音識(shí)別芯片的工作原理

    語(yǔ)音識(shí)別芯片,也叫語(yǔ)音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語(yǔ)音識(shí)別功能于一體的專(zhuān)用芯片。語(yǔ)音識(shí)別IC的核心功能在于實(shí)現(xiàn)語(yǔ)音識(shí)別,即讓
    的頭像 發(fā)表于 01-14 15:22 ?262次閱讀
    <b class='flag-5'>語(yǔ)音</b>識(shí)別IC分類(lèi),<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片的工作原理

    ATH8809 智能語(yǔ)音處理芯片

    智能語(yǔ)音
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年12月24日 16:58:05

    語(yǔ)音識(shí)別芯片有哪些(語(yǔ)音識(shí)別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語(yǔ)音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類(lèi)智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語(yǔ)音芯片不同,語(yǔ)音識(shí)別芯
    的頭像 發(fā)表于 11-14 17:11 ?1398次閱讀

    廣州唯創(chuàng)電子常用語(yǔ)音芯片全解析:賦能智能語(yǔ)音交互的多場(chǎng)景應(yīng)用

    語(yǔ)音芯片作為智能設(shè)備實(shí)現(xiàn)語(yǔ)音交互的核心部件,已廣泛應(yīng)用于家居、車(chē)載、醫(yī)療、工業(yè)等領(lǐng)域。廣州唯創(chuàng)電子憑借多年的技術(shù)積累,推出多系列功能各異的語(yǔ)音
    的頭像 發(fā)表于 08-28 08:41 ?859次閱讀
    廣州唯創(chuàng)電子常用<b class='flag-5'>語(yǔ)音</b>芯片全解析:賦能<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>交互的多場(chǎng)景應(yīng)用

    思必馳榮獲國(guó)際語(yǔ)音通訊協(xié)會(huì)會(huì)士

    2025年8月18日,由ISCA(國(guó)際語(yǔ)音通訊聯(lián)盟)主辦的國(guó)際語(yǔ)音領(lǐng)域頂級(jí)會(huì)議InterSpeech 2025大會(huì)在荷蘭鹿特丹舉行。ISCA是國(guó)際上最大的智能語(yǔ)音
    的頭像 發(fā)表于 08-26 09:47 ?1037次閱讀

    智能語(yǔ)音交互升級(jí),九芯語(yǔ)音識(shí)別芯片來(lái)助力

    在科技飛速發(fā)展的當(dāng)下,智能語(yǔ)音交互已經(jīng)深度融入我們的生活,從智能家居的便捷操控,到車(chē)載電子的安全駕駛輔助,再到智能玩具的趣味互動(dòng),語(yǔ)音識(shí)別
    的頭像 發(fā)表于 08-11 14:08 ?989次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>交互升級(jí),九芯<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片來(lái)助力

    普強(qiáng)智能語(yǔ)音技術(shù)重新定義車(chē)載交互邊界

    普強(qiáng)憑借自主研發(fā)的智能語(yǔ)音技術(shù),為某國(guó)內(nèi)頭部車(chē)企提供的語(yǔ)音前處理、喚醒詞、ASR、TTS等技術(shù)模塊,構(gòu)建覆蓋泰語(yǔ)、俄語(yǔ)、韓語(yǔ)、日語(yǔ)等多語(yǔ)種的
    的頭像 發(fā)表于 07-11 14:00 ?1186次閱讀

    智能語(yǔ)音交互別再瞎選語(yǔ)音芯片了!NRK3502 才是你的最優(yōu)解!

    在科技飛速發(fā)展的當(dāng)下,智能產(chǎn)品如潮水般涌入我們的生活,從智能家居到智能醫(yī)療,從智能玩具到工業(yè)控制,語(yǔ)音交互
    的頭像 發(fā)表于 07-10 07:03 ?667次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>交互別再瞎選<b class='flag-5'>語(yǔ)音</b>芯片了!NRK3502 才是你的最優(yōu)解!

    藍(lán)牙語(yǔ)音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍(lán)牙語(yǔ)音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進(jìn)步的縮影。其便捷的操作、智能語(yǔ)音交互和低功耗設(shè)計(jì),為用戶(hù)
    發(fā)表于 06-01 20:24

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語(yǔ)音機(jī)器人逐漸成為人們生活和工作中的得力助手。明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板憑借強(qiáng)大性能與豐富功能,為語(yǔ)音機(jī)器人的發(fā)展注入新動(dòng)力,成為該領(lǐng)域的變革力量。 SSD2351開(kāi)發(fā)板
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTV系列語(yǔ)音芯片:以技術(shù)創(chuàng)新賦能智能語(yǔ)音交互

    在萬(wàn)物互聯(lián)的智能化時(shí)代,語(yǔ)音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語(yǔ)音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列語(yǔ)音芯片,持續(xù)為
    的頭像 發(fā)表于 05-21 08:45 ?731次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語(yǔ)音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>交互

    藍(lán)牙語(yǔ)音遙控國(guó)產(chǎn)適用芯片HS6621

    智能家居的時(shí)代,科技正在改變我們的生活方式。藍(lán)牙語(yǔ)音遙控器,作為智能家居的關(guān)鍵組成部分,正在重新定義用戶(hù)與設(shè)備之間的互動(dòng)方式。用戶(hù)對(duì)著藍(lán)牙語(yǔ)音遙控器,只要輕說(shuō)一句話(huà)就可以搞定很多復(fù)雜
    發(fā)表于 04-30 16:21

    智能收銀語(yǔ)音交互新標(biāo)桿—WT3000T8語(yǔ)音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語(yǔ)音合成芯片應(yīng)運(yùn)而生,專(zhuān)為滿(mǎn)足新零售場(chǎng)景下智能收銀終端的語(yǔ)音交互需求而設(shè)計(jì)。
    的頭像 發(fā)表于 04-24 08:45 ?1061次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語(yǔ)音</b>交互新標(biāo)桿—WT3000T8<b class='flag-5'>語(yǔ)音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    智能語(yǔ)音交互方案在客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶(hù)帶來(lái)了全新的體驗(yàn)。 語(yǔ)音識(shí)別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專(zhuān)屬服務(wù) 語(yǔ)音識(shí)別技術(shù)作為智能語(yǔ)音交互的基礎(chǔ),
    的頭像 發(fā)表于 04-11 14:35 ?823次閱讀