91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌的智能助理Google Assistant 開(kāi)啟了多語(yǔ)言支持

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-09-02 09:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從今天開(kāi)始,谷歌的智能助理可以同時(shí)說(shuō)兩種語(yǔ)言了!這意味著雙語(yǔ)家庭可以用任何一種語(yǔ)言進(jìn)行查詢(xún),而無(wú)需每次都更改設(shè)置。聽(tīng)起來(lái)簡(jiǎn)單,實(shí)現(xiàn)這一功能所需的技術(shù)可不簡(jiǎn)單,谷歌的口語(yǔ)識(shí)別LangID技術(shù)已經(jīng)開(kāi)發(fā)了5年!

使用 Google Assistant 的 Google Home Mini

多語(yǔ)家庭正變得越來(lái)越普遍,有一些研究發(fā)現(xiàn)多語(yǔ)人口已經(jīng)超過(guò)單語(yǔ)人口,而且這個(gè)數(shù)字還將繼續(xù)增長(zhǎng)。隨著多語(yǔ)用戶(hù)數(shù)量的不斷增加,開(kāi)發(fā)能夠同時(shí)支持多種語(yǔ)言的產(chǎn)品比以往任何時(shí)候都更加重要。

今天,谷歌的智能助理Google Assistant開(kāi)啟了多語(yǔ)言支持,允許用戶(hù)同時(shí)使用兩種不同的語(yǔ)言進(jìn)行查詢(xún),而無(wú)需返回語(yǔ)言設(shè)置。一旦用戶(hù)選擇了兩種支持的語(yǔ)言(目前支持的語(yǔ)言包括英語(yǔ)、西班牙語(yǔ)、法語(yǔ)、德語(yǔ)、意大利語(yǔ)和日語(yǔ)),他們就可以使用其中任一種語(yǔ)言與Google Assistant進(jìn)行對(duì)話(huà),智能助理也會(huì)以同一種語(yǔ)言做出回復(fù)。

在此之前,用戶(hù)必須為智能助理選擇一種語(yǔ)言設(shè)置,每次想要使用另一種語(yǔ)言時(shí)都必須更改設(shè)置。但現(xiàn)在,對(duì)于多語(yǔ)家庭來(lái)說(shuō),與谷歌助理交流的體驗(yàn)變得更加簡(jiǎn)單方便了。

Google Assistant現(xiàn)在能夠識(shí)別語(yǔ)言、解釋查詢(xún)并使用正確的語(yǔ)言提供回復(fù),而無(wú)需用戶(hù)手動(dòng)設(shè)置設(shè)置。

然而,實(shí)現(xiàn)這一功能并非易事。事實(shí)上,研究人員努力了多年,解決了許多具有挑戰(zhàn)性的問(wèn)題。最后,我們將問(wèn)題分解為三個(gè)獨(dú)立的部分:識(shí)別多種語(yǔ)言,理解多種語(yǔ)言,以及為Google Assistant用戶(hù)優(yōu)化多語(yǔ)言識(shí)別。

識(shí)別多種語(yǔ)言

人類(lèi)是有能力識(shí)別出別人在說(shuō)另一種語(yǔ)言的,即使他們自己不會(huì)說(shuō)這種語(yǔ)言,只需要注意語(yǔ)音的聲學(xué)特征(語(yǔ)調(diào)、音域等等)。但是,即使借助于全自動(dòng)語(yǔ)音識(shí)別系統(tǒng),定義一個(gè)自動(dòng)口語(yǔ)語(yǔ)言識(shí)別的計(jì)算框架也是很有挑戰(zhàn)性的。

研究者通常認(rèn)為,口語(yǔ)識(shí)別比基于文本的語(yǔ)言識(shí)別更具挑戰(zhàn)性,對(duì)于文本語(yǔ)言識(shí)別來(lái)說(shuō),相對(duì)簡(jiǎn)單的基于字典的技術(shù)已經(jīng)可以做得很好??谡Z(yǔ)詞匯的時(shí)間/頻率模式很難比較,口語(yǔ)詞匯很難劃界,因?yàn)榭谡Z(yǔ)可以毫無(wú)停頓地以不同的節(jié)奏說(shuō)話(huà),而且麥克風(fēng)可能會(huì)記錄除了語(yǔ)音之外的背景噪音。

在2013年,谷歌開(kāi)始使用深度神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)口語(yǔ)識(shí)別(LangID)技術(shù)。今天,谷歌最先進(jìn)的LangID模型已經(jīng)可以使用遞歸神經(jīng)網(wǎng)絡(luò)區(qū)分超過(guò)2000種可供選擇的語(yǔ)言對(duì)。遞歸神經(jīng)網(wǎng)絡(luò)特別適用于序列建模問(wèn)題,例如語(yǔ)音識(shí)別、語(yǔ)音檢測(cè)、說(shuō)話(huà)人識(shí)別等。研究人員遇到的挑戰(zhàn)之一是使用更大的音頻集——獲取能夠自動(dòng)理解多種語(yǔ)言的模型,并達(dá)到允許這些模型正常工作的質(zhì)量標(biāo)準(zhǔn)。

理解多種語(yǔ)言

要同時(shí)理解一種以上的語(yǔ)言,需要并行地運(yùn)行多個(gè)進(jìn)程,每個(gè)進(jìn)程都會(huì)產(chǎn)生增量結(jié)果,這樣智能助理不僅可以識(shí)別查詢(xún)所使用的語(yǔ)言,還可以解析查詢(xún)以創(chuàng)建可操作的命令。

例如,即使是單語(yǔ)環(huán)境,如果用戶(hù)要求“設(shè)一個(gè)下午6點(diǎn)的鬧鈴”,谷歌助理必須理解“設(shè)置鬧鈴”意味著打開(kāi)時(shí)鐘app,完成“6pm”的顯式參數(shù),并推斷鬧鐘應(yīng)該設(shè)在今天。為任何一對(duì)支持的語(yǔ)言實(shí)現(xiàn)這個(gè)功能都是一項(xiàng)挑戰(zhàn),因?yàn)橹悄苤硇枰獔?zhí)行與單語(yǔ)環(huán)境時(shí)相同的工作,但現(xiàn)在還必須另外啟用LangID。這不僅是一個(gè)語(yǔ)言識(shí)別系統(tǒng),而是相當(dāng)于兩個(gè)單語(yǔ)言識(shí)別系統(tǒng)。

更重要的是,Google Assistan以及在用戶(hù)查詢(xún)中異步引用的其他服務(wù)會(huì)生成需要在幾毫秒內(nèi)評(píng)估的實(shí)時(shí)增量結(jié)果。這是借助另外一種算法實(shí)現(xiàn)的,該算法使用LangID生成的候選語(yǔ)言的概率、我們對(duì)轉(zhuǎn)錄的信心以及用戶(hù)的偏好(例如,最喜歡的藝術(shù)家)對(duì)兩個(gè)語(yǔ)音識(shí)別系統(tǒng)提供的轉(zhuǎn)錄假設(shè)進(jìn)行排序。

Google Assistant使用的多語(yǔ)言語(yǔ)音識(shí)別系統(tǒng)與標(biāo)準(zhǔn)單語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的示意圖。排序算法用于從兩個(gè)單語(yǔ)語(yǔ)音識(shí)別器中選擇最佳的識(shí)別假設(shè),利用了用戶(hù)的相關(guān)信息和增量的langID結(jié)果。

當(dāng)用戶(hù)停止說(shuō)話(huà)時(shí),該模型不僅確定了用戶(hù)所講的語(yǔ)言,還確定了所講的內(nèi)容。當(dāng)然,這個(gè)過(guò)程需要一個(gè)復(fù)雜的架構(gòu),增加了處理成本,并可能造成不必要的延遲。

優(yōu)化多語(yǔ)識(shí)別模型

為了最大限度地減少這些不良影響,系統(tǒng)決定使用哪種語(yǔ)言的速度越快越好。如果系統(tǒng)在用戶(hù)完成查詢(xún)之前確定了所使用的語(yǔ)言,那么它將停止通過(guò)losing recognizer運(yùn)行用戶(hù)的語(yǔ)音,并丟棄losing hypothesis,從而降低處理成本,減少任何潛在的延遲。

考慮到這一點(diǎn),我們嘗試了優(yōu)化系統(tǒng)的幾種方法。

我們考慮的一個(gè)用例是,人們通常在一個(gè)完整查詢(xún)過(guò)程中使用相同的語(yǔ)言(這個(gè)語(yǔ)言通常也是用戶(hù)希望智能助理回復(fù)使用的語(yǔ)言),除了詢(xún)問(wèn)某個(gè)東西用不同語(yǔ)言怎樣說(shuō)之外。這意味著,在大多數(shù)情況下,關(guān)注查詢(xún)的開(kāi)頭部分就可以讓智能助理對(duì)所使用的語(yǔ)言進(jìn)行初步猜測(cè),甚至在包含不同語(yǔ)言實(shí)體的句子中也是如此。

有了這種早期識(shí)別,我們就可以像處理單語(yǔ)查詢(xún)那樣,通過(guò)切換到單語(yǔ)語(yǔ)音識(shí)別器來(lái)簡(jiǎn)化任務(wù)。然而,快速?zèng)Q定如何以及何時(shí)切換到一個(gè)單語(yǔ)言,在最后會(huì)需要一個(gè)技術(shù)轉(zhuǎn)折:具體來(lái)說(shuō),我們使用隨機(jī)森林(random forest)方法,結(jié)合多個(gè)上下文信號(hào),例如正在使用的設(shè)備類(lèi)型、發(fā)現(xiàn)的語(yǔ)音假設(shè)的數(shù)量、多久收到類(lèi)似的假設(shè)、各個(gè)語(yǔ)音識(shí)別器的不確定性、以及每種語(yǔ)言的使用頻率等。

另外一種簡(jiǎn)化和改進(jìn)系統(tǒng)質(zhì)量的方法是限制用戶(hù)可以選擇的候選語(yǔ)言列表。用戶(hù)可以谷歌智能助理設(shè)備目前支持的六種語(yǔ)言中選擇兩種語(yǔ)言,這已經(jīng)能夠支持大多數(shù)多語(yǔ)使用者。

不過(guò),隨著LangID技術(shù)的不斷改進(jìn),谷歌希望接下來(lái)能夠解決三語(yǔ)支持的問(wèn)題,這將進(jìn)一步提升多語(yǔ)用戶(hù)群的體驗(yàn)。而且,谷歌負(fù)責(zé)產(chǎn)品的副總裁 Nick Fox 此前表示,接下來(lái)的幾個(gè)月里 Google Assistant 將增加支持丹麥語(yǔ)、荷蘭語(yǔ)、印地語(yǔ)、印度尼西亞語(yǔ)、挪威語(yǔ)、瑞典語(yǔ)和泰語(yǔ)。到今年年底,谷歌助理將支持超過(guò) 30 種語(yǔ)言,覆蓋 Android 手機(jī)使用語(yǔ)言的 95%。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111488
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107871

原文標(biāo)題:谷歌雙語(yǔ)助理來(lái)了!中英夾雜也不怕,遞歸神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林顯神威

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智能顯示模塊支持腳本語(yǔ)言嗎?

    智能顯示模塊支持腳本語(yǔ)言嗎?
    發(fā)表于 02-26 11:18

    RK平臺(tái)ROS2適配全指南:從編譯到運(yùn)行,手把手搞定嵌入式機(jī)器人開(kāi)發(fā)

    Operating System 2)作為新一代機(jī)器人操作系統(tǒng),在分布式通信、實(shí)時(shí)性、多語(yǔ)言支持上的升級(jí),更是嵌入式機(jī)器人開(kāi)發(fā)的核心框架。
    的頭像 發(fā)表于 02-06 16:42 ?3606次閱讀
    RK平臺(tái)ROS2適配全指南:從編譯到運(yùn)行,手把手搞定嵌入式機(jī)器人開(kāi)發(fā)

    京東多語(yǔ)言質(zhì)量解決方案

    一、業(yè)界多語(yǔ)言面臨的通用挑戰(zhàn)是什么 做這個(gè)事之前,我們先看看業(yè)界做了什么。 ??阿里巴巴全球化測(cè)試技術(shù)介紹? ??螞蟻全球化無(wú)線端質(zhì)量解決方案? ??談?wù)?b class='flag-5'>多語(yǔ)言測(cè)試? 總結(jié)下來(lái),需要面臨3個(gè)通用
    的頭像 發(fā)表于 01-13 16:18 ?951次閱讀
    京東<b class='flag-5'>多語(yǔ)言</b>質(zhì)量解決方案

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開(kāi)源模型

    。 ? 公司發(fā)布的基于TL721X系列芯片的TL-EdgeAI平臺(tái),支持谷歌LiteRT、TVM等開(kāi)源模型,是目前世界上功耗最低的智能物聯(lián)網(wǎng)連接協(xié)議平臺(tái)。其芯片已在谷歌
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    阿里巴巴國(guó)際站關(guān)鍵字搜索 API 實(shí)戰(zhàn):3 步搞定多語(yǔ)言適配 + 限流破局,詢(xún)盤(pán)量提升 40%

    跨境電商API開(kāi)發(fā)常陷合規(guī)、多語(yǔ)言、限流等坑。本文詳解從國(guó)際合規(guī)(GDPR/CCPA)到參數(shù)優(yōu)化、數(shù)據(jù)結(jié)構(gòu)化及區(qū)域化搜索的全鏈路方案,附Python代碼模板與緩存重試架構(gòu),助力提升調(diào)用成功率至99%+,精準(zhǔn)詢(xún)盤(pán)增長(zhǎng)42%。
    的頭像 發(fā)表于 10-20 14:44 ?1756次閱讀

    速賣(mài)通全球運(yùn)營(yíng)利器:商品詳情接口多語(yǔ)言 + 合規(guī) + 物流適配技術(shù)全解析

    速賣(mài)通全球化適配是跨境成功關(guān)鍵!本文詳解2025最新接口方案,涵蓋多語(yǔ)言智能翻譯、合規(guī)自動(dòng)校驗(yàn)、物流精準(zhǔn)推薦與性能優(yōu)化四大模塊,助力商家提升轉(zhuǎn)化率30%+,降低風(fēng)險(xiǎn),提效80%。附實(shí)操代碼與新手三步走策略,適合所有想出海的賣(mài)家。
    的頭像 發(fā)表于 10-16 09:30 ?578次閱讀
    速賣(mài)通全球運(yùn)營(yíng)利器:商品詳情接口<b class='flag-5'>多語(yǔ)言</b> + 合規(guī) + 物流適配技術(shù)全解析

    谷歌查找我的設(shè)備配件(Google Find My Device Accessory)詳解和應(yīng)用

    谷歌查找我的設(shè)備配件(Google Find My Device Accessory)介紹 谷歌查找我的設(shè)備配件是與谷歌 “查找我的設(shè)備” 應(yīng)用程序配合使用的配件,旨在幫助用戶(hù)更方便地
    發(fā)表于 08-31 21:10

    用藥提醒新升級(jí):WT588E02B-8S語(yǔ)音提示芯片實(shí)現(xiàn)語(yǔ)言播報(bào)

    老齡化趨勢(shì)下,老年群體用藥錯(cuò)漏問(wèn)題突出,傳統(tǒng)藥盒缺乏有效提醒功能。健康管理智能化需求推動(dòng)下,語(yǔ)音交互成為提升藥盒實(shí)用性的關(guān)鍵。而產(chǎn)品全球化布局中,多語(yǔ)言適配需求迫切,催生了支持靈活語(yǔ)音更新的專(zhuān)用芯片
    的頭像 發(fā)表于 08-13 16:32 ?792次閱讀

    匠芯創(chuàng)發(fā)布新版GUI開(kāi)發(fā)工具 新增多國(guó)語(yǔ)言設(shè)置等功能

    ,為開(kāi)發(fā)者提供直觀的參考。 多國(guó)語(yǔ)言示例模板 該模板重點(diǎn)演示不同語(yǔ)言之間的切換流程,幫助開(kāi)發(fā)者快速掌握多語(yǔ)言支持的實(shí)現(xiàn)方法。 視頻播
    發(fā)表于 07-16 13:54

    Google Fast Pair服務(wù)簡(jiǎn)介

    谷歌賬號(hào),并嘗試配對(duì)已保存到其谷歌賬號(hào)的設(shè)備時(shí)所發(fā)生的一系列事件。在此過(guò)程中,新手機(jī)會(huì)識(shí)別出廣播里的Model ID ,它已保存到用戶(hù)的 Google 帳號(hào)中,并提供一條通知,以加快將該設(shè)備與這部
    發(fā)表于 06-29 19:28

    中科曙光DeepAI深算智能引擎全面支持Qwen3

    日前,Qwen3正式發(fā)布并全部開(kāi)源8款混合推理模型。作為Qwen系列中的最新一代大型語(yǔ)言模型,Qwen3在推理、指令遵循、工具調(diào)用、多語(yǔ)言能力等方面實(shí)現(xiàn)全面增強(qiáng)。
    的頭像 發(fā)表于 05-06 15:17 ?1175次閱讀

    廣州唯創(chuàng)電子WT3000A離在線TTS語(yǔ)音提示器芯片IC設(shè)計(jì)方案深度解析

    引言:語(yǔ)音交互的智能化躍遷在全球化與智能化深度融合的今天,語(yǔ)音交互設(shè)備的應(yīng)用場(chǎng)景已從單一提示功能向多語(yǔ)言支持、情感化表達(dá)及AI深度交互演進(jìn)。傳統(tǒng)離線語(yǔ)音方案受限于語(yǔ)種單一、存儲(chǔ)容量不足等問(wèn)題,而純
    的頭像 發(fā)表于 04-25 09:13 ?802次閱讀
    廣州唯創(chuàng)電子WT3000A離在線TTS語(yǔ)音提示器芯片IC設(shè)計(jì)方案深度解析

    智能收銀語(yǔ)音交互新標(biāo)桿—WT3000T8語(yǔ)音合成芯片TTS技術(shù)應(yīng)用解析

    性的TTS技術(shù)集成,解決傳統(tǒng)收銀系統(tǒng)語(yǔ)音播報(bào)存在的多語(yǔ)言支持不足、資源占用過(guò)高、語(yǔ)音定制不靈活等行業(yè)痛點(diǎn)。二、芯片核心特性多模態(tài)語(yǔ)音處理架構(gòu)?采用32位240M
    的頭像 發(fā)表于 04-24 08:45 ?1043次閱讀
    <b class='flag-5'>智能</b>收銀語(yǔ)音交互新標(biāo)桿—WT3000T8語(yǔ)音合成芯片TTS技術(shù)應(yīng)用解析

    S1C31D50/51/41愛(ài)普生MCU系列語(yǔ)音芯片助力智能語(yǔ)音應(yīng)用

    與背景音樂(lè)的協(xié)同播放、多語(yǔ)言支持以及靈活的音調(diào)和語(yǔ)速調(diào)整等。此外,該系列芯片的低功耗設(shè)計(jì)和高壓縮率存儲(chǔ)算法,使其在保持高性能的同時(shí),顯著降低了功耗和存儲(chǔ)需求,為電池供電設(shè)備和對(duì)功耗敏感的應(yīng)用場(chǎng)景提供理想的解決方案。
    的頭像 發(fā)表于 03-15 14:13 ?1085次閱讀
    S1C31D50/51/41愛(ài)普生MCU系列語(yǔ)音芯片助力<b class='flag-5'>智能</b>語(yǔ)音應(yīng)用

    廣和通發(fā)布QuickTaste AI智能解決方案

    近日,在2025世界移動(dòng)通信大會(huì)(MWC Barcelona 2025)期間,廣和通發(fā)布QuickTaste AI,為餐飲行業(yè)帶來(lái)革新性的AI人機(jī)交互和多語(yǔ)言翻譯體驗(yàn)。
    的頭像 發(fā)表于 03-12 09:11 ?1032次閱讀