91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google:將AI 應(yīng)用到語言翻譯上,進而彌平語言不通的問題

yrlT_lianggezhi ? 2018-01-29 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Google 的使命是匯集全球資訊,并且讓所有人都能使用這些資訊,不過要能理解各式資訊,最困難的就是語言隔閡,因此在東京舉辦#MadeWithAI 亞太區(qū)媒體活動請來了Google 語言研究計畫總經(jīng)理Linne Ha 來談?wù)勗趺磳I 應(yīng)用到語言翻譯上,進而彌平語言不通的問題。

受惠于智慧型手機的普及,網(wǎng)路人口在最近這幾年高速成長,不過網(wǎng)路上有接近50% 的內(nèi)容仍是以英文為主,對于非以英文為母語的人來說,想要獲得資料就多了一道門檻,能讓每個人自在的用自己的原生語言在網(wǎng)路上搜集或提供資料是Google 的目標,因此在推動語言翻譯或發(fā)展上Google 做了非常多的努力。

▲Google語言研究計畫總經(jīng)理Linne Ha。

推動各種語言上網(wǎng),統(tǒng)一碼(Unicode)是重點

不同語言要能在網(wǎng)路上流動,最重要的就是該語言要能被閱讀,若是出現(xiàn)亂碼或空白文字就容易成為閱讀或理解的障礙,因此Google 長期和統(tǒng)一碼(Unicode)聯(lián)盟合作,鼓勵更多國家利用統(tǒng)一碼的編碼系統(tǒng)上網(wǎng),例如Google 大力鼓勵緬甸不要再使用非統(tǒng)一碼的字型。

有了統(tǒng)一碼這項文字系統(tǒng)后,電腦文字編碼就有了一套標準,下一個挑戰(zhàn)就是要確保自行能正確地被轉(zhuǎn)為網(wǎng)路或手機上的文字,去年Google 推出開放的Noto 字型,可以支援800 種語言、11 億個文字,可呈現(xiàn)各式各樣的文字。

但這樣還不夠,雖然文字能呈現(xiàn),但卻不是每個人都知道如何輸入文字,因此除了Gboard 提供300 多種鍵盤、 97 種手寫系統(tǒng)、語音輸入等方法讓使用者可以依照自己方便的方式來輸入文字。

在開發(fā)手寫系統(tǒng)上,Google 也花了一番心力,由于每個人的字跡都不同,因此Google 導(dǎo)入人工智慧技術(shù),搜集很多自愿者的手寫范本,讓機器學(xué)習(xí)來辨認文字和書寫風(fēng)格,進而達到更精確的手寫辨識。語音輸入方面則是透過GOOG-411 的服務(wù)來搜集語音資料,類似我們的查號臺,當(dāng)有人打電話進去問問題查電話,GOOG-411 就會幫忙轉(zhuǎn)接,在這樣的過程中Google 建立了大量的語音資料庫范本,英文語音搜集還算滿順利的。不過其他語言就沒這么容易了,雖然說Google 有和專門經(jīng)營文字和語音資料庫的業(yè)者合作,但有些語言本身的資料庫就較少,例如廣東話,因此Google 又開啟了下一階段的任務(wù)。

語音搜尋實驗,搜集準確的語音資料

既然缺乏語音資料,Google 就開始想方法來搜集各種語言的語音訊息,比方說2010 年Google 推出了荷蘭語的Word of Mouth 計畫,提供參與實驗的使用者手機來搜集他們和親友間的對話樣本,進而得到準確的語音資料。

有了語音資料之后下個問題則是口音和俗語,關(guān)于這方面的資料目前Google 仍正在努力發(fā)展中,不過經(jīng)過過去這么長一段時間的努力,到2012 年之后,語音搜尋已可支援到50 種語言,Google 也導(dǎo)入了深度神經(jīng)網(wǎng)路提升語音辨識的準確性,今年則再新增30 多種的語音輸入,甚至包含了非洲兩種主要語言,斯瓦希里語(Swahili)和阿姆哈拉語(Amharic),對于彌平語言隔閡來說,這是一個重要的里程碑。

怎么將機器學(xué)習(xí)應(yīng)用在語音服務(wù)上

既然有了機器學(xué)習(xí)這項技術(shù),也就意味著Google 能透過演算以及建構(gòu)更有效的模型來解決語音辨識問題。

Google 這回用了一個超級低成本的預(yù)算(2000 美金)來增加孟加拉語的文字轉(zhuǎn)語音服務(wù),首先先準備一套麥克風(fēng)、USB 轉(zhuǎn)接器和前置聲音放大器,并建立一組便攜式的錄音工作室「ChitChat」讓實驗者可以錄音。

工具有了,下一步就是找來15 名孟加拉的Googler,錄制了2000 多個從維基百科擷取出來的孟加拉語和英語,實驗者每隔30 分鐘至60 分鐘就錄制250 多個句子,平衡的混音成幾個不同的聲音后,再交給Google 社群投票看看大家最偏好哪一個聲音,最終產(chǎn)出的聲學(xué)模型剛好就可以代表平均型的人聲,成功推出了孟加拉語的文字轉(zhuǎn)語音服務(wù)。

除了把更多語言放到網(wǎng)路上,Google 也著手發(fā)展方言領(lǐng)域,像是英文就分成美式英文、英式英文、澳洲英文等等,最近Google 正著手處理新加坡式英語,另外,西班牙語、阿拉伯語也是Google 努力的方向。

Google 的中文語音什么時候會有更多突破?

至于***人最常用的中文呢?Google 語言研究計畫總經(jīng)理Linne Ha 不諱言,中文真的是很有挑戰(zhàn)的語言,比方說中國人說著中文、寫著簡體中文,***人說也說著中文、但寫的是繁體中文,香港人寫的也是繁體中文、不過說的是廣東話,繁體中文、簡體中文、廣東話間各有連結(jié)但又不盡相似。

過去Google 是使用「單一語言模式」來處理,比方說***人說的中文就套用繁體中文資料庫,香港人說廣東話則套用另外一個繁體中文資料庫,但這樣的語音辨識效果發(fā)展有限,近期Google 嘗試著將相近的語言加進同一個模型中,目前的實驗結(jié)果還不錯。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1807

    瀏覽量

    60535
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39820

    瀏覽量

    301496
  • 語言
    +關(guān)注

    關(guān)注

    1

    文章

    97

    瀏覽量

    24841

原文標題:【Google 談人工智慧】有了機器學(xué)習(xí)后,語言還會是隔閡嗎

文章出處:【微信號:lianggezhizi,微信公眾號:兩個質(zhì)子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    視美泰發(fā)布AI即時翻譯機解決方案,硬核配置+多語種覆蓋破解跨語言溝通難題

    在全球化深入推進與AI技術(shù)規(guī)?;逃玫碾p重驅(qū)動下,跨語言溝通需求正迎來爆發(fā)式增長。近日,視美泰正式發(fā)布AI即時翻譯機解決方案,以“核心硬件+智能算法+多模態(tài)交互”的完整技術(shù)矩陣,依托在
    的頭像 發(fā)表于 12-03 10:50 ?1081次閱讀
    視美泰發(fā)布<b class='flag-5'>AI</b>即時<b class='flag-5'>翻譯</b>機解決方案,硬核配置+多語種覆蓋破解跨<b class='flag-5'>語言</b>溝通難題

    智能“翻譯官”:MODBUS轉(zhuǎn)PROFIBUS網(wǎng)關(guān),解鎖攪拌站無人裝載新紀元

    智能“翻譯官”:MODBUS轉(zhuǎn)PROFIBUS網(wǎng)關(guān),解鎖攪拌站無人裝載新紀元 在工業(yè)自動化的浪潮中,數(shù)據(jù)協(xié)議的“語言不通”常常成為系統(tǒng)聯(lián)通的絆腳石。在一家現(xiàn)代化攪拌站內(nèi),就上演了這樣一場精彩的“溝通
    的頭像 發(fā)表于 11-21 14:38 ?263次閱讀
    智能“<b class='flag-5'>翻譯</b>官”:MODBUS轉(zhuǎn)PROFIBUS網(wǎng)關(guān),解鎖攪拌站無人裝載新紀元

    匯編語言的起源

    (opcode),比如加法指令就是00000011。編譯器的作用,就是高級語言寫好的程序,翻譯成一條條操作碼。 對于人類來說,二進制程序是不可讀的,根本看不出來機器干了什么。為了解決可讀性的問題,以及偶爾
    發(fā)表于 11-20 07:19

    一文了解Mojo編程語言

    Mojo 是一種由 Modular AI 公司開發(fā)的編程語言,旨在 Python 的易用性與 C 語言的高性能相結(jié)合,特別適合人工智能(AI
    發(fā)表于 11-07 05:59

    告別協(xié)議“語言不通”!Modbus轉(zhuǎn)Profinet伺服電機接入的終極解決方案

    在自動化產(chǎn)線的調(diào)試現(xiàn)場,您是否曾為不同協(xié)議設(shè)備間的“語言障礙”而焦頭爛額?當(dāng)手頭的優(yōu)質(zhì)伺服電機僅支持Modbus,而您的主控系統(tǒng)卻基于Profinet,這道協(xié)議鴻溝是否讓您夜不能寐?別擔(dān)心
    的頭像 發(fā)表于 10-22 15:05 ?258次閱讀
    告別協(xié)議“<b class='flag-5'>語言不通</b>”!Modbus轉(zhuǎn)Profinet伺服電機接入的終極解決方案

    聲智科技AI翻譯耳機重塑智能聽覺體驗

    在日益緊密的全球化浪潮中,跨語言溝通的障礙正在被前沿的聲學(xué)AI技術(shù)逐步瓦解。聲智AI翻譯耳機,憑借深厚的聲學(xué)AI積累,率先實現(xiàn)了“跨語種音色
    的頭像 發(fā)表于 10-21 15:28 ?978次閱讀
    聲智科技<b class='flag-5'>AI</b><b class='flag-5'>翻譯</b>耳機重塑智能聽覺體驗

    國慶出國游,時空壺新T1翻譯機,首個端側(cè)模型突破助力跨語言交流

    的旗艦機型,最大亮點是搭載業(yè)內(nèi)首個端側(cè)AI翻譯模型。這一模型原本依賴云端算力的復(fù)雜AI翻譯模型,通過先進的模型剪枝、量化壓縮等技術(shù),巧妙部
    的頭像 發(fā)表于 09-12 12:20 ?1026次閱讀
    國慶出國游,時空壺新T1<b class='flag-5'>翻譯</b>機,首個端側(cè)模型突破助力跨<b class='flag-5'>語言</b>交流

    當(dāng)翻譯失去網(wǎng)絡(luò),時空壺新T1翻譯機開創(chuàng)首個離線模型賦能全球溝通新體驗

    全球首創(chuàng)的離線端側(cè)AI翻譯模型,這一技術(shù)突破堪稱行業(yè)變革性創(chuàng)舉。與傳統(tǒng)依賴網(wǎng)絡(luò)或僅靠靜態(tài)離線語言包的翻譯設(shè)備不同,T1的離線模型基于先進的端側(cè)大模型輕量化技術(shù)搭建
    的頭像 發(fā)表于 09-08 16:52 ?1217次閱讀
    當(dāng)<b class='flag-5'>翻譯</b>失去網(wǎng)絡(luò),時空壺新T1<b class='flag-5'>翻譯</b>機開創(chuàng)首個離線模型賦能全球溝通新體驗

    工業(yè)自動化中的協(xié)議轉(zhuǎn)換:Modbus RTU轉(zhuǎn)Profinet網(wǎng)關(guān)在渦街流量計與西門子PLC通信中的應(yīng)用

    在工業(yè)自動化領(lǐng)域,實現(xiàn)不同協(xié)議設(shè)備間的無縫通信是提升生產(chǎn)效率的關(guān)鍵。當(dāng)渦街液體流量計這類高精度儀表需要與西門子PLC的Profinet網(wǎng)絡(luò)對接時,Modbus RTU轉(zhuǎn)Profinet網(wǎng)關(guān)便成為了一座“翻譯橋梁”,兩種語言不通
    的頭像 發(fā)表于 07-30 16:41 ?661次閱讀
    工業(yè)自動化中的協(xié)議轉(zhuǎn)換:Modbus RTU轉(zhuǎn)Profinet網(wǎng)關(guān)在渦街流量計與西門子PLC通信中的應(yīng)用

    水表界的“翻譯官”:讓CCLinkIE和Modbus TCP“無障礙聊天”!

    在水處理車間,工程師們常遇到這樣的尷尬:先進的控制系統(tǒng)用著“高速實時語”CCLinkIE,而老資格的水表卻堅持說“經(jīng)典通用語”Modbus TCP。兩者“語言不通”,數(shù)據(jù)傳輸出現(xiàn)“雞同鴨講”的窘境
    發(fā)表于 07-10 15:43

    CC-Link IE 轉(zhuǎn) Modbus TCP,閥門通訊的“雙語翻譯官”

    在工業(yè)自動化現(xiàn)場,設(shè)備間的“語言不通”是工程師們時常遇到的挑戰(zhàn)。例如,一套先進的控制系統(tǒng)可能采用高速的 CC-Link IE 網(wǎng)絡(luò),而現(xiàn)場大量的閥門、儀表卻只支持經(jīng)典的 Modbus TCP 協(xié)議
    的頭像 發(fā)表于 07-09 09:46 ?557次閱讀

    Modbus TCP轉(zhuǎn)Profibus網(wǎng)關(guān)如何快速把流量計接入到DCS?

    在工業(yè)自動化領(lǐng)域,設(shè)備間的協(xié)議互通往往如同語言不通的對話者,需要一位“翻譯官”才能實現(xiàn)高效協(xié)作。本文圍繞Modbus TCP轉(zhuǎn)Profibus網(wǎng)關(guān)的應(yīng)用,解析如何通過這一技術(shù)橋梁,
    的頭像 發(fā)表于 07-07 16:50 ?588次閱讀
    Modbus TCP轉(zhuǎn)Profibus網(wǎng)關(guān)如何快速把流量計接入到DCS?

    CC\\-Link IE “牽手” DeviceNet:讓你的壓力變送器老樹開新花!

    對工程師來說,少踩坑、多干活、數(shù)據(jù)穩(wěn),才是硬道理。下次再遇上設(shè)備“語言不通”的事兒,不妨試試這招“協(xié)議翻譯術(shù)”,說不定能解鎖新副本。
    發(fā)表于 06-13 14:05

    【教程】使用NS1串口服務(wù)器對接智普清言免費AI語言模型

    AI語言模型可以幫助我們解決各種問題,如翻譯、寫文案、創(chuàng)作詩歌、解決數(shù)學(xué)問題、情感陪伴等等。今天教大家如何使用NS1串口服務(wù)器模塊實現(xiàn)對接智普清言AI
    的頭像 發(fā)表于 06-12 19:33 ?801次閱讀
    【教程】使用NS1串口服務(wù)器對接智普清言免費<b class='flag-5'>AI</b>大<b class='flag-5'>語言</b>模型

    TDE工業(yè)網(wǎng)關(guān):智能制造時代的“數(shù)據(jù)翻譯官”

    在工業(yè)4.0時代,工廠里的傳感器、PLC、機器人等設(shè)備每分每秒都在產(chǎn)生海量數(shù)據(jù)。然而,這些設(shè)備往往“語言不通”——不同的通信協(xié)議、接口標準讓數(shù)據(jù)孤島問題突出。如何讓這些數(shù)據(jù)高效流動,并轉(zhuǎn)化為生產(chǎn)決策?答案就是天拓四方TDE工業(yè)網(wǎng)關(guān)。
    的頭像 發(fā)表于 03-20 16:12 ?877次閱讀