91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

無法被AI識別翻譯的古老語言,將去何方?

如意 ? 來源:OFweek電子工程網(wǎng) ? 作者:學(xué)術(shù)頭條 ? 2020-10-26 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語言是文化的有機(jī)組成部分,也是文化的載體,世界文明的多樣性在很大程度上表現(xiàn)為世界語言的多樣性。而在 21 世紀(jì)的今天,語言學(xué)家們顯然已經(jīng)不滿足于傳統(tǒng)的、對已知語言的研究。相反,許多科學(xué)家開始利用計算機(jī)技術(shù),去探索已經(jīng)消失的、幾乎成為謎底的滅絕古老語言。

近日,麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實驗室(Computer Science and Artificial Intelligence Laboratory 簡稱 CSAIL)的研究人員就開發(fā)出一種計算機(jī)算法,旨在幫助語言學(xué)家破譯歷史上已消失的語言。

無法“谷歌翻譯”的古老語言

如今,世界上現(xiàn)存約有 7100 種語言。然而,古時存在的大多數(shù)語言都已不再使用,幾近滅絕。數(shù)十種已滅絕語言也被認(rèn)為是“未破譯”的語言,也就是說,我們對它們的語法(grammar)、詞匯(vocabulary)或句法(syntax)了解不足,也無法理解其文本的意思。

圖 | 世界語言分布地圖 2018

而研究這些“未破譯”的語言,不僅僅是處于學(xué)術(shù)上的好奇心。還是因為,不理解語言,我們就會錯過與講這些語言的人有關(guān)的一整套知識體系。不幸的是,大多數(shù)滅絕語言的相關(guān)記錄極少,因此,科學(xué)家無法使用谷歌翻譯之類的機(jī)器翻譯工具或AI算法來對其進(jìn)行解密。

而傳統(tǒng)的研究方法是,找出目標(biāo)語言的“相關(guān)”語言來作比較研究,例如同一語系或相似度較高的現(xiàn)存語言。然而,有些語言并沒有對應(yīng)的、已被深入研究過的“相關(guān)”語言,并且它們通常缺少諸如空格和標(biāo)點符號之類的傳統(tǒng)分隔符(想像一下,要解密出用這種語言寫出的文字該有多么令人頭禿)。

但是,CSAIL 的研究人員發(fā)明的新系統(tǒng),已被證明能夠自動破譯消失的語言,且無需對其與其他語言的關(guān)系有深入的了解。他們還表明,該系統(tǒng)自身就可以確定語言之間的關(guān)系,并可以用它來證實最近的一項表明 Iberian 語言實際上與 Basque 語言無關(guān)的學(xué)術(shù)研究。

語言破譯:從文本到矢量的轉(zhuǎn)變

此研究由 MIT 教授 Regina Barzilay 牽頭,依賴于基于歷史語言學(xué)(historical linguistics)見解的幾項原則。其中一條原則是,一種給定的語言很少會直接添加或刪除整個音節(jié),但是很可能會發(fā)生某些近似發(fā)音的替換。比如,母語中帶有“ p”發(fā)音的單詞可能會在其后代演變中變?yōu)椤?b”,但是由于明顯的發(fā)音差異,變?yōu)椤?k”的可能性則較小。

通過整合這些原則和其他語言學(xué)約束,Barzilay 等人的新算法學(xué)習(xí)將語言發(fā)音嵌入多維向量空間,在該多維空間中,相應(yīng)矢量之間的距離反映了不同發(fā)音的差異。這種設(shè)計使他們能夠捕獲語言變化的相關(guān)特征,并將這些特征表達(dá)為計算約束(computational constraints)。因此,它可以評估兩種語言之間的相似度。實際上,當(dāng)對已知語言進(jìn)行測試時,它甚至可以準(zhǔn)確地識別出該語言屬于哪個語系(language families)。例如英語、德語同屬于日耳曼語系。

不僅如此,算法生成的模型可以將古語言中的單詞進(jìn)行細(xì)分,并將其一一映射到“相關(guān)”語言中的對應(yīng)單詞上去。研究團(tuán)隊的最終目標(biāo)是使該系統(tǒng)僅僅使用幾千個單詞,就能夠破譯數(shù)十年來語言學(xué)家們都無法理解的古語言。

機(jī)器翻譯相關(guān)研究

實際上,這并非 MIT 首個使用計算機(jī)技術(shù)破譯已消失語言的研究。

早在 2010 年,Barzilay 就和其他合作者一起,開發(fā)出一個新的計算機(jī)算法,該算法在幾個小時內(nèi)就破解了古老的猶太語言烏加里特語(Ugaritic)。除了幫助破譯“神秘的”八種左右古老語言外,這項工作還可以擴(kuò)大自動翻譯系統(tǒng)可以處理的語言數(shù)量。例如目前,谷歌翻譯支持103種語言,而破譯系統(tǒng)中使用的技術(shù)可以幫助其為數(shù)千種語言構(gòu)建詞典。

去年,Barzilay 等人也發(fā)表過一篇論文,文中使用改進(jìn)的計算機(jī)算法破譯了線形文字 B(Linear B,出現(xiàn)在公元前 1400 年左右)。他們說,“我們的翻譯腳本能夠以 67.3%的準(zhǔn)確率將線性文字 B 的同源詞轉(zhuǎn)換成對應(yīng)的希臘語。據(jù)我們所知,該試驗是自動解讀線性文字 B 的第一次嘗試。”

在未來的工作中,該團(tuán)隊希望擴(kuò)展到將文本與已知語言的相關(guān)單詞相關(guān)聯(lián)的范圍之外,這種方法被稱為“基于同源的破譯方法”。

Barzilay 說:“例如,我們可以識別文本中涉及到的所有人或地點的信息,然后可以根據(jù)已知的歷史證據(jù)對其進(jìn)行進(jìn)一步的調(diào)查。這些實體識別(entity recognition)方法如今已廣泛用于各種文本處理應(yīng)用程序中,并且具有很高的準(zhǔn)確性 ?!?br /> 責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111554
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4785

    瀏覽量

    98162
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40086

    瀏覽量

    301719
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    視美泰發(fā)布AI即時翻譯機(jī)解決方案,硬核配置+多語種覆蓋破解跨語言溝通難題

    在全球化深入推進(jìn)與AI技術(shù)規(guī)模化商用的雙重驅(qū)動下,跨語言溝通需求正迎來爆發(fā)式增長。近日,視美泰正式發(fā)布AI即時翻譯機(jī)解決方案,以“核心硬件+智能算法+多模態(tài)交互”的完整技術(shù)矩陣,依托在
    的頭像 發(fā)表于 12-03 10:50 ?1103次閱讀
    視美泰發(fā)布<b class='flag-5'>AI</b>即時<b class='flag-5'>翻譯</b>機(jī)解決方案,硬核配置+多語種覆蓋破解跨<b class='flag-5'>語言</b>溝通難題

    VS680 HDMI AI分析解決方案 #目標(biāo)識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    【飛凌OK-MX9596-C開發(fā)板試用】③云端AI拍照識別

    ://cloud.baidu.com/ 可以看到功能豐富,有語音技術(shù)、文字識別、人臉識別、自然語言處理(翻譯)等。 注冊賬號后 創(chuàng)建應(yīng)用——>文字
    發(fā)表于 11-01 22:12

    聲智科技AI翻譯耳機(jī)重塑智能聽覺體驗

    在日益緊密的全球化浪潮中,跨語言溝通的障礙正在被前沿的聲學(xué)AI技術(shù)逐步瓦解。聲智AI翻譯耳機(jī),憑借深厚的聲學(xué)AI積累,率先實現(xiàn)了“跨語種音色
    的頭像 發(fā)表于 10-21 15:28 ?1009次閱讀
    聲智科技<b class='flag-5'>AI</b><b class='flag-5'>翻譯</b>耳機(jī)重塑智能聽覺體驗

    USB 接口無法識別外接設(shè)備怎么辦??

    辦公插U盤傳文件、接移動硬盤存素材,或者連外接鍵盤辦公,難免會遇到USB接口無法識別設(shè)備的問題。很多人第一反應(yīng)以為“接口壞了”或“設(shè)備廢了”,其實80%的故障都是接口連接沒到位或者驅(qū)動出問題,也
    的頭像 發(fā)表于 09-17 16:28 ?5446次閱讀
    USB 接口<b class='flag-5'>無法</b><b class='flag-5'>識別</b>外接設(shè)備怎么辦??

    國慶出國游,時空壺新T1翻譯機(jī),首個端側(cè)模型突破助力跨語言交流

    國慶將至,眾多游客計劃出國旅行,跨語言交流的順暢與否成為影響旅行體驗的重要因素。時空壺新T1翻譯機(jī)作為行業(yè)技術(shù)領(lǐng)先產(chǎn)品,憑借其獨特優(yōu)勢,為游客在海外的溝通交流保駕護(hù)航。新T1作為時空壺翻譯機(jī)品類中
    的頭像 發(fā)表于 09-12 12:20 ?1043次閱讀
    國慶出國游,時空壺新T1<b class='flag-5'>翻譯</b>機(jī),首個端側(cè)模型突破助力跨<b class='flag-5'>語言</b>交流

    當(dāng)翻譯失去網(wǎng)絡(luò),時空壺新T1翻譯機(jī)開創(chuàng)首個離線模型賦能全球溝通新體驗

    全球首創(chuàng)的離線端側(cè)AI翻譯模型,這一技術(shù)突破堪稱行業(yè)變革性創(chuàng)舉。與傳統(tǒng)依賴網(wǎng)絡(luò)或僅靠靜態(tài)離線語言包的翻譯設(shè)備不同,T1的離線模型基于先進(jìn)的端側(cè)大模型輕量化技術(shù)搭建
    的頭像 發(fā)表于 09-08 16:52 ?1246次閱讀
    當(dāng)<b class='flag-5'>翻譯</b>失去網(wǎng)絡(luò),時空壺新T1<b class='flag-5'>翻譯</b>機(jī)開創(chuàng)首個離線模型賦能全球溝通新體驗

    聲智科技出席2025年北京市多語種AI語音翻譯大賽

    8月20日,由北京市科委、中關(guān)村管委會主辦,北京語言大學(xué)、北京第二外國語學(xué)院、北京市翻譯協(xié)會、中國人工智能百人會共同承辦的“2025年北京市多語種AI語音翻譯大賽”在中關(guān)村展示中心順利
    的頭像 發(fā)表于 08-25 17:18 ?1267次閱讀

    RK3576助力智慧安防:8路高清采集與AI識別

    )多路視頻整合難:不同攝像頭采集的畫面需要實時拼接,普通平臺處理延遲高。 2)智能化程度低:缺乏AI分析能力,無法自動識別異常事件。 3)遠(yuǎn)程調(diào)度受限:視頻傳輸延遲大,無法實時遠(yuǎn)程干預(yù)
    發(fā)表于 08-22 17:41

    KitProg3無法編程器正確識別怎么解決?

    KitProg3 默認(rèn)處于正確的 CMSIS DAP/bulk 模式。 問題:更改端口后,編程器無法正確識別 KitProg3, 采取的措施:更新 kitprog3 固件,根據(jù)
    發(fā)表于 07-23 08:12

    AI耳機(jī)變身翻譯官+會議總結(jié)大師?涂鴉AI音頻開發(fā)方案,讓耳機(jī)升級到下一個level

    在接入AI能力后,耳機(jī)這種日?;漠a(chǎn)品,能有多大的想象空間?它不僅能幫你輕松聽懂全球外語和地方方言,還能將語音轉(zhuǎn)化為文字、翻譯成不同語言,甚至自動總結(jié)會議要點、生成思維導(dǎo)圖,適配辦公、學(xué)習(xí)、跨
    的頭像 發(fā)表于 07-10 18:47 ?2118次閱讀
    <b class='flag-5'>AI</b>耳機(jī)變身<b class='flag-5'>翻譯</b>官+會議總結(jié)大師?涂鴉<b class='flag-5'>AI</b>音頻開發(fā)方案,讓耳機(jī)升級到下一個level

    時空壺 T1 離線翻譯機(jī):解鎖無網(wǎng)生活溝通自由

    頻頻“掉鏈子”。時空壺T1離線翻譯機(jī),憑借強(qiáng)大的端側(cè)AI模型與離線翻譯能力,為人們在多元生活場景中打破語言壁壘,帶來高效、穩(wěn)定且流暢的溝通體驗。一、全場景適配,出
    的頭像 發(fā)表于 06-05 10:30 ?946次閱讀
    時空壺 T1 離線<b class='flag-5'>翻譯</b>機(jī):解鎖無網(wǎng)生活溝通自由

    景區(qū)AI行為識別系統(tǒng)作用

    景區(qū)AI行為識別系統(tǒng)作用 景區(qū)AI行為識別系統(tǒng)是什么? 景區(qū)AI行為識別系統(tǒng)是利用人工智能技術(shù)(
    的頭像 發(fā)表于 05-07 15:32 ?1028次閱讀
    景區(qū)<b class='flag-5'>AI</b>行為<b class='flag-5'>識別</b>系統(tǒng)作用

    CYUSB3014無法識別為USB3.0設(shè)備怎么解決?

    。CYUSB3014的供電部分我參考了官方文檔,但是我用0歐姆電阻替代了磁珠。沒有磁珠可能會導(dǎo)致無法識別為USB3.0設(shè)備嗎?
    發(fā)表于 04-30 07:24