ICLR(International Conference on Learning Representations)對于深度學習領域的研究人員而言意義非凡。該會議于4月30日 - 5月3日在溫哥華舉行,全球頂尖AI研究實驗室的專家齊聚一堂,分享了他們的最新研究。NVIDIA的三大NVAIL(NVIDIA AI實驗室)合作伙伴——瑞士AI實驗室 (IDSIA)、紐約大學和東京大學,也和其他實驗室一起分享了他們的研究成果。
IDSIA研究人員的目標是讓機器人能像人類一樣自然而然地理解物質(zhì)世界;東京大學的團隊介紹了其改進聲音識別的創(chuàng)新方法;來自紐約大學和巴斯克大學的研究團隊介紹了他們?nèi)绾胃倪M機器翻譯語言的能力。
在研究人員和工程師的協(xié)助下,NVAIL項目將助力AI先驅(qū)始終引領潮流,并為學生提供支持,獲得先進的GPU計算能力。
萬物有起終有落
人類生來就能理解物質(zhì)世界:我們能夠在從未去過的房間中自如行走;如果鞋子掉了,我們知道會掉在地板上;我們也非常清楚我們不能穿越墻壁。即使是嬰兒也具備一些基本的物理概念。
但機器卻不能如此輕易地獲得這種能力?!叭缃?,訓練深度學習模型來理解‘萬物有起終有落’這樣的問題需要大量的數(shù)據(jù)和手動標記,”IDSIA博士生Sjoerd van Steenkiste說道。他和來自IDSIA以及加州大學伯克利分校的研究團隊協(xié)作,正在試圖去除海量數(shù)據(jù)和認為參與這兩項要求,以求簡化這一流程。
在一篇ICLR論文(Relational Neural Expectation Maximization: Unsupervised Discovery of Objects and their Interactions,研究人員描述了他們?nèi)绾卧诓煌度肴肆Φ那疤嵯掠柧?a href="http://www.makelele.cn/tags/神經(jīng)網(wǎng)絡/" target="_blank">神經(jīng)網(wǎng)絡,這一方式被稱為“無監(jiān)督式學習”。利用NVIDIA的DGX-1 AI超級計算機,他們訓練深度學習模型在場景中辨別單個對象并預測動作的結(jié)果。
最終,該研究能使得訓練機器人及其他機器與其環(huán)境進行交互變得更簡單,van Steenkiste指出。
混音
某些東西混合在一起就會變得更好:花生醬和巧克力的搭配堪稱完美;金屬結(jié)合后更結(jié)實、更堅固;將兩種農(nóng)作物種在一起產(chǎn)量會更高。
Yuji Tokozume將同樣的概念應用到了深度學習之中。這位博士生和另外兩名東京大學的研究人員正致力于通過使用他們稱之為“between-class”的聲音(即兩種混合在一起的聲音)來訓練深度學習模型,從而提高聲音識別能力。該模型在NVIDIA的Tesla P100 GPU加速器上接受訓練,以辨別兩種聲音并確定一種聲音與另一種聲音的比率。
在他們的ICLR論文(Learning from Between-class Examples for Deep Sound Recognition,中,其報告稱,“between-class”學習不僅提供了比現(xiàn)有技術(shù)更高的準確性,而且在被稱為ESC-50的標準數(shù)據(jù)集中超越了人類在環(huán)境記錄上的表現(xiàn)。該團隊運用了同樣的方法來提高AI圖像識別性能。
觀看最近在硅谷舉行的GPU技術(shù)大會上有關(guān)聲音識別的“between-class”學習方面的討論,了解更多信息。
翻譯能力的缺失
雖然AI在自動語言翻譯方面取得了一定成就,但對于巴斯克語、奧羅莫語和蓋丘亞語等不常見的語言卻作用不大。這是因為訓練深度學習模型通常需要大型的數(shù)據(jù)集,這在語言領域中意味著需要大量已被手動翻譯為其他語言的文字。
對于漢語、英語和西班牙語等廣泛使用的語言,可以找到豐富的數(shù)據(jù),因此可以直接將漢語翻譯成英語,或?qū)⑽靼嘌勒Z翻譯成漢語。紐約大學和巴斯克大學的研究人員旨在將這一能力賦予使用者較少的語言。
巴斯克大學博士生Mikel Artetxe指出,目前像巴斯克語這樣的語言(大約有70萬人講這種語言,他們主要位于跨西班牙和法國的地區(qū))必須首先被翻譯成英語或其他主要語言,然后才能轉(zhuǎn)化為其他語言。
奧羅莫語這樣的語言也是如此,非洲之角有超過三千萬人使用奧羅莫語,而南美洲有多達一千一百萬人使用蓋丘亞語。
研究團隊利用NVIDIA GPU訓練神經(jīng)網(wǎng)絡來執(zhí)行這些翻譯,并且無需任何手動翻譯的訓練數(shù)據(jù),而是依賴于兩種語言的獨立文本。在他們的ICLR論文(Unsupervised Neural Machine Translation,研究人員表示,當他們添加少量并行數(shù)據(jù)時,準確度有所提高,但仍遠低于人工翻譯的準確性。
“我們的目標是能夠翻譯更多的語言并取得更好的結(jié)果”,Artexe說道。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5601瀏覽量
109825 -
深度學習
+關(guān)注
關(guān)注
73文章
5599瀏覽量
124434
原文標題:機器自主學習、混音識別、自動語言翻譯:NVAIL合作伙伴開創(chuàng)性深度學習研究亮相ICLR
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
芯樸科技榮獲日海模組2025年度最佳合作伙伴獎
軟通動力亮相2025小米人車家全生態(tài)合作伙伴大會
亞馬遜云科技中國12家合作伙伴獲得2025年度合作伙伴獎項
利爾達亮相2025中國移動全球合作伙伴大會,共創(chuàng)AI+時代新生態(tài)
曦智科技亮相2025中國移動全球合作伙伴大會
海格通信重磅亮相2025中國移動全球合作伙伴大會
SILEX希來科與QUALCOMM高通公司長達15年的戰(zhàn)略合作伙伴關(guān)系 高通認證開發(fā)合作伙伴~高通官網(wǎng)能找到silex希來科
智能領先 | 美格智能亮相2025屆中國聯(lián)通合作伙伴大會
IDENTA加入恩智浦MIFARE合作伙伴計劃
2025聯(lián)想中國合作伙伴大會圓滿舉辦
亞馬遜云科技發(fā)布“3+2”合作伙伴戰(zhàn)略 與合作伙伴加速前行
NVAIL合作伙伴開創(chuàng)性深度學習研究亮相ICLR
評論