91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI手語識別技術(shù)存在的挑戰(zhàn)

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2021-11-17 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)外媒報道,日本電氣大學(xué)與軟銀公司聯(lián)合,通過人工智能AI技術(shù),能將手語直接翻譯成日語,這將使聾啞人士的溝通更順暢。

目前該系統(tǒng)只能用于柜臺設(shè)備上,聾啞人士能在攝像頭前通過手語溝通,然后系統(tǒng)用圖像識別技術(shù),分析手指和手臂等身體幾個部位的骨骼運動,將手勢翻譯成日文,顯示在工作人員的電腦屏幕上,隨后口頭回復(fù)以文本的形式出現(xiàn)在聽障人士面前的屏幕上,使交流更加順暢。

該系統(tǒng)的核心技術(shù)由ABEJA提供,谷歌2018年投資了它,ABEJA的核心產(chǎn)品是使用機器學(xué)習(xí)幫助公司從他們的數(shù)據(jù)堆中開展商業(yè)分析。在這個項目中,ABEJA通過讓AI學(xué)習(xí)了5萬個手語視頻,使其捕捉到手語特征和變化,目前該系統(tǒng)能準(zhǔn)確將手勢翻譯成大約1500個日語單詞。

早在2015年就有手語識別研究

人工智能技術(shù)的出現(xiàn)和逐漸成熟,不僅有利于產(chǎn)業(yè)升級,事實上很早開始,就有研究人員嘗試?yán)肁I技術(shù)幫助聾啞人士更加順暢的交流。

2015年9月沙特設(shè)計師就專門研發(fā)了一款無線智能手套,內(nèi)置傳感器,聾啞人戴上交流的時候,傳感器可以根據(jù)手指的運動追蹤手勢,再通過語言軟件轉(zhuǎn)換成聲音和文字,在初期,這款無線智能手套只會講法語、英語和阿拉伯語,該研究團隊表示,后續(xù)會支持更多種語言。

在中國也很早就有相關(guān)的研究,2016年有媒體報道,東大自動化專業(yè)李師寧等同學(xué)研發(fā)出了一種最新型的手語識別發(fā)聲系統(tǒng),這是一種結(jié)合人體生物及姿態(tài)信息的便攜手語發(fā)聲器,聾啞人可以通過手語使該機器發(fā)聲翻譯。

2018年東北大學(xué)也研制出一款幫助聽障人士溝通交流的智能系統(tǒng),由智能傳感手環(huán)、前端APP及云端服務(wù)組成,智能傳感手環(huán)可以將聽障人士的手語動作捕捉識別,并在云端轉(zhuǎn)換為文字及語音呈現(xiàn)在APP端,傳遞給非手語使用者,同時又可以將非手語使用者的語音在APP端轉(zhuǎn)換為文字加手語動圖的“雙語形式”。

百度、騰訊等互聯(lián)網(wǎng)巨頭企業(yè)也進(jìn)行了相關(guān)研究,2019年百度在AI開發(fā)者大會上提出“Everyone can AI”的理想,意思是讓每個人都能有平等接收AI的能力,百度以百度飛槳開源內(nèi)容為基礎(chǔ)建立訓(xùn)練模型,通過采集手勢得到數(shù)據(jù),借助手機轉(zhuǎn)化成文字信息,聽障人士可以使用翻譯器,在咖啡館、餐廳如同正常人一樣點餐、交流。

優(yōu)圖AI手語翻譯機界面

同是在2019年,騰訊優(yōu)圖實驗室也推出了一款基于自研算法的優(yōu)圖AI手語翻譯機,以普通攝像頭作為手語采集裝置,用戶正對攝像頭完成手語表達(dá),翻譯機就能通過后臺運算將手語快速翻譯成文字。據(jù)介紹,優(yōu)圖AI手語翻譯機數(shù)據(jù)集覆蓋近千句日常表達(dá),包括900個常用詞匯,同時還對數(shù)據(jù)進(jìn)行了分析和歸納,是當(dāng)前最大的中文手語識別數(shù)據(jù)集。

手語識別技術(shù)存在很大挑戰(zhàn)

相比于其他AI視覺識別技術(shù),手語識別研發(fā)存在更大困難。在2018年東北大學(xué)的研究中,就透露出手語識別研究存在的現(xiàn)實問題,即每位聽障人士的手語規(guī)劃不同,同一個詞打出的手勢有差異,因此智能識別可能就沒那么準(zhǔn)確。

不過好在2018年中央頒發(fā)了國家通用手語標(biāo)準(zhǔn)方案,這很大程度有利于后續(xù)手語轉(zhuǎn)文字或語音方面的研究。即使如此可能還是會存在細(xì)微差異,百度此前就表示,手語復(fù)雜、多樣、以及地域性差異給研究帶來不少困難。

百度還談到另外一大困難,即可用于訓(xùn)練模型的數(shù)據(jù)量小,在上述日本的項目中,一位參與開發(fā)的軟銀工程師也表示,要建立一個將符號準(zhǔn)確翻譯成日文的模型,需要大量的手語數(shù)據(jù)。因此他們通過網(wǎng)站等方式,呼吁更多人發(fā)送手語圖像數(shù)據(jù)。

小結(jié)

AI技術(shù)在服務(wù)產(chǎn)業(yè)升級的同時,也可以極大的幫助聾啞人群更好的實現(xiàn)溝通,這是這個時代的福音。據(jù)第二次全國殘疾人抽樣調(diào)查結(jié)果顯示,我國有2780萬聽障人士,如果能夠利用AI技術(shù)實現(xiàn)將手語實時翻譯成文字和語音,這將是一項極其有意義的事。

日本聾人聯(lián)合會認(rèn)為,要使人工智能成為聾啞人群的有效工具,還需要很長的時間來實現(xiàn)。不過很明顯從2015年到現(xiàn)在,手語識別在逐漸取得進(jìn)步,也有相當(dāng)多的研究人員和企業(yè)投入其中,對于未來逐步突破困難取得更大進(jìn)步還是值得期待。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39944

    瀏覽量

    301588
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50120

    瀏覽量

    265614

原文標(biāo)題:騰訊、百度、軟銀都在研究,利用AI技術(shù)將手語轉(zhuǎn)文字有多重要?

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用NORDIC AI的好處

    運動/手勢識別、可穿戴健康監(jiān)測、預(yù)測性維護、樓宇與工業(yè)傳感網(wǎng)絡(luò)本地分析、聲音/關(guān)鍵詞/圖像識別等,都有官方明確提到的典型用例。[Unlock Edge AI 博客; Nordic Edge
    發(fā)表于 01-31 23:16

    影像儀AI自動尋邊技術(shù)精準(zhǔn)捕捉邊界測量,檢測效率翻倍!

    【智能制造測量】影像測量儀的AI自動尋邊技術(shù)是通過深度學(xué)習(xí)模型,實現(xiàn)對工件特征的自主識別與邊緣精準(zhǔn)提取。能解決質(zhì)檢環(huán)節(jié)中多重邊界提偏、刀紋干擾、對比度低等測量痛點。
    發(fā)表于 11-18 10:16

    【飛凌OK-MX9596-C開發(fā)板試用】③云端AI拍照識別

    【飛凌OK-MX9596-C開發(fā)板試用】②體驗WIFI、藍(lán)牙、音頻、視頻,為AI應(yīng)用打下基礎(chǔ) - 飛凌嵌入式 - 電子技術(shù)論壇 - 廣受歡迎的專業(yè)電子論壇! 在上一帖子中,我們測試了攝像頭拍照
    發(fā)表于 11-01 22:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    和量子計算的兩項新興的技術(shù),將在生產(chǎn)假說方面發(fā)揮重要作用,從而改變科學(xué)發(fā)現(xiàn)的范式。 生成式AI: 2、窮舉搜索 3、分析排錯與組合優(yōu)化 分析排錯是生成假說的重要手段。強化學(xué)習(xí)也在優(yōu)化假說組合、尋找科學(xué)發(fā)現(xiàn)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+半導(dǎo)體芯片產(chǎn)業(yè)的前沿技術(shù)

    閃存。 現(xiàn)在應(yīng)用于邏輯芯片,還在起步階段。 2)3D堆疊技術(shù)面臨的挑戰(zhàn) 3D堆疊技術(shù)面臨最大挑戰(zhàn)是散熱問題。 3)3D堆疊技術(shù)
    發(fā)表于 09-15 14:50

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成式AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰(zhàn)。第二章和第三章分別介紹實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法和架構(gòu)。以及一些新型的算法和思路。第四章是全面介紹半導(dǎo)體芯產(chǎn)業(yè)的前沿技術(shù)
    發(fā)表于 09-05 15:10

    RK3576助力智慧安防:8路高清采集與AI識別

    在智慧城市和數(shù)字化園區(qū)的建設(shè)過程中,安防監(jiān)控系統(tǒng)正從“被動記錄”走向“主動識別與分析”。隨著AI算法的成熟和高清視頻處理能力的提升,市場對多路視頻采集、實時拼接、智能識別的需求日益增強。 米爾電子
    發(fā)表于 08-22 17:41

    無人機AI識別巡檢系統(tǒng)解決方案

    ? ? ? ?無人機AI識別巡檢系統(tǒng)解決方案 ? ? ? ?隨著基礎(chǔ)設(shè)施規(guī)模的持續(xù)擴大和數(shù)字化轉(zhuǎn)型的深入推進(jìn),傳統(tǒng)人工巡檢模式正面臨效率、安全與成本的多重挑戰(zhàn)。以電力、光伏、交通、建筑等領(lǐng)域為例
    的頭像 發(fā)表于 07-18 14:02 ?797次閱讀

    無人機AI視覺行為識別系統(tǒng)

    的需求。同時,人工監(jiān)控存在效率低下、易疲勞、反應(yīng)滯后等問題,無法應(yīng)對日益復(fù)雜的安全管理挑戰(zhàn)。 在這一背景下,陜西廣合通結(jié)合無人機機動性與人工智能分析能力的視覺行為識別系統(tǒng)為基礎(chǔ)研發(fā)了無人機AI
    的頭像 發(fā)表于 07-04 16:53 ?1085次閱讀

    AI?時代來襲,手機芯片面臨哪些新挑戰(zhàn)?

    邊緣AI、生成式AI(GenAI)以及下一代通信技術(shù)正為本已面臨高性能與低功耗壓力的手機帶來更多計算負(fù)載。領(lǐng)先的智能手機廠商正努力應(yīng)對本地化生成式AI、常規(guī)手機功能以及與云之間日益增長
    的頭像 發(fā)表于 06-10 08:34 ?1260次閱讀
    <b class='flag-5'>AI</b>?時代來襲,手機芯片面臨哪些新<b class='flag-5'>挑戰(zhàn)</b>?

    工地AI行為識別系統(tǒng)作用

    工地AI行為識別系統(tǒng)作用 工地AI行為識別系統(tǒng)是什么? 工地AI行為識別系統(tǒng)是一種基于人工智能
    的頭像 發(fā)表于 05-08 12:00 ?955次閱讀

    景區(qū)AI行為識別系統(tǒng)作用

    景區(qū)AI行為識別系統(tǒng)作用 景區(qū)AI行為識別系統(tǒng)是什么? 景區(qū)AI行為識別系統(tǒng)是利用人工智能
    的頭像 發(fā)表于 05-07 15:32 ?1018次閱讀
    景區(qū)<b class='flag-5'>AI</b>行為<b class='flag-5'>識別</b>系統(tǒng)作用

    工廠園區(qū)AI行為識別系統(tǒng)作用

    工廠園區(qū)AI行為識別系統(tǒng)作用 工廠園區(qū)AI行為識別系統(tǒng)是什么? 工廠園區(qū)AI行為識別系統(tǒng)是基于人
    的頭像 發(fā)表于 05-06 17:49 ?822次閱讀

    岸橋箱號識別系統(tǒng)如何工作?揭秘AI圖像識別技術(shù)!

    在港口自動化升級的浪潮中,AI岸橋識別系統(tǒng)憑借前沿的圖像識別技術(shù),成為提升碼頭作業(yè)效率的“智慧之眼”。那么,這套系統(tǒng)如何實現(xiàn)集裝箱信息的精準(zhǔn)捕捉?又是如何通過
    的頭像 發(fā)表于 04-02 09:45 ?761次閱讀