91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌AI探索無(wú)障礙溝通

23gi_ifanr ? 來(lái)源:fqj ? 2019-05-12 09:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Steve Saling 罹患肌萎縮性脊髓側(cè)索硬化癥(ALS)已有 13 年光景,這是一段人生大門(mén)逐漸關(guān)閉的過(guò)程。

ALS 俗稱漸凍癥,發(fā)病后肌肉僵硬,抽搐,造成說(shuō)話或吞咽困難,再逐漸到手臂和腿部無(wú)力,最終失去自主控制運(yùn)動(dòng)的能力。英國(guó)著名物理學(xué)家霍金即患此病。Steve Saling 與人交流,是通過(guò)眼球追蹤技術(shù)來(lái)控制計(jì)算機(jī)上的虛擬鍵盤(pán)打字,溝通十分低效。

圖 | 漸凍癥患者 Steve Saling

如今,在新技術(shù)的幫助下,他在觀看運(yùn)動(dòng)賽事的精彩瞬間時(shí),竟然可以發(fā)出歡呼。只不過(guò),聲音是通過(guò)臉部表情控制機(jī)器發(fā)出的。通過(guò)加入谷歌的 Project Euphonia 項(xiàng)目,Steve Saling 可以自主訓(xùn)練機(jī)器學(xué)習(xí)模型,當(dāng)模型更了解他的面部表情,不出聲即可操作 Google Home。

圖 | Steve Saling 正在自主訓(xùn)練機(jī)器學(xué)習(xí)模型

在 2019 谷歌開(kāi)發(fā)者大會(huì)上,失聰設(shè)計(jì)師 Elise Roy 與谷歌科學(xué)家、哈佛教授 Michael Brenner 共同宣布 Project Euphonia 項(xiàng)目。Michael Brenner 博士確信 AI 技術(shù)能解決 ALS 患者這一特定的語(yǔ)言障礙問(wèn)題,但同時(shí)也需要大眾的協(xié)助,提供更多的聲音樣本供模型訓(xùn)練。

生活中的方方面面都涉及到與他人溝通,以及被他人理解。

想象一下,如果旁人難以理解我們的說(shuō)話或表達(dá)方式時(shí),生活會(huì)變成什么樣,是不是會(huì)感到不便和心情沮喪?

然而,對(duì)上千萬(wàn)的中風(fēng)、ALS 、多發(fā)性硬化、創(chuàng)傷性腦損傷和帕金森氏癥等神經(jīng)系統(tǒng)疾病而產(chǎn)生語(yǔ)言障礙的人士來(lái)說(shuō),這就是他們每天都必須面對(duì)的情況。

造成語(yǔ)言障礙的成因有很多,有些是聽(tīng)力受損,有的是腦部控制語(yǔ)言的神經(jīng)系統(tǒng)受到創(chuàng)傷,還有的是臉部肌肉不受控制,導(dǎo)致發(fā)音模糊,含糊不清。

非營(yíng)利組織 ALS-TDI(美國(guó) ALS 研究機(jī)構(gòu))的臨床團(tuán)隊(duì)在過(guò)去幾年中發(fā)現(xiàn),即使有嚴(yán)重發(fā)音障礙(語(yǔ)言障礙)的 ALS 患者,也可以被親密朋友和家人理解。這說(shuō)明,只要有足夠多的聲音樣本,AI 可以學(xué)習(xí)如何解釋受損的聲音。

看到這一技術(shù)實(shí)現(xiàn)的可能性后,谷歌在 2019 開(kāi)發(fā)者大會(huì)上推出 Project Euphonia,計(jì)劃用 AI 來(lái)了解語(yǔ)言障礙者的講話方式,例如含糊不清、不完整的講話,從而實(shí)現(xiàn)精準(zhǔn)的語(yǔ)音轉(zhuǎn)寫(xiě)。

此項(xiàng)目的聲音樣本主要通過(guò)與 ALS-TDI(美國(guó) ALS 研究機(jī)構(gòu))與 ALS Residence Initiative(ALS 住宅計(jì)劃)合作獲得,錄下 ALS 患者的聲音,然后將錄下的語(yǔ)音轉(zhuǎn)成聲譜圖,或以更視覺(jué)化的圖像方式來(lái)呈現(xiàn)聲音。接著計(jì)算機(jī)用轉(zhuǎn)錄的聲譜圖拿來(lái)訓(xùn)練模型,以更準(zhǔn)確辨識(shí)這類非典型的語(yǔ)音。

目前設(shè)計(jì)的 AI 模型是以典型的 ALS 相關(guān)障礙的英語(yǔ)人士為目標(biāo)對(duì)象,相信不久后這項(xiàng)研究將可應(yīng)用到更大范圍的不同語(yǔ)言障礙人群。

谷歌語(yǔ)音研究員 Dimitri Kanevsky 是一名聽(tīng)力障礙者,幼年失聰后才開(kāi)始學(xué)的英文,他的主要語(yǔ)言障礙是發(fā)音不標(biāo)準(zhǔn),吐字模糊。

谷歌的語(yǔ)音轉(zhuǎn)錄程序顯然無(wú)法對(duì)非標(biāo)準(zhǔn)發(fā)音的句子進(jìn)行高精確識(shí)別。于是 Kanevsky 研究員錄入了 15000 條自己的語(yǔ)音數(shù)據(jù)來(lái)對(duì)模型訓(xùn)練,起初效果并不明顯,但在他的堅(jiān)持下模型終于有了不錯(cuò)的表現(xiàn),程序可以很準(zhǔn)確識(shí)別他的聲音,適應(yīng)了他講話的方式。

不同語(yǔ)言障礙的人群所需要的技術(shù)不同,技術(shù)實(shí)現(xiàn)的難度也不同,但最終實(shí)現(xiàn)的效果是一樣的,理解和被理解。這是人類溝通的快樂(lè)源泉。

目前谷歌的 Live Transcribe 轉(zhuǎn)錄技術(shù)也可以作為聽(tīng)障人士的輔助交流工具。

圖 | Live Transcribe 轉(zhuǎn)錄過(guò)程

此次谷歌開(kāi)發(fā)者大會(huì)上,谷歌也推出了 Live Relay 功能,可以讓設(shè)備在語(yǔ)音和文本之間進(jìn)行轉(zhuǎn)換,語(yǔ)音信息實(shí)時(shí)轉(zhuǎn)化成文本,并且以語(yǔ)音的形式轉(zhuǎn)換回來(lái),可以幫助聽(tīng)力障礙或失聰人士打電話。

Live Relay 是系統(tǒng)中原生功能,不需要聯(lián)網(wǎng)就可以在終端上運(yùn)行,因此能確保通話的隱私性。

雖然 Live Relay 還在早期研究階段,不過(guò)谷歌對(duì) Live Relay 的長(zhǎng)期發(fā)展十分樂(lè)觀,這項(xiàng)技術(shù)不光是給語(yǔ)言障礙人群提供方便,未來(lái)所有用戶都能因這項(xiàng)服務(wù)受益。比如,很多用戶都曾有需要接聽(tīng)重要電話,但無(wú)法離開(kāi)當(dāng)下手邊正在進(jìn)行的事項(xiàng)的經(jīng)歷,在 Live Relay 的幫助下,用戶不必實(shí)際與對(duì)方交談,也能隨時(shí)隨地通過(guò)輸入文本的方式接聽(tīng)電話,甚至可集成即時(shí)翻譯功能,讓用戶能與世界各地的人通話,完全不必?fù)?dān)心語(yǔ)言隔閡。

谷歌 AI 在語(yǔ)音識(shí)別和轉(zhuǎn)錄技術(shù)上已達(dá)到非常領(lǐng)先的水準(zhǔn),雖然在理解語(yǔ)言障礙者的發(fā)音和講話方式還在探索中,但這無(wú)疑是離終極目標(biāo)——無(wú)障礙溝通最近的一次。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111554
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40065

    瀏覽量

    301707

原文標(biāo)題:為了追求一個(gè)更真實(shí)的游戲世界,我們還缺乏什么?| 近未來(lái) ⑤

文章出處:【微信號(hào):ifanr,微信公眾號(hào):愛(ài)范兒】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌評(píng)論卡,碰一碰即可完成谷歌評(píng)論 #谷歌評(píng)論卡 #NFC標(biāo)簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    谷歌AlphaEarth和維智時(shí)空AI大模型的技術(shù)路徑

    谷歌AlphaEarth和維智時(shí)空AI大模型在應(yīng)用場(chǎng)景和技術(shù)實(shí)現(xiàn)上各有側(cè)重,但兩者在底層技術(shù)理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?937次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    探索;人類級(jí)別的理解能力;常識(shí)推理;現(xiàn)實(shí)世界的知識(shí)整合。 3、測(cè)試時(shí)計(jì)算 測(cè)試時(shí)計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源來(lái)提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對(duì)AGI的意義
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    是一種快速反應(yīng)能力,是直接的感知;靈感是一種通過(guò)思考和探索獲得的創(chuàng)造性想法,是一種創(chuàng)意。 AI怎么模擬直覺(jué)與靈感呢?四、AI代替人類的假說(shuō) 這可能嗎? 用機(jī)器來(lái)生成假說(shuō): 1、直接生成 生成式
    發(fā)表于 09-17 11:45

    AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南

    AI芯片:科技探索與AGI愿景》一書(shū)如同一張?jiān)敱M的“藏寶圖”,為讀者指明了通往下一代人工智能的硬件之路。作者沒(méi)有停留在空洞的概念層面,而是直擊核心,從馮·諾依曼架構(gòu)的“內(nèi)存墻”瓶頸切入,清晰闡述了
    發(fā)表于 09-17 09:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會(huì),AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開(kāi)AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開(kāi)始生成式AI開(kāi)創(chuàng)了新的時(shí)代,經(jīng)歷了三次熱潮和兩次低谷
    發(fā)表于 09-12 16:07

    華曦達(dá)亮相谷歌AI亞洲峰會(huì),AI Home業(yè)務(wù)高增長(zhǎng)引領(lǐng)發(fā)展新征程

    8月28日,谷歌AI亞洲峰會(huì)在新加坡圓滿落幕。作為谷歌生態(tài)戰(zhàn)略合作伙伴,華曦達(dá)受邀參與峰會(huì)主論壇及同期舉辦的“LeadersExchange”閉門(mén)會(huì)議,與全球頂尖科技企業(yè)共探AI未來(lái)
    的頭像 發(fā)表于 09-10 10:22 ?567次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無(wú)數(shù)神經(jīng)元通過(guò)突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺(tái)濕潤(rùn)的軟組織
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書(shū)是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來(lái)》一書(shū)是姊妹篇,由此可見(jiàn)作者在AI芯片領(lǐng)域的功力和造詣。 作者畢業(yè)于上海交
    發(fā)表于 09-05 15:10

    傳音攜手Google Cloud打造下一代AI智能生態(tài)

    近日,在備受矚目的谷歌開(kāi)發(fā)者大會(huì)上,傳音TEX AI總經(jīng)理史團(tuán)委受邀發(fā)表主題演講,深入分享了傳音和谷歌在多場(chǎng)景AI模型和應(yīng)用上的深度合作,以及公司在
    的頭像 發(fā)表于 09-02 10:47 ?1207次閱讀

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    名單公布 @LiuDW、@jinglixixi、@bruceleesohu 請(qǐng)于9月3日前,前往【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】《AI芯片:科技探索與AGI愿景》完成書(shū)籍兌換。 如有疑問(wèn)請(qǐng) 添加小助手微信
    發(fā)表于 07-28 13:54

    藍(lán)牙技術(shù)如何構(gòu)建無(wú)障礙生態(tài)

    幾十年來(lái),我們熟知的藍(lán)牙?技術(shù)不僅被廣泛應(yīng)用于耳機(jī)、移動(dòng)設(shè)備和汽車,還悄然改變著智能家居、零售、工業(yè)制造等眾多領(lǐng)域。更令人驚喜的是,除了連接音頻設(shè)備和可穿戴設(shè)備外,這項(xiàng)技術(shù)還在提高無(wú)障礙性方面發(fā)揮著關(guān)鍵作用。
    的頭像 發(fā)表于 07-24 11:21 ?1491次閱讀

    海爾LED TV產(chǎn)品榮獲DEKRA德凱歐盟無(wú)障礙指令證書(shū)

    在歐洲,“無(wú)障礙”不再只是社會(huì)責(zé)任的延伸,而是一項(xiàng)法定的產(chǎn)品設(shè)計(jì)要求。根據(jù)歐盟無(wú)障礙指令 (EU) 2019/882(European Accessibility Act,EAA),自2025年6月
    的頭像 發(fā)表于 07-15 14:22 ?1056次閱讀

    失明十年后,他在這里找到當(dāng)大俠的感覺(jué)

    無(wú)障礙游戲土壤,亟須一群破冰者
    的頭像 發(fā)表于 07-08 12:48 ?1270次閱讀
    失明十年后,他在這里找到當(dāng)大俠的感覺(jué)

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?3785次閱讀