91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于 MediaPipe 的手語(yǔ)接口現(xiàn)對(duì)開(kāi)發(fā)者開(kāi)放

Tensorflowers ? 來(lái)源:TensorFlow ? 作者:TensorFlow ? 2021-06-08 18:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

客座博文,發(fā)布人:SignAll | MediaPipe 團(tuán)隊(duì)

請(qǐng)注意,以下內(nèi)容中體現(xiàn)的信息、用途及應(yīng)用完全是 SignAll 客座作者的觀點(diǎn)。

SignAll SDK:使用 MediaPipe 的手語(yǔ)接口現(xiàn)對(duì)開(kāi)發(fā)者開(kāi)放

當(dāng) Google 發(fā)布第一個(gè)基于 MediaPipe 的設(shè)備端手部追蹤技術(shù)時(shí),它便成為了開(kāi)發(fā)者構(gòu)建手語(yǔ)識(shí)別解決方案應(yīng)用的基礎(chǔ)。Google 之后對(duì)這個(gè)手部跟蹤解決方案的進(jìn)一步更新,將其準(zhǔn)確率提升至其他技術(shù)所無(wú)法達(dá)到的水平。

SignAll 是一家研發(fā)手語(yǔ)翻譯技術(shù)的初創(chuàng)公司,致力于為失聰人士普及手語(yǔ)翻譯,讓他們能夠與聽(tīng)力正常的人群以及計(jì)算機(jī)進(jìn)行交流。SignAll 的產(chǎn)品采用了復(fù)雜的多攝像頭設(shè)置和帶有彩色標(biāo)記的手套,廣泛用于美國(guó)的通信和教育領(lǐng)域。

雖然手語(yǔ)的復(fù)雜性不僅限于手形(還包括面部特征、肢體、語(yǔ)法等),但準(zhǔn)確追蹤手部確實(shí)已經(jīng)給預(yù)處理程序(即計(jì)算機(jī)視覺(jué))造成了巨大阻礙。MediaPipe 為 SignAll 的解決方案提供了更多可能性,不僅能夠免除手套,還可以使用單攝像頭設(shè)置。SignAll 已經(jīng)宣布針對(duì)此類型開(kāi)放首版 SDK,所以開(kāi)發(fā)者現(xiàn)在能夠在自己的應(yīng)用中啟用手語(yǔ)輸入。

SignAll

https://www.signall.us/

開(kāi)放首版 SDK

https://signall.us/sdk

近期,該公司在 App Store 上發(fā)布了一個(gè)互動(dòng)式教育應(yīng)用,該應(yīng)用可以讓用戶通過(guò)即時(shí)反饋來(lái)練習(xí)手語(yǔ),還能夠展現(xiàn)出 SDK 的潛力。

SignAll 與 MediaPipe Hands

我們的系統(tǒng)在手語(yǔ)識(shí)別方面采用多個(gè)數(shù)據(jù)層,各層數(shù)據(jù)的抽象性越來(lái)越高。低級(jí)數(shù)據(jù)層從 2D 和 3D 攝像頭中提取關(guān)鍵的手部、軀體和面部數(shù)據(jù)。在我們的第一個(gè)實(shí)現(xiàn)中,此數(shù)據(jù)層會(huì)檢測(cè)手套的顏色,并創(chuàng)建 3D 手部數(shù)據(jù)。將其替換為 MediaPipe Hands(MediaPipe Pose 和 MediaPipe Face Mesh 作為補(bǔ)充)具有顛覆性的重要意義,因?yàn)槟悴辉傩枰痔谆蛱厥夤饩€來(lái)使用我們的系統(tǒng)。

MediaPipe Hands

https://google.github.io/mediapipe/solutions/hands.html

MediaPipe Pose

https://google.github.io/mediapipe/solutions/pose.html

MediaPipe Face Mesh

https://google.github.io/mediapipe/solutions/face_mesh.html

如上文所述,我們使用了多個(gè)帶有深度傳感器的攝像頭,并在實(shí)際中對(duì)這些傳感器進(jìn)行了校準(zhǔn)。相較于本地?cái)z像頭或張量空間,這種方法能夠?qū)崿F(xiàn)更加準(zhǔn)確的 3D 世界空間探測(cè),但每個(gè)攝像頭都需要進(jìn)行手部特征點(diǎn)檢測(cè)。攝像頭的位置和屏幕方向各不相同,因此可以實(shí)現(xiàn)更高的手部可視頻率,因?yàn)閺囊粋€(gè)攝像頭的角度來(lái)看,手部可能會(huì)被另外一只手遮擋,但從另一個(gè)攝像頭的角度來(lái)看,可能并不存在遮擋。

接下來(lái)的步驟是過(guò)濾數(shù)據(jù),并進(jìn)行數(shù)據(jù)平滑處理,以復(fù)制彩色手套標(biāo)記提供的精確測(cè)量值。雖然 SignAll 的標(biāo)記與 MediaPipe 提供的界標(biāo)不同,但我們使用了手部模型并根據(jù)界標(biāo)生成彩色標(biāo)記。因此,新的動(dòng)作捕捉數(shù)據(jù)與之前的數(shù)據(jù)完全兼容。

雖然我們主要關(guān)注手部,但我們同時(shí)整合了 MediaPipe Pose 和 MediaPipe Face Mesh。即便在彼此接觸,或距離很近的情況下,姿態(tài)界標(biāo)都能提供準(zhǔn)確的手部姿態(tài)信息。

雖然這兩個(gè)版本的動(dòng)作捕捉是兼容的,但工件的性質(zhì)不同:一種是直接測(cè)量各個(gè)標(biāo)記,另一種是根據(jù)全局檢測(cè)的手部模擬標(biāo)記。因?yàn)榇嬖诓町?,所以我們必須在更高層?jí)對(duì)參數(shù)進(jìn)行優(yōu)化。另一方面,我們?nèi)钥梢岳梦覀兊拇笮褪终Z(yǔ)數(shù)據(jù)庫(kù)來(lái)進(jìn)行無(wú)手套配置。我們可以通過(guò)替換低級(jí)數(shù)據(jù),優(yōu)化高級(jí)數(shù)據(jù),以無(wú)手套形式測(cè)試我們的系統(tǒng)。實(shí)現(xiàn)無(wú)手套化,對(duì)于手語(yǔ)識(shí)別技術(shù)的全球推廣具有重要意義。

使用 MediaPipe 框架的 SignAll 系統(tǒng)

將 MediaPipe Hands 整合至系統(tǒng)后,我們還希望能夠利用 MediaPipe 框架在多個(gè)平臺(tái)上提供的自定義和擴(kuò)容機(jī)會(huì)。這樣我們不僅可以用 Python 原型化我們的狀態(tài)研究方法,而且還可以為 Windows、iOS、Android 甚至 Web 提供最終用戶解決方案。

由于我們的模塊圖系統(tǒng)和 MediaPipe 的計(jì)算圖之間具有相似性,現(xiàn)有的處理單元只需稍作修改就可以在這個(gè)新框架中重用。盡管如此,擴(kuò)展平臺(tái)組還面臨著其他挑戰(zhàn),例如在大多數(shù)情況下我們只能使用單個(gè) 2D 攝像頭而不是經(jīng)過(guò)校準(zhǔn)的多攝像頭系統(tǒng)。

我們開(kāi)發(fā)并使用的模型、算法和技術(shù),主要是為了在 3D 全局世界中處理動(dòng)作捕捉數(shù)據(jù)。毫無(wú)疑問(wèn),從單攝像頭設(shè)置中提取的數(shù)據(jù)達(dá)不到同樣的詳細(xì)程度。所以我們必須對(duì)實(shí)現(xiàn)進(jìn)行一些調(diào)整,微調(diào)算法并添加一些額外邏輯(例如,動(dòng)態(tài)適應(yīng)手持?jǐn)z像頭用例導(dǎo)致的空間變化)。幸運(yùn)的是,MediaPipe 框架讓我們能夠用 C ++ 實(shí)現(xiàn)核心處理單元,因此我們?nèi)匀豢梢詮南惹伴_(kāi)發(fā)的運(yùn)行時(shí)優(yōu)化核心解決方案中受益。

為了更好地處理來(lái)自單個(gè) 2D 源的數(shù)據(jù),一些基于 3D 數(shù)據(jù)訓(xùn)練的高級(jí)模型需要重新訓(xùn)練。MediaPipe 界標(biāo)由 3D 坐標(biāo)定義,因此可以重復(fù)使用現(xiàn)有的訓(xùn)練方法和概念。另一方面,2D 信息的提取比三維坐標(biāo)更為直接也更為穩(wěn)定,在修改設(shè)計(jì)訓(xùn)練時(shí)需要考慮到這一點(diǎn)。

幸運(yùn)的是,我們無(wú)需為實(shí)現(xiàn)此目標(biāo)而進(jìn)行全新的數(shù)據(jù)記錄。我們?nèi)匀豢梢允褂米⑨屧敿?xì)的大型視頻數(shù)據(jù)庫(kù)。預(yù)處理的動(dòng)作捕捉數(shù)據(jù)可以從我們的記錄中提取,并在 3D 世界中解釋,從而用來(lái)模擬任何虛擬攝像頭視圖中的手部、骨架或面部界標(biāo)檢測(cè)。

在虛擬攝像頭視圖的數(shù)據(jù)中,我們同時(shí)使用傳統(tǒng)的 2D 記錄,以足夠的比例覆蓋界標(biāo)檢測(cè)的獨(dú)特噪點(diǎn)特征。由于大多數(shù)此類數(shù)據(jù)已經(jīng)提前收集了,所以我們可以專注于嘗試最新技術(shù)并訓(xùn)練新模型。

總結(jié)

在 MediaPipe 助力的改進(jìn),讓 SignAll 可以更改其模型。除了提供用于手語(yǔ)教學(xué)和翻譯的多合一產(chǎn)品之外,SignAll 現(xiàn)在也開(kāi)始提供面向開(kāi)發(fā)者的 SDK。此 SDK 的功能取決于攝像頭的類型和可用的算力。SDK 可以啟用的功能包括:

面向開(kāi)發(fā)者的 SDK

https://signall.us/sdk

通過(guò)用手語(yǔ)表示聯(lián)系人的姓名來(lái)發(fā)起視頻通話

通過(guò)手語(yǔ)(與語(yǔ)音輸入相對(duì)應(yīng))在導(dǎo)航中添加地址,或在快餐店的信息亭或直通車(chē)道中進(jìn)行點(diǎn)餐。

SignAll 的使命是讓手語(yǔ)能夠全方位替代語(yǔ)音,而我們非常高興看到越來(lái)越多的應(yīng)用實(shí)現(xiàn)了此功能。

我們十分期待 MediaPipe 未來(lái)的更新,這些更新能夠幫助我們進(jìn)一步實(shí)現(xiàn)終極目標(biāo)——讓所有人在任何設(shè)備上都能使用我們的解決方案。最值得期待的更新是能夠建立自定義的 MediaPipe 圖,并添加我們自己的計(jì)算器,從而在 WebAssembly 技術(shù)的輔助下實(shí)現(xiàn)基于網(wǎng)絡(luò)的解決方案,這樣網(wǎng)站就能夠?yàn)槭斣L問(wèn)者提供全新水平的無(wú)障礙功能。

TensorFlow

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3011

    瀏覽量

    115066
  • C++
    C++
    +關(guān)注

    關(guān)注

    22

    文章

    2124

    瀏覽量

    77129
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1101

    瀏覽量

    51740

原文標(biāo)題:SignAll SDK:基于 MediaPipe 的手語(yǔ)接口現(xiàn)對(duì)開(kāi)發(fā)者開(kāi)放

文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度地圖開(kāi)放平臺(tái)與400萬(wàn)開(kāi)發(fā)者共赴智能時(shí)空新未來(lái)

    二十年星辰大海,十五載開(kāi)放引航。2025年,百度地圖迎來(lái)服務(wù)用戶的二十周年,其開(kāi)放平臺(tái)亦走過(guò)了與開(kāi)發(fā)者并肩同行的十五個(gè)春秋。在近期舉行的“2025百度地圖開(kāi)發(fā)者盛典”上,百度地圖
    的頭像 發(fā)表于 01-23 09:03 ?705次閱讀
    百度地圖<b class='flag-5'>開(kāi)放</b>平臺(tái)與400萬(wàn)<b class='flag-5'>開(kāi)發(fā)者</b>共赴智能時(shí)空新未來(lái)

    2025華為開(kāi)發(fā)者大賽暨開(kāi)發(fā)者年度會(huì)議成功舉辦

    12月27日-12月28日,以“成就AI原生時(shí)代先鋒開(kāi)發(fā)者”為主題的2025華為開(kāi)發(fā)者大賽暨開(kāi)發(fā)者年度會(huì)議在上海華為練秋湖研發(fā)中心舉辦。本次會(huì)議旨在匯聚先鋒開(kāi)發(fā)力量,搭建
    的頭像 發(fā)表于 12-31 13:32 ?684次閱讀

    九聯(lián)科技亮相2025開(kāi)放原子開(kāi)發(fā)者大會(huì)

    11月21-22日,以“AI共智,開(kāi)源共享”為主題的2025開(kāi)放原子開(kāi)發(fā)者大會(huì)在北京盛大舉辦。作為開(kāi)源鴻蒙生態(tài)的核心共建力量,九聯(lián)科技旗下子公司九聯(lián)開(kāi)鴻受邀出席大會(huì),與來(lái)自產(chǎn)學(xué)研用各領(lǐng)域的技術(shù)專家、企業(yè)代表、高校學(xué)者與開(kāi)發(fā)者齊聚
    的頭像 發(fā)表于 11-27 15:04 ?389次閱讀

    2025開(kāi)放原子開(kāi)發(fā)者大會(huì)精彩回顧

    11月21日-22日,2025開(kāi)放原子開(kāi)發(fā)者大會(huì)在北京成功舉辦,大會(huì)以“一切為了開(kāi)發(fā)者——AI共智,開(kāi)源共享”為核心主題,匯聚政產(chǎn)學(xué)研用千余名代表,通過(guò)1場(chǎng)開(kāi)幕式、15場(chǎng)前沿分論壇及開(kāi)源市集交流區(qū),集中釋放開(kāi)源技術(shù)創(chuàng)新成果,全方
    的頭像 發(fā)表于 11-27 14:59 ?626次閱讀

    2025開(kāi)放原子開(kāi)發(fā)者大會(huì)旋武開(kāi)源社區(qū)Rust分論壇成功舉辦

    11月22日,2025開(kāi)放原子開(kāi)發(fā)者大會(huì)——旋武開(kāi)源社區(qū)Rust分論壇在北京順利召開(kāi)。論壇以“共建中國(guó)Rust生態(tài)”為核心主題,匯聚京東、華為、vivo、阿里、毛豆教育、DORA社區(qū)及南京大學(xué)等企業(yè)與學(xué)術(shù)機(jī)構(gòu)技術(shù)專家,及眾多Rust開(kāi)發(fā)
    的頭像 發(fā)表于 11-27 14:55 ?665次閱讀

    2025開(kāi)源鴻蒙開(kāi)發(fā)者激勵(lì)計(jì)劃正式啟動(dòng)

    11月21日,2025開(kāi)放原子開(kāi)發(fā)者大會(huì)盛大啟幕,聚焦“AI共智,開(kāi)源共享”主題,吸引了來(lái)自全球的開(kāi)發(fā)者、企業(yè)技術(shù)領(lǐng)袖、社區(qū)維護(hù)及高??蒲辛α繀?huì)。作為大會(huì)的重要組成部分,開(kāi)源鴻蒙技
    的頭像 發(fā)表于 11-27 14:44 ?677次閱讀

    潤(rùn)和軟件亮相2025開(kāi)放原子開(kāi)發(fā)者大會(huì)

    11月21-22日,2025開(kāi)放原子開(kāi)發(fā)者大會(huì)在北京圓滿舉行。大會(huì)以“一切為了開(kāi)發(fā)者——AI共智,開(kāi)源共享”為主題,聚焦人工智能與開(kāi)源技術(shù)的深度融合,全面展現(xiàn)開(kāi)源生態(tài)在推動(dòng)產(chǎn)業(yè)創(chuàng)新、培育新質(zhì)生產(chǎn)力方面的核心價(jià)值。
    的頭像 發(fā)表于 11-26 15:19 ?466次閱讀

    2025開(kāi)放原子開(kāi)發(fā)者大會(huì)AtomGit開(kāi)源實(shí)踐交流分論壇成功舉辦

    11月21日,在2025開(kāi)放原子開(kāi)發(fā)者大會(huì)開(kāi)幕式上,開(kāi)放原子開(kāi)源基金會(huì)聯(lián)合CSDN等伙伴,正式宣布新一代AtomGit平臺(tái)完成全面升級(jí)并上線運(yùn)行。該平臺(tái)由AtomGit與GitCode深度融合而成
    的頭像 發(fā)表于 11-25 17:47 ?1198次閱讀

    2025開(kāi)放原子開(kāi)發(fā)者大會(huì)成功舉辦

    11月21日,2025開(kāi)放原子開(kāi)發(fā)者大會(huì)在京開(kāi)幕。大會(huì)以“一切為了開(kāi)發(fā)者——AI共智,開(kāi)源共享”為主題,聚焦人工智能與開(kāi)源技術(shù)的深度融合,全面展現(xiàn)開(kāi)源生態(tài)在推動(dòng)產(chǎn)業(yè)創(chuàng)新、培育新質(zhì)生產(chǎn)力方面的核心價(jià)值。
    的頭像 發(fā)表于 11-25 17:19 ?899次閱讀

    deepin社區(qū)亮相2025開(kāi)放原子開(kāi)發(fā)者大會(huì)

    近日,以“一切為了開(kāi)發(fā)者——AI共智,開(kāi)源共享”為主題的2025開(kāi)放原子開(kāi)發(fā)者大會(huì)在京圓滿落幕。大會(huì)聚焦人工智能與開(kāi)源技術(shù)的深度融合,展現(xiàn)了開(kāi)源生態(tài)在推動(dòng)產(chǎn)業(yè)創(chuàng)新、培育新質(zhì)生產(chǎn)力方面的核心價(jià)值。
    的頭像 發(fā)表于 11-25 09:19 ?932次閱讀

    軟通動(dòng)力攜手鴻湖萬(wàn)聯(lián)亮相2025開(kāi)放原子開(kāi)發(fā)者大會(huì)

    11月21日,2025開(kāi)放原子開(kāi)發(fā)者大會(huì)以“AI共治,開(kāi)源共享”為主題在北京召開(kāi),全面呈現(xiàn)廣大開(kāi)發(fā)者在AI時(shí)代通過(guò)開(kāi)源協(xié)作所取得的突破性成果。
    的頭像 發(fā)表于 11-24 17:29 ?782次閱讀

    2025開(kāi)放原子開(kāi)發(fā)者大會(huì)11月啟幕

    開(kāi)發(fā)者年度盛會(huì)即將登場(chǎng)!2025開(kāi)放原子開(kāi)發(fā)者大會(huì)將于11月21-22日,在北京北人亦創(chuàng)國(guó)際會(huì)展中心盛大召開(kāi)。大會(huì)以“一切為了開(kāi)發(fā)者”為主題,匯聚全球開(kāi)源智慧——國(guó)內(nèi)外優(yōu)秀
    的頭像 發(fā)表于 10-24 14:05 ?963次閱讀

    曙光網(wǎng)絡(luò)SugonRI開(kāi)發(fā)者社區(qū)正式上線

    (sugonri.sugon.com),面向使用及計(jì)劃使用SugonRI的開(kāi)發(fā)者,打造一個(gè)集學(xué)習(xí)、交流、案例分享與應(yīng)用實(shí)踐于一體的開(kāi)放平臺(tái)。
    的頭像 發(fā)表于 09-04 09:58 ?962次閱讀

    芯科科技亮相2025 Matter開(kāi)放日和開(kāi)發(fā)者大會(huì)

    2025年Matter開(kāi)放日(MOD)和開(kāi)發(fā)者大會(huì)(MDC)在上周6月12-13日?qǐng)A滿成功舉辦,Silicon Labs(芯科科技)延續(xù)一直以來(lái)傾力支持Matter標(biāo)準(zhǔn)發(fā)展的策略,攜Matter最新演示與參考應(yīng)用再次亮相今年的Matter
    的頭像 發(fā)表于 06-18 14:22 ?1227次閱讀

    層層剝開(kāi)開(kāi)鴻Bot,我們看到的是“開(kāi)發(fā)者優(yōu)先”

    對(duì)開(kāi)源生態(tài)來(lái)說(shuō),社區(qū)先于代碼,開(kāi)發(fā)者重于一切
    的頭像 發(fā)表于 05-27 09:23 ?2992次閱讀
    層層剝開(kāi)開(kāi)鴻Bot,我們看到的是“<b class='flag-5'>開(kāi)發(fā)者</b>優(yōu)先”