91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook的黑科技Codec Avatars,展現(xiàn)了一個怎樣的社交帝國!

fFU3_vrtuoluo ? 來源:lp ? 2019-03-16 10:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,F(xiàn)acebook CEO 扎克伯格透露公司正在研究一款可用于AR眼鏡的腦機接口技術(shù),但該技術(shù)并非將AR眼鏡以植入性芯片的形式進行,而是希望能開發(fā)成可量產(chǎn)的可穿戴技術(shù)。

類似《刀劍神域》中那般腦機接口被認為是虛擬現(xiàn)實的最終形態(tài),也是最理想的形態(tài),然而這個離我們似乎還有些遙遠。

一直想要發(fā)展VR社交的Facebook,一邊在規(guī)劃幾十年后的未來,同時也在踏踏實實地走好每一步。比如剛剛公布的Codec Avatars技術(shù),就讓VR社交中的虛擬人物表情動作達到了非常真實的狀態(tài),仿佛在虛擬世界中復(fù)刻了一個“真實”的你。

研究助理Autumn Trimble正坐在“Mugsy”里面,Mugsy正是Facebook位于匹茲堡的Facebook Reality Lab(FRL,原來Oculus 研發(fā)實驗室Oculus Research),用于創(chuàng)建“codec avatars”的捕獲設(shè)施之一。

視頻畫面中有一名年輕女子,她的眼睛閃爍著光芒說:“門口站著一個大塊頭的傻瓜。然后他說:‘你以為你是誰,蓮娜·荷恩(上世紀美國超級黑人巨星)嗎?’我說雖然我不是荷恩,但我就像姐姐一樣了解荷恩?!?/p>

上面這段獨白來自沃頓·瓊斯的戲劇《1940年的廣播時刻》的開場白。畫面中的年輕女子繼續(xù)說著這段臺詞,能看出來她很清楚自己在做什么。當(dāng)她詳細講述門衛(wèi)的聲調(diào)變化時,臉上蕩漾出笑容,就像在跟你講笑話一般。她咬字準確時,嘴唇的形狀會發(fā)生恰到好處的變化,聲音抑揚頓挫。她的表情經(jīng)過如此精細的校準,朗讀臺詞時如此地胸有成竹,再加上黑色背景,恍然之中你會覺得自己仿佛正置身于百老匯劇院,眼前在上演的正是上世紀70年代后期的百老匯戲劇。

唯一的不足之處就是:她脖子以下的身體都消失不見了。

Yaser Sheikh伸出手停止了視頻的播放。剛剛畫面中的年輕女子實際上是一個看上去極其逼真的VR虛擬化身,她令人驚艷的表現(xiàn)背后是收集的數(shù)據(jù)在運作。Sheikh是FRL的負責(zé)人,他還拿出了另一個令人印象更加深刻的視頻。在該視頻中,剛剛的那個女子和一個男子都戴著VR頭顯。在屏幕的左側(cè),真實世界中的他們正戴著頭顯在聊天; 而與此同時,在屏幕右側(cè),他們的虛擬化身正在聽著精彩絕倫的音樂會。他們聊天的話題卻很稀松平常,聊的是熱瑜伽——這樣的場景是對未來生活的驚鴻一瞥。

Facebook的新黑科技:Codec Avatars

多年以來,人們在虛擬現(xiàn)實中一直都是通過電腦生成的虛擬化身來代表我們進行互動。VR頭戴設(shè)備和手持控制器都是可追蹤的,所以我們在現(xiàn)實世界中的頭部動作和手部動作可以出現(xiàn)在這些虛擬對話場景中,這些無意識的習(xí)慣動作也為虛擬世界中的對話平添了至關(guān)重要的一點——和諧感。

然而,即使我們的虛擬互動變得更加自然,由于技術(shù)限制,虛擬互動在視覺上只能保持在很簡單的程度——就像Rec Room和Altspace這樣的社交VR App一般,只能將我們的形象抽象成漫畫,基本不會(如果有的話)映射出我們在真實世界的表情。但Facebook的新技術(shù)Spaces能夠用社交媒體照片生成一個形象逼真的動畫形象,但有些表情仍然依賴于按鈕或手柄來觸發(fā)。即使像技術(shù)要求更高的平臺,如高保真領(lǐng)域,它的確可以讓用戶導(dǎo)入自己的3D掃描模型,但如果要求虛擬形象感覺像你一樣栩栩如生,道阻且長。

最初,Yaser Sheikh和他的團隊在匹茲堡市區(qū)東部的自由社區(qū)租了一間小辦公室開始進行這項技術(shù)的研發(fā)工作,目前他們已搬到卡內(nèi)基梅隆校園內(nèi),空間更大,并計劃在未來一兩年內(nèi)再次擴展。FRL稱這項技術(shù)為CodecAvatars,是用機器收集、學(xué)習(xí)和重建人類社交表情的結(jié)果。目前,他們還沒有準備好正式推出這項技術(shù)。最好的情況是,還需要花上幾年時間,前提是他們最后能夠成為Facebook部署計劃中的一部分。但是FRL團隊已經(jīng)準備好開始大展拳腳了。

Sheik說:“如果我們真的能把這件事做好,絕對是非常轟動的。我們想把它做出來,聊聊它的用武之地?!彼樕蠋е赜谐芍竦男θ荩瑢τ趫F隊能完成這項技術(shù)顯得信心十足。

1927年,美國人類學(xué)家、語言學(xué)家愛德華·薩丕爾發(fā)表了一篇文章《無意識的社會行為模式》。在文章中,薩丕爾提到人類對姿態(tài)的反應(yīng)是“一種復(fù)雜又神秘的代碼,沒有文字描述,無人得識,卻眾人皆知” 。92年之后,薩丕爾所說的精密“代碼”成為了Sheikh為之不斷努力的任務(wù)。

在Sheikh進入Facebook之前,他是卡內(nèi)基梅隆大學(xué)的一名教授,負責(zé)研究計算機視覺與社交感知之間的交集。2015年,當(dāng)OculusVR首席科學(xué)家邁克爾·阿布拉什(Michael Abrash)與他聯(lián)系,討論AR和VR未來的方向時,Sheikh毫不猶豫地分享了自己的愿景。現(xiàn)在,Sheikh手里總是端著一杯咖啡,他說:“VR的真正承諾是戴上頭顯進行像視頻中這樣的對話,而不是飛來親自見到我。你能看到的形象,不是卡通版本也不是怪物版本,而是你在真實世界里的行為舉止和音容笑貌?!?/p>

在Sheikh為該設(shè)施撰寫的原始文件中,他將其描述為“社交實驗室”,指的是大腦對虛擬環(huán)境和互動做出反應(yīng)的現(xiàn)象,如同對真實環(huán)境做出的反應(yīng)一般。然后,他還寫道他們認為在7-8名員工的努力下,能夠在五年內(nèi)開發(fā)出照片級程度的虛擬化身。這項項目雖然保留下來了,但對此的期望卻發(fā)生了改變。這也同樣反映在其實驗室的名稱上:Oculus Research去年改名為FacebookReality Labs。

Codec Avatars的原理很簡單,是一種雙重測試,Sheikh稱之為“自我測試”和“母測試”:你應(yīng)該愛你的形象,被你所愛的形象也應(yīng)該愛你。啟用虛擬化身的過程要復(fù)雜得多。第一次使用是在一個名為Mugsy的圓頂狀房間里,房間中的墻和天花板上鑲嵌著132個現(xiàn)成的佳能鏡頭和350個燈光,均聚焦在椅子上。坐在房間中心的感覺就像是置身于一個由狗仔隊組成的黑洞里。 Sheikh還說:“我之前給這個地方取名叫“Mugshooter(臉部狙擊)”,但是之后我們覺得到這是一個挺可怕的名字,不太好?!?不過Mugsy早已經(jīng)歷了幾次更新,Mugsy的攝像頭變多了,能力也變得更強,把那些老早的設(shè)備(比如在一根繩子上綁上乒乓球,讓參與者的臉保持在合適的位置上,就像車庫里的車一樣擺正)淘汰了。

在Mugsy中,研究參與者花了大約一個小時坐在椅子上,制作了一系列超大的面部表情和大音量的朗讀聲線,而另一個房間的員工通過網(wǎng)絡(luò)攝像頭指導(dǎo)他們?nèi)绾巫龀鲞m當(dāng)?shù)谋砬椤!跋耵~那樣活動臉頰,”技術(shù)項目經(jīng)理Danielle Belko說道。

另一個名為Sociopticon的捕獲設(shè)施會更好地應(yīng)用于第二個捕獲區(qū)域(在加入Oculus/Facebook之前,Sheikh在Carnegie Mellon建立了它的前身Panoptic Studio)。Sociopticon看起來很像微軟的MR捕捉工作室,雖然有著更多的相機(180到106)、更高的分辨率(2.5K)和更高的幀速率(90Hz)。當(dāng)Mugsy集中捕獲面部表情時,Sociopticon幫助Codec Avatar系統(tǒng)了解我們的穿著,以及我們的身體如何進行移動。因此,人們在那里的時間并不僅僅是活動面部表情,還要搖晃四肢,四處跳躍,通過網(wǎng)絡(luò)攝像頭與Belko玩耍。

這一切的關(guān)鍵是盡可能多地捕獲信息,Mugsy和Sociopticon每秒可以收集180千兆字節(jié)的信息,以便神經(jīng)網(wǎng)絡(luò)盡可能學(xué)習(xí)從每個可能的角度將表情和運動映射到聲音和肌肉。它捕獲的信息越多,其“深度外觀模型”就越強大,從而更好地將信息編碼為數(shù)據(jù),然后在另一端,另一個人的頭顯將其解碼為虛擬化身,這就是Codec Avatars中的編解碼的過程。

這不僅僅是原始的測量。正如研究科學(xué)家Jason Saragih告訴我那樣,他們還必須將數(shù)據(jù)解釋出來。畢竟普通用戶的起居室里并沒有Mugsy和Sociopticon,他們只有AR/VR頭顯。雖然今天的VR可穿戴設(shè)備被稱為頭戴式顯示器,但FRL的研究人員已經(jīng)創(chuàng)建了一系列HMC或頭戴式捕捉設(shè)備。這些HMC在面部各個區(qū)域設(shè)置了紅外LED和相機,允許軟件將數(shù)據(jù)重新融入到人的形象中。

在不久的將來,Sheikh和他的團隊希望能夠?qū)⒚娌繏呙钄U展到整個身體,因此軟件需要能夠解決Saragih所謂的“外在性”,否則虛擬交互將不會那么逼真。例如當(dāng)人們處于黑暗狀態(tài)時,系統(tǒng)需要進行補償。如果你將手放在背后,系統(tǒng)需要解決這個問題,這樣如果你的朋友在VR中走到你背后,他們就可以看到你的手在做什么。還有一些其他的東西,比如預(yù)測用戶的移動方式,從而保證虛擬化身的運動能盡可能順利,但它們都旨在消除變量,讓你的虛擬形象成為一個不受約束、純粹的代表。

體驗:效果驚艷,略有瑕疵

把人的形象栩栩如生的展現(xiàn)出來很難,這才是事實。即使是超級大片一般的電子游戲也會在頭發(fā)、眼睛、鼻子和嘴巴內(nèi)部等細節(jié)上掙扎,總會有一些部分讓它們看起來并不像是完全的人類。根據(jù)我對捕獲過程的經(jīng)驗,當(dāng)我戴上頭顯與Sheikh和研究員Steve Lombardi進行實時聊天時,我預(yù)想在VR中會出現(xiàn)同樣的情況。

但事實上并沒有。Sheikh的化身雖然沒有他現(xiàn)實生活中那樣的胡須或圓形眼鏡,但這就是他,并且是完全的他。當(dāng)他邀請我靠近并仔細觀察他臉上的胡茬時,感覺非常具有侵略性。Steve Lombardi也是這樣,當(dāng)后來他的真人走進房間時,我覺得我早就認識他了,盡管我只在VR中見過他。雖然結(jié)果并不完美,例如當(dāng)人們興奮地說話時,他們虛擬化身嘴巴的動作并沒有和語調(diào)相統(tǒng)一,此外頭發(fā)雖然根根分明,但周圍總有一個模糊的光環(huán),舌頭看起來也有些模糊,但總體看來,效果是令人感到不可置信的好。

這次的體驗是一個很了不起的經(jīng)歷,同時也很麻煩。雖然Codec Avatars還是一個研究項目,但我們現(xiàn)在已經(jīng)對它有了一定了解。

之前大火的AI換臉程序Deepfakes可以憑空創(chuàng)造面孔,人們的數(shù)據(jù)隱私、錯誤信息活動和惡性行為已經(jīng)成為當(dāng)下互聯(lián)網(wǎng)上非常真實的問題。隨著VR和AR出現(xiàn)并成為人類主流的通信平臺,這些問題將會變得更加嚴重。你覺得網(wǎng)絡(luò)上的騷擾很糟糕嗎?你認為能增加體現(xiàn)個人空間的VR會令人不安嗎?人們對此還沒有足夠的了解。

Sheikh理解這種擔(dān)憂。“真實性不僅對Codec Avatars的成功至關(guān)重要,對于保護用戶也很重要,”他說道?!叭绻憬拥侥隳赣H打來的電話,你聽到了她的聲音,那么你不會產(chǎn)生任何疑問,因為她說的就是你所聽到的對嗎?我們必須建立這樣的信任,并從一開始就保持?!彼肏MC上的傳感器作為認證的重要手段:我們的眼睛、聲音甚至習(xí)慣都是一種生物識別技術(shù)。在過去幾年中,圍繞數(shù)據(jù)隱私和虛擬現(xiàn)實的對話越來越多,而這樣的突破可能會使他們的熱度達到一個新高度。

對于VR在過去十年間所取得的所有進步,像Codec Avatars這樣的技術(shù)代表了我們正在向全新體驗階段過渡。每年在Oculus Connect開發(fā)者大會上,邁克爾·阿布拉什都會上臺演講,并公布公司的最新研究和創(chuàng)新項目的狀態(tài)。隨著時間的推移,他更看好VR的一些突破。他說道:“我不是在打賭說四年內(nèi)就一定能開發(fā)出令人折服的虛擬形象,但這也不是完全不可能的事?!?/p>

現(xiàn)在和Yaser Sheikh坐在一起,我問他對當(dāng)時阿布拉什的宣言有何感受?

“他是對的,”他微笑著喝著咖啡說道。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1432

    瀏覽量

    59013
  • 黑科技
    +關(guān)注

    關(guān)注

    14

    文章

    132

    瀏覽量

    38766
  • AR眼鏡
    +關(guān)注

    關(guān)注

    5

    文章

    660

    瀏覽量

    25292

原文標題:Facebook最新黑科技:在虛擬世界中復(fù)刻一個“真實”的你

文章出處:【微信號:vrtuoluo,微信公眾號:VR陀螺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RK817/RK809音頻Codec停止播放雜音問題:內(nèi)核驅(qū)動修復(fù)與技術(shù)解析

    在嵌入式音頻開發(fā)領(lǐng)域,Codec(編解碼器) 是實現(xiàn)音頻輸入輸出的核心組件。近期,基于 Rockchip 平臺的開發(fā)者反饋典型問題:RK817/RK809
    的頭像 發(fā)表于 02-09 16:32 ?222次閱讀
    RK817/RK809音頻<b class='flag-5'>Codec</b>停止播放雜音問題:內(nèi)核驅(qū)動修復(fù)與技術(shù)解析

    拼多多API應(yīng)用:社交分享驅(qū)動銷量飆升!

    將詳細介紹拼多多API的應(yīng)用方法,結(jié)合技術(shù)實現(xiàn)步驟和代碼示例,幫助開發(fā)者利用社交分享驅(qū)動銷量飆升。 拼多多API簡介 拼多多開放平臺提供系列API,涵蓋商品管理、訂單處理和社交分享
    的頭像 發(fā)表于 12-24 15:43 ?340次閱讀
    拼多多API應(yīng)用:<b class='flag-5'>社交</b>分享驅(qū)動銷量飆升!

    超級電容科技:毫秒級快充,賦能設(shè)備瞬時動力爆發(fā)

    超級電容作為種介于傳統(tǒng)電容與電池之間的儲能器件,憑借其毫秒級充放電速度、超高功率密度和超長循環(huán)壽命,正成為能源存儲領(lǐng)域的“科技”。其核心優(yōu)勢在于突破了傳統(tǒng)電池的能量釋放瓶頸,為設(shè)備提供瞬時動力爆發(fā)能力,同時在快充場景中展現(xiàn)
    的頭像 發(fā)表于 12-10 17:21 ?783次閱讀

    基于E203 RISC-V的音頻信號處理系統(tǒng) -CODEC(音頻編解碼器)配置

    CODEC介紹 本設(shè)計采用的音頻編解碼器是WM8731,該編解碼器可以通過I2C進行寄存器配置,可以調(diào)節(jié)主從模式、數(shù)據(jù)位數(shù)可設(shè)置為16bit、24bit、32bit??梢栽O(shè)置的傳輸模式為I2S、DSP等模式。 寄存器值配置軟件代碼 邏輯分析儀抓取波形
    發(fā)表于 10-28 06:29

    下載到stm32F407是提示“ \'ascii\' codec can\'t decode byte 0xc4 )”錯誤怎么解?

    : UnicodeDecodeError: \'ascii\' codec can\'t decode byte 0xc4 in position 0: ordinal not in range(128) 不知道怎么解決,求助各位
    發(fā)表于 10-10 06:34

    拼多多商品推廣鏈接生成API:社交裂變的轉(zhuǎn)化追蹤利器

    ? 在社交電商時代,拼多多通過 商品推廣鏈接生成API 為商家提供精準的流量轉(zhuǎn)化解決方案。該工具不僅簡化了社交裂變活動的落地,更實現(xiàn)全鏈路轉(zhuǎn)化效果追蹤,成為提升營銷效率的核心引擎。
    的頭像 發(fā)表于 09-08 16:22 ?801次閱讀
    拼多多商品推廣鏈接生成API:<b class='flag-5'>社交</b>裂變的轉(zhuǎn)化追蹤利器

    用1分鐘“招”AI同事,我在WAIC整頓職場

    能幫你扛KPI的職場“新人”,可能是這屆WAIC最實用的科技
    的頭像 發(fā)表于 08-01 00:02 ?969次閱讀
    用1分鐘“招”<b class='flag-5'>了</b><b class='flag-5'>個</b>AI同事,我在WAIC整頓職場

    A316-Codec-V1:USB AI降噪麥克風(fēng)模組技術(shù)詳解

    引言隨著在線會議、直播和游戲語音交流的普及,高質(zhì)量的音頻輸入設(shè)備變得越來越重要。本文將介紹款專為語音收集和處理設(shè)計的USBAI降噪麥克風(fēng)模組——A316-Codec-V1,這是
    的頭像 發(fā)表于 07-21 16:34 ?1040次閱讀
    A316-<b class='flag-5'>Codec</b>-V1:USB AI降噪麥克風(fēng)模組技術(shù)詳解

    API賦能社交電商:驅(qū)動行業(yè)增長的隱形引擎

    ? 在數(shù)字經(jīng)濟的浪潮中,社交電商通過API(應(yīng)用程序編程接口)實現(xiàn)前所未有的爆發(fā)式增長。這種技術(shù)融合不僅重構(gòu)消費場景,更催生了全新的商業(yè)生態(tài)。 、API如何重塑
    的頭像 發(fā)表于 07-21 16:12 ?496次閱讀
    API賦能<b class='flag-5'>社交</b>電商:驅(qū)動行業(yè)增長的隱形引擎

    中科創(chuàng)達智能座艙科技揭秘

    在科技飛速發(fā)展的當(dāng)下,汽車正經(jīng)歷著場前所未有的變革。當(dāng)汽車不再僅僅是種從A點到B點的交通工具,而是進化為 “會思考、能互動、懂生活” 的智能伙伴時,我們的出行方式也正面臨著徹底
    的頭像 發(fā)表于 07-16 17:15 ?1367次閱讀

    直播麥克風(fēng)界的 “六邊形戰(zhàn)士”!飛騰云A316-Codec-V1讓聲音自帶 “美顏濾鏡”

    當(dāng)專業(yè)音頻技術(shù)遇上直播場景,會碰撞出怎樣的火花?直播時代,聲音質(zhì)量早已成為決定內(nèi)容質(zhì)感的“隱形門檻”。無論是主播帶貨、游戲解說還是音樂翻唱,背景噪音、人聲失真、延遲卡頓等問題,總能讓精心準備的內(nèi)容
    的頭像 發(fā)表于 07-08 15:33 ?1455次閱讀
    直播麥克風(fēng)界的 “六邊形戰(zhàn)士”!飛騰云A316-<b class='flag-5'>Codec</b>-V1讓聲音自帶 “美顏濾鏡”

    有屏幕就能玩《神話:悟空》:“無影”的科技

    。有沒有方法,讓普通電腦都能玩上《神話:悟空》呢?阿里云“無影”電腦可能讓你的愿望成真!“無影”加buff,有屏就能打游戲我們的業(yè)務(wù)總監(jiān)就直接用上了阿里云“無
    的頭像 發(fā)表于 06-24 10:16 ?659次閱讀
    有屏幕就能玩《<b class='flag-5'>黑</b>神話:悟空》:“無影”的<b class='flag-5'>黑</b>科技

    詳解儲能系統(tǒng)啟動技術(shù)

    儲能系統(tǒng)的“啟動”是指在電力系統(tǒng)發(fā)生大規(guī)模停電或故障后,利用儲能系統(tǒng)作為備用電源,重新啟動電網(wǎng)的過程。在這種情況下,電網(wǎng)處于完全停電的狀態(tài),即所謂的“”狀態(tài),而儲能系統(tǒng)則提供必要的電能來逐步恢復(fù)電網(wǎng)的正常運行。
    的頭像 發(fā)表于 05-29 10:16 ?4191次閱讀
    詳解儲能系統(tǒng)<b class='flag-5'>黑</b>啟動技術(shù)

    如何移動或修改CX3中的數(shù)據(jù)以獲得更正常的幀而沒有這些像素問題?

    位。 然而,輸出看起來有些綠色,我使用GStreamer通過將色度通道設(shè)置為零進行了校正,從而得到了灰度圖像。 問題 當(dāng)使用YUY2格式(調(diào)整色度后)時,我遇到了新問題。 眾所周知,YUY2 有
    發(fā)表于 05-16 06:50

    燧原科技助力源石云旗下Hobby平臺重塑AI社交體驗

    算力是人工智能高質(zhì)量發(fā)展的引擎,基于燧原S60推理算力集群的太湖億芯(無錫)智算中心今年1月正式投入運營,為源石云旗下的Hobby社交共創(chuàng)平臺的實時互動、多模態(tài)內(nèi)容生成提供堅實的數(shù)字底座。
    的頭像 發(fā)表于 04-09 14:19 ?1720次閱讀