91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種簡(jiǎn)單的“動(dòng)作遷移法”

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-08-27 08:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

伯克利的研究人員提出了一種簡(jiǎn)單的“動(dòng)作遷移法”,可以將源視頻中一個(gè)人的動(dòng)作和姿態(tài),遷移到新的視頻對(duì)象上,讓后者也具有同樣流暢優(yōu)美的動(dòng)作,整個(gè)過(guò)程只需要幾分鐘就成完成。

說(shuō)起去年讓“馬變斑馬”的CycleGAN,大家應(yīng)該還記憶猶新。

CycleGAN利用pixel2pixel技術(shù),能自動(dòng)將某一類圖片轉(zhuǎn)換成另外一類圖片,過(guò)度真實(shí)自然,可以說(shuō)是2017年最受關(guān)注的模型之一。CycleGAN論文的第一作者、加州大學(xué)伯克利分校的朱俊彥(現(xiàn)已在MIT CSAIL擔(dān)任博士后),也由此獲得了SIGGRAPH 2018的杰出博士論文獎(jiǎng)。

現(xiàn)在,同樣是伯克利的Caroline Chan、ShiryH Ginosar、Tinghui Zhou、Alexel A. Efros提出了或許更有意思的一篇論文,不僅是圖像,而是實(shí)現(xiàn)不同視頻之間的人物動(dòng)作姿態(tài)轉(zhuǎn)換,而且面部也能逼真合成效果,整個(gè)過(guò)程只需要幾分鐘就能完成。

將專業(yè)舞者的動(dòng)作遷移到其他人身上,讓每個(gè)人都能成為頂級(jí)舞者

作者在論文摘要中這樣介紹:

本文提出一種簡(jiǎn)單的 “跟我做”(do as I do)的動(dòng)作遷移方法:給定一個(gè)人跳舞的源視頻,我們可以在目標(biāo)人物表演標(biāo)準(zhǔn)動(dòng)作幾分鐘后將該表演遷移到一個(gè)新的目標(biāo)身上(業(yè)余舞者)。

我們將這個(gè)問(wèn)題視為一個(gè)具有時(shí)空平滑的每幀 image-to-image 轉(zhuǎn)換問(wèn)題。利用姿勢(shì)檢測(cè)作為原和目標(biāo)之間的中間表示,我們學(xué)習(xí)了從姿勢(shì)圖像到目標(biāo)對(duì)象外觀的映射。

我們利用這樣的設(shè)置實(shí)現(xiàn)了連貫時(shí)間的視頻生成,并且包括逼真的面部合成。

基于人體姿態(tài)關(guān)鍵點(diǎn),實(shí)現(xiàn)視頻間不同主體的復(fù)雜動(dòng)作

伯克利研究者提出了一種在不同視頻中轉(zhuǎn)移人體動(dòng)作的方法。

他們要實(shí)現(xiàn)的目的很簡(jiǎn)單——給定兩個(gè)視頻:一個(gè)是目標(biāo)人物,我們想合成他的表演;另一個(gè)是源視頻,我們想將他的動(dòng)作轉(zhuǎn)移到目標(biāo)人物身上。

這與過(guò)去使用最近鄰搜索或 3D 重定向運(yùn)動(dòng)的方法不同。在伯克利研究人員提出的框架下,他們制作了各種各樣的視頻,讓業(yè)余舞蹈愛(ài)好者能夠像芭蕾舞演員一樣旋轉(zhuǎn)、跳躍,表演武術(shù),跳舞。

最初,為了逐幀地在兩個(gè)視頻的主體之間遷移運(yùn)動(dòng),研究人員認(rèn)為他們必須學(xué)習(xí)兩個(gè)人的圖像之間的映射。因此,目標(biāo)是在源集和目標(biāo)集之間發(fā)現(xiàn)圖像到圖像的翻譯(image-to-image translation)。

但是,他們并沒(méi)有用兩個(gè)實(shí)驗(yàn)對(duì)象對(duì)應(yīng)的相同動(dòng)作來(lái)直接監(jiān)督學(xué)習(xí)這種翻譯。即使兩個(gè)實(shí)驗(yàn)對(duì)象都做同樣的動(dòng)作,由于每個(gè)實(shí)驗(yàn)對(duì)象的體型和風(fēng)格差異,仍然不太可能有幀到幀的 body-pose 對(duì)應(yīng)的精確框架。

于是,他們觀察了基于人體姿態(tài)關(guān)鍵點(diǎn)(keypoint),關(guān)鍵點(diǎn)本質(zhì)上是編碼身體的位置而不是外觀,可以作為任何兩個(gè)主體之間的中間表示。而姿勢(shì)可以隨著時(shí)間的推移保持動(dòng)作特征,同時(shí)盡可能地抽象出對(duì)象身份標(biāo)識(shí)。因此,我們將中間的表示設(shè)計(jì)為火柴人自試圖,如下圖所示。

將源視頻中人物(左上)動(dòng)態(tài)的姿態(tài)關(guān)鍵點(diǎn)(左下)作為轉(zhuǎn)化,遷移到目標(biāo)視頻人物(右)。

從目標(biāo)視頻中,我們得到每一幀的姿勢(shì)檢測(cè),得到一組(姿勢(shì)火柴人,目標(biāo)人物形象)的對(duì)應(yīng)數(shù)據(jù)。有了這些對(duì)齊的數(shù)據(jù),我們就可以在有監(jiān)督的情況下,學(xué)習(xí)一種在火柴人和目標(biāo)人物圖像之間的 image-to-image 的轉(zhuǎn)換模型。

因此,的模型經(jīng)過(guò)訓(xùn)練,可以生成特定目標(biāo)對(duì)象的個(gè)性化視頻。然后,將動(dòng)作從源遷移到目標(biāo),將姿勢(shì)火柴人圖形輸入到訓(xùn)練模型中,得到與源姿勢(shì)相同的目標(biāo)對(duì)象的圖像。

為了提高結(jié)果的質(zhì)量,研究人員還添加了兩個(gè)組件:

為了提高生成的視頻的時(shí)間平滑度,我們?cè)诿恳粠紝㈩A(yù)測(cè)設(shè)置在前一幀的時(shí)間步長(zhǎng)上。

為了在結(jié)果中增加人臉的真實(shí)感,我們加入了一個(gè)專門訓(xùn)練來(lái)生成目標(biāo)人物面部的 GAN。

這種方法生成的視頻,可以在各種視頻主體之間遷移運(yùn)動(dòng),而無(wú)需昂貴的 3D 或動(dòng)作捕捉數(shù)據(jù)。

作者在論文中寫(xiě)道:“我們的主要貢獻(xiàn)是一個(gè)基于學(xué)習(xí)的視頻之間人體運(yùn)動(dòng)遷移的 pineline,所得結(jié)果的質(zhì)量展示了現(xiàn)實(shí)的詳細(xì)視頻中的復(fù)雜運(yùn)動(dòng)遷移。”

選一個(gè)你喜歡的舞蹈視頻,以及你自己動(dòng)幾下的視頻,一鍵轉(zhuǎn)換!

首先,我們需要準(zhǔn)備兩種視頻素材:

一個(gè)是你理想舞者表演的視頻:

一個(gè)是你自己隨性 “凹” 出的動(dòng)作視頻:

最終的目標(biāo),就是讓你能夠跳出夢(mèng)寐以求的曼妙舞姿:

為了實(shí)現(xiàn)這一目標(biāo),可以將 pipeline 分為三個(gè)階段:

1、姿勢(shì)檢測(cè):根據(jù)源視頻中給定的幀,使用預(yù)訓(xùn)練好的姿勢(shì)檢測(cè)器來(lái)制作姿勢(shì)線條圖;

2、全局姿勢(shì)歸一化:該階段考慮了源視頻與目標(biāo)視頻中人物身形的不同,以及在各自視頻中位置的差異;

3、將歸一化的姿勢(shì)線條圖與目標(biāo)人物進(jìn)行映射:該階段通過(guò)對(duì)抗性學(xué)習(xí)設(shè)計(jì)了一個(gè)系統(tǒng),來(lái)將歸一化的姿勢(shì)線條圖與目標(biāo)人物進(jìn)行映射。

完整的訓(xùn)練過(guò)程

模型根據(jù)源視頻中給定的幀,使用預(yù)訓(xùn)練好的姿勢(shì)檢測(cè)器 P 來(lái)制作姿勢(shì)線條圖。在訓(xùn)練期間,學(xué)習(xí)了一種映射 G 和一個(gè)對(duì)抗性鑒別器 D,來(lái)試圖區(qū)分哪些匹配是真,哪些是假。

完整的轉(zhuǎn)換過(guò)程

模型使用一個(gè)姿勢(shì)檢測(cè)器 P : Y′ → X′來(lái)獲取源視頻中人物的姿勢(shì)關(guān)節(jié),這些關(guān)節(jié)通過(guò)歸一化,轉(zhuǎn)換為姿勢(shì)條形圖中目標(biāo)人物的關(guān)節(jié)。而后,我們使用訓(xùn)練好的映射 G。

增加人臉真實(shí)感:圖像到圖像轉(zhuǎn)換的對(duì)抗訓(xùn)練

好了,現(xiàn)在“炫酷舞姿”的問(wèn)題解決了,剩下的就是將目標(biāo)視頻中因?yàn)閯?dòng)作改變而隨之模糊的臉部變得更加逼真而清晰。

為了實(shí)現(xiàn)這一點(diǎn),研究人員將 pix2pixHD 的對(duì)抗性訓(xùn)練設(shè)置修改為:

(1) 產(chǎn)生時(shí)間相干視頻幀;

(2) 合成逼真的人臉圖像。

接下來(lái)將詳細(xì)描述原始目標(biāo)和對(duì)它的修改。

pix2pixHD 框架

方法是基于 pix2pixHD 中的目標(biāo)提出來(lái)的。在初始條件 GAN 設(shè)置中,生成器網(wǎng)絡(luò) G 對(duì)多尺度鑒別器 D = (D1,D2,D3) 進(jìn)行極大極小博弈。

其中,是對(duì)抗性損失:

讓動(dòng)作更加連貫

時(shí)間平滑(Temporal Smoothing)設(shè)置

Face GAN

我們添加了一個(gè)專門的 GAN 設(shè)置,用于為面部區(qū)域添加更多細(xì)節(jié)和真實(shí)感,如下圖所示。

Face GAN 設(shè)置

在 Face GAN 中,通過(guò)生成器預(yù)測(cè)殘差,并將其添加到來(lái)自主生成器的原始面部預(yù)測(cè)中。

更進(jìn)一步:從pix2pix到pix2pixHD

我們探討了對(duì) pix2pixHD baseline 的修改效果,并根據(jù)收集的數(shù)據(jù)集評(píng)估結(jié)果的質(zhì)量。

遷移的結(jié)果。每個(gè)部分顯示 5 個(gè)連續(xù)的幀。上面一行顯示 source subject,中間一行顯示規(guī)范化的 pose stick figures,下面一行顯示目標(biāo)人物的模型輸出。

不同模型合成結(jié)果的比較

人人都能在幾分鐘之內(nèi),成為世界頂級(jí)舞者

總的來(lái)說(shuō),新的這個(gè)動(dòng)作遷移模型能夠創(chuàng)建合理的、將任意長(zhǎng)度的目標(biāo)人物跳舞的視頻,其中他們的舞姿跟隨另一個(gè)跳舞者的輸入視頻。雖然我們的設(shè)置在很多情況下都可以產(chǎn)生可信的結(jié)果,但偶爾會(huì)遇到幾個(gè)問(wèn)題。

從根本上說(shuō),作為輸入的 pose stick figures 依賴于噪聲姿態(tài)估計(jì),這些估計(jì)不會(huì)逐幀攜帶時(shí)間信息。在姿勢(shì)檢測(cè)中丟失關(guān)鍵點(diǎn),關(guān)鍵點(diǎn)位置不正確,會(huì)將錯(cuò)誤引入到輸入中,并且這些失敗通常會(huì)延續(xù)到結(jié)果中,雖然我們嘗試了通過(guò)時(shí)間平滑設(shè)置來(lái)減輕這些限制。但即使我們?cè)噲D在設(shè)置中注入時(shí)間連貫性(temporal coherence),以及預(yù)平滑關(guān)鍵點(diǎn),結(jié)果經(jīng)常仍然會(huì)受到抖動(dòng)的影響。

雖然我們的全局姿勢(shì)歸一化方法合理地調(diào)整了任何源對(duì)象的運(yùn)動(dòng),使其與訓(xùn)練中看到的目標(biāo)人物的體型和位置相匹配,但這種簡(jiǎn)單縮放和平移解決方案并未考慮不同的肢長(zhǎng)和攝像機(jī)位置或角度。這些差異也會(huì)導(dǎo)致在訓(xùn)練和測(cè)試時(shí)看到的運(yùn)動(dòng)之間存在更大的差距。

另外,2D 坐標(biāo)和缺失檢測(cè)限制了在對(duì)象之間重新定位運(yùn)動(dòng)的方式,這些方法通常在 3D 中工作,需要有完美的關(guān)節(jié)位置和時(shí)間連貫運(yùn)動(dòng)。

為了解決這些問(wèn)題,需要在時(shí)間上連貫的視頻生成和人體運(yùn)動(dòng)表示方面做更多的工作。雖然整體上 pose stick figures 產(chǎn)生了令人信服的結(jié)果,但我們希望在未來(lái)的工作中,通過(guò)使用為運(yùn)動(dòng)遷移特別優(yōu)化的時(shí)間連貫輸入和表示來(lái)避免它所帶來(lái)的限制。

盡管存在這些挑戰(zhàn),但我們的方法能夠在給出各種輸入的情況下制作吸引人的視頻。

難度被譽(yù)為最高的芭蕾舞黑天鵝48圈轉(zhuǎn),可以換上自己的臉,想想還是有些小激動(dòng)呢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42340
  • 遷移
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    8174

原文標(biāo)題:【超越CycleGAN】這個(gè)人體動(dòng)態(tài)遷移技術(shù)讓白癡變舞王(視頻)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    節(jié)點(diǎn)分析的工作原理和基本步驟

    節(jié)點(diǎn)分析(節(jié)點(diǎn)電壓、節(jié)點(diǎn)電位)是一種電路分析技術(shù),以電路中各節(jié)點(diǎn)(連接點(diǎn))的電位作為未知量,運(yùn)用基爾霍夫電流定律(KCL)建立聯(lián)立方程進(jìn)行求解。作為與網(wǎng)孔分析
    的頭像 發(fā)表于 02-05 14:50 ?388次閱讀
    節(jié)點(diǎn)分析<b class='flag-5'>法</b>的工作原理和基本步驟

    條件判斷來(lái)實(shí)現(xiàn)狀態(tài)機(jī)

    S0 只需要考慮事件 E1 的處理就行了。 既然是兩個(gè) switch—case 之間的嵌套, 那么就有個(gè)誰(shuí)嵌套誰(shuí)的問(wèn)題, 所以說(shuō) switch—case有兩寫(xiě)法:狀態(tài)嵌套事件和事件嵌套
    發(fā)表于 12-09 08:18

    新型超快速單脈沖技術(shù)解決傳統(tǒng)遷移率測(cè)量挑戰(zhàn)

    溝道有效遷移率 (μeff) 通過(guò)載流子速度和驅(qū)動(dòng)電流影響MOSFET性能。它是互補(bǔ)金屬氧化物半導(dǎo)體的關(guān)鍵參數(shù)之 (CMOS) 技術(shù)。 隨著新型介電材料的出現(xiàn),傳統(tǒng)的遷移率評(píng)估測(cè)量技術(shù)遇到了下
    的頭像 發(fā)表于 11-17 13:58 ?3140次閱讀
    新型超快速單脈沖技術(shù)解決傳統(tǒng)<b class='flag-5'>遷移</b>率測(cè)量挑戰(zhàn)

    基于傳輸線(TLM)的多晶 In?O?薄膜晶體管電阻分析及本征遷移率精準(zhǔn)測(cè)量

    氧化物半導(dǎo)體(如In?O?)因其高電子遷移率(>10cm2/Vs)和低漏電流特性,成為下代顯示技術(shù)和三維集成器件的理想候選材料。然而,傳統(tǒng)場(chǎng)效應(yīng)遷移率(μFE)的測(cè)量常因寄生電阻(Rs/d
    的頭像 發(fā)表于 09-29 13:03 ?1247次閱讀
    基于傳輸線<b class='flag-5'>法</b>(TLM)的多晶 In?O?薄膜晶體管電阻分析及本征<b class='flag-5'>遷移</b>率精準(zhǔn)測(cè)量

    一種適用于超低噪聲應(yīng)用的數(shù)字線性穩(wěn)壓器

    線性穩(wěn)壓器是一種簡(jiǎn)單的電壓轉(zhuǎn)換器,可將較高的輸入電壓轉(zhuǎn)換為較低的輸出電壓。其行為特性就像個(gè)動(dòng)態(tài)電阻器,總是能夠準(zhǔn)確地調(diào)節(jié)至所需數(shù)值,確保在特定的電流下使設(shè)定的輸出電壓保持恒定。
    的頭像 發(fā)表于 08-19 09:20 ?1530次閱讀

    電化學(xué)遷移(ECM):電子元件的“隱形殺手” ——失效機(jī)理、環(huán)境誘因與典型案例解析

    前言在電子設(shè)備中,有一種失效現(xiàn)象常被稱為“慢性病”——電化學(xué)遷移(ECM)。它悄無(wú)聲息地腐蝕電路,最終導(dǎo)致短路、漏電甚至器件燒毀。尤其在高溫高濕環(huán)境下可能導(dǎo)致電路短路失效。本文將深入解析ECM的機(jī)制
    的頭像 發(fā)表于 08-14 15:46 ?4646次閱讀
    電化學(xué)<b class='flag-5'>遷移</b>(ECM):電子元件的“隱形殺手” ——失效機(jī)理、環(huán)境誘因與典型案例解析

    一種抗輻射加固檢錯(cuò)糾錯(cuò)電路的設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《一種抗輻射加固檢錯(cuò)糾錯(cuò)電路的設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 08-11 15:38 ?0次下載

    一種新的無(wú)刷直流電機(jī)反電動(dòng)勢(shì)檢測(cè)方法

    無(wú)位置傳感器無(wú)刷直流電機(jī)的控制算法是近年來(lái)研究的熱點(diǎn)之,有霍爾位置信號(hào)直流電機(jī)根據(jù)霍爾狀態(tài)來(lái)確定通斷功率器件。利用無(wú)刷直流電機(jī)的數(shù)學(xué)模型,根據(jù)反電動(dòng)勢(shì)檢測(cè)原理,提出了一種新的線反電動(dòng)勢(shì)檢測(cè)方法來(lái)
    發(fā)表于 08-07 14:29

    一種新的無(wú)刷直流電機(jī)反電動(dòng)勢(shì)檢測(cè)方法

    無(wú)位置傳感器無(wú)刷直流電機(jī)的控制算法是近年來(lái)研究的熱點(diǎn)之,有霍爾位置信號(hào)直流電機(jī)根據(jù)霍爾狀態(tài)來(lái)確定通斷功率器件。利用無(wú)刷直流電機(jī)的數(shù)學(xué)模型,根據(jù)反電動(dòng)勢(shì)檢測(cè)原理,提出了一種新的線反電動(dòng)勢(shì)檢測(cè)方法來(lái)
    發(fā)表于 08-04 14:59

    一種環(huán)保型紅色發(fā)煙彈主裝藥配方設(shè)計(jì)與優(yōu)化

    HS-STA-002同步熱分析儀(SimultaneousThermalAnalyzer,STA)是一種用于同時(shí)測(cè)量樣品在受熱過(guò)程中質(zhì)量變化和熱效應(yīng)的儀器。它結(jié)合了熱重分析(TGA)和差示掃描量熱
    的頭像 發(fā)表于 07-07 15:56 ?463次閱讀
    <b class='flag-5'>一種</b>環(huán)保型紅色發(fā)煙彈主裝藥配方設(shè)計(jì)與優(yōu)化

    100微電容怎么測(cè)量

    本文介紹了三主流測(cè)量電容的方法:萬(wàn)用表直接測(cè)量、指針式萬(wàn)用表、差動(dòng)式直流充電。其中,萬(wàn)用表直接測(cè)量操作簡(jiǎn)單、成本低,適合現(xiàn)場(chǎng)維修等場(chǎng)
    的頭像 發(fā)表于 06-22 09:52 ?2141次閱讀
    100微<b class='flag-5'>法</b>電容怎么測(cè)量

    寬調(diào)速范圍低轉(zhuǎn)矩脈動(dòng)的一種新型內(nèi)置式永磁同步電機(jī)的設(shè)計(jì)與分析

    摘要:寬調(diào)速范圍與低轉(zhuǎn)矩脈動(dòng)直是設(shè)計(jì)電動(dòng)汽車用內(nèi)置式永礎(chǔ)同步電機(jī)時(shí)所追求的重要目標(biāo)。設(shè)計(jì)了一種轉(zhuǎn)子結(jié)構(gòu)為胃的新型內(nèi)置式永礎(chǔ)同步電機(jī),并進(jìn)行了繞組結(jié)構(gòu)優(yōu)化與性能分析。利用有限元分析,將所設(shè)計(jì)的電機(jī)
    發(fā)表于 06-06 14:13

    載流子遷移率提高技術(shù)詳解

    在高k金屬柵之外,另一種等效擴(kuò)充的方法是增加通過(guò)器件溝道的電子或空穴的遷移率。表2.5列舉了些提高器件載流子遷移率的手段及其對(duì) PMOS或者 NMOS的作用。
    的頭像 發(fā)表于 05-30 15:19 ?1448次閱讀
    載流子<b class='flag-5'>遷移</b>率提高技術(shù)詳解

    一種新型寬帶鞭狀套筒天線

    電子發(fā)燒友網(wǎng)站提供《一種新型寬帶鞭狀套筒天線.pdf》資料免費(fèi)下載
    發(fā)表于 05-28 14:05 ?0次下載

    一種在線式熒光溶解氧傳感器原理

    制備的溶解氧傳感器由于其具有響應(yīng)時(shí)間快、不耗氧、無(wú)參比電極、不受磁場(chǎng)干擾等優(yōu)點(diǎn)引起了越來(lái)越多人的興趣和關(guān)注。我們基于熒光分析法制備了一種能應(yīng)用于實(shí)際檢測(cè)中的熒光溶解氧傳感器,并對(duì)其結(jié)構(gòu)及性能等進(jìn)行了
    發(fā)表于 04-21 15:01