91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

<button id="ygy4o"></button>

<code id="ygy4o"></code>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

谷歌新作Dreamix：視頻擴散模型是通用視頻編輯器，效果驚艷！

AIGC 已經(jīng)火了很長時間了，出現(xiàn)了文本生成圖像、文本生成視頻、圖像生成視頻等廣泛的應(yīng)用場景，如今谷歌研究院的一項新研究可以讓我們根據(jù)輸入視頻生成其他視頻了！

我們知道，生成模型和多模態(tài)視覺語言模型的進展已經(jīng)為具備前所未有生成真實性和多樣性的大型文本到圖像模型鋪平了道路。這些模型提供了新的創(chuàng)作過程，但僅限于合成新圖像而非編輯現(xiàn)有圖像。為了彌合這一差距，基于文本的直觀編輯方法可以對生成和真實圖像進行基于文本的編輯，并保留這些圖像的一些原始屬性。與圖像類似，近來文本到視頻模型也提出了很多，但使用這些模型進行視頻編輯的方法卻很少。在文本指導(dǎo)的視頻編輯中，用戶提供輸入視頻以及描述生成視頻預(yù)期屬性的文本 prompt，如下圖 1 所示。目標有以下三個方面，1）對齊，編輯后的視頻應(yīng)符合輸入文本 prompt；2）保真度，編輯后的視頻應(yīng)保留原始視頻的內(nèi)容，3）質(zhì)量，編輯后的視頻應(yīng)具備高質(zhì)量。可以看到，視頻編輯比圖像編輯更加具有挑戰(zhàn)性，它需要合成新的動作，而不僅僅是修改視覺外觀。此外還需要保持時間上的一致性。因此，將 SDEdit、Prompt-to-Prompt 等圖像級別的編輯方法應(yīng)用于視頻幀上不足以實現(xiàn)很好的效果。

在近日谷歌研究院等發(fā)表在 arXiv 的一篇論文中，研究者提出了一種新方法 Dreamix，它受到了 UniTune 的啟發(fā)，將文本條件視頻擴散模型（video diffusion model, VDM）應(yīng)用于視頻編輯。

Dreamix: Video Diffusion Models are General Video Editors

論文地址：https://arxiv.org/abs/2302.01329

項目主頁：https://dreamix-video-editing.github.io/

文中方法的核心是通過以下兩種主要思路使文本條件 VDM 保持對輸入視頻的高保真度。其一不使用純噪聲作為模型初始化，而是使用原始視頻的降級版本，通過縮小尺寸和添加噪聲僅保留低時空信息；其二通過微調(diào)原始視頻上的生成模型來進一步提升對原始視頻的保真度。微調(diào)確保模型了解原始視頻的高分辨率屬性。對輸入視頻的簡單微調(diào)會促成相對較低的運動可編輯性，這是因為模型學(xué)會了更傾向于原始運動而不是遵循文本 prompt。研究者提出了一種新穎的混合微調(diào)方法，其中 VDM 也在輸入視頻各個幀的集合上進行微調(diào)，并丟棄了它們的時序。混合微調(diào)顯著提升了運動編輯的質(zhì)量。研究者進一步利用其視頻編輯模型提出了一個新的圖像動畫框架，如下圖 2 所示。該框架包含了幾個步驟，比如為圖像中的對象和背景設(shè)置動畫、創(chuàng)建動態(tài)相機運動等。他們通過幀復(fù)制或幾何圖像變換等簡單的圖像處理操作來實現(xiàn)，從而創(chuàng)建粗糙的視頻。接著使用 Dreamix 視頻編輯器對視頻進行編輯。此外研究者還使用其微調(diào)方法進行目標驅(qū)動的視頻生成，也即 Dreambooth 的視頻版本。

在實驗展示部分，研究者進行了廣泛的定性研究和人工評估，展示了他們方法的強大能力，具體可參考如下動圖。

?

對于谷歌這項研究，有人表示，3D + 運動和編輯工具可能是下一波論文的熱門主題。

還有人表示：大家可以很快在預(yù)算內(nèi)制作自己的的電影了，你所需要的只是一個綠幕以及這項技術(shù)：

方法概覽本文提出了一種新的方法用于視頻編輯，具體而言：通過逆向被破壞視頻進行文本引導(dǎo)視頻編輯他們采用級聯(lián) VDM（ Video Diffusion Models ），首先通過下采樣對輸入視頻就行一定的破壞，后加入噪聲。接下來是級聯(lián)擴散模型用于采樣過程，并以時間 t 為條件，將視頻升級到最終的時間 - 空間分辨率。在對輸入視頻進行破壞處理的這一過程中，首先需要進行下采樣操作，以得到基礎(chǔ)模型（16 幀 24 × 40），然后加入方差為高斯噪聲，從而進一步破壞輸入視頻。 ? 對于上述處理好的視頻，接下來的操作是使用級聯(lián) VDM 將損壞掉的低分辨率視頻映射到與文本對齊的高分辨率視頻。這里的核心思想是，給定一個嘈雜的、時間空間分辨率非常低的視頻，有許多完全可行的、高分辨率的視頻與之對應(yīng)。本文中基礎(chǔ)模型從損壞的視頻開始，它與時間 s 的擴散過程具有相同的噪聲。然后該研究用 VDM 來逆向擴散過程直到時間 0。最后通過超分辨率模型對視頻進行升級。 ?混合視頻圖像微調(diào)? 僅利用輸入視頻進行視頻擴散模型的微調(diào)會限制物體運動變化，相反，該研究使用了一種混合目標，即除了原始目標（左下角）之外，本文還對無序的幀集進行了微調(diào)，這是通過「masked temporal attention」來完成的，以防止時間注意力和卷積被微調(diào)（右下）。這種操作允許向靜態(tài)視頻中添加運動。 ?

推理在應(yīng)用程序預(yù)處理的基礎(chǔ)上（Aapplication Dependent Pre-processing，下圖左），該研究支持多種應(yīng)用，能將輸入內(nèi)容轉(zhuǎn)換為統(tǒng)一的視頻格式。對于圖像到視頻，輸入圖像被復(fù)制并被變換，合成帶有一些相機運動的粗略視頻；對于目標驅(qū)動視頻生成，其輸入被省略，單獨進行微調(diào)以維持保真度。然后使用 Dreamix Video Editor（右）編輯這個粗糙的視頻：即前面講到的，首先通過下采樣破壞視頻，添加噪聲。然后應(yīng)用微調(diào)的文本引導(dǎo)視頻擴散模型，將視頻升級到最終的時間空間分辨率。

實驗結(jié)果視頻編輯：下圖中 Dreamix 將動作改為舞蹈，并且外觀由猴子變?yōu)樾埽曨l中主體的基本屬性沒有變：

Dreamix 還可以生成與輸入視頻時間信息一致的平滑視覺修改，如下圖會滑滑板的小鹿：

圖像到視頻：當輸入是一張圖像時，Dreamix 可以使用其視頻先驗添加新的移動對象，如下圖中添加了在有霧的森林中出現(xiàn)一頭獨角獸，并放大。

小屋旁邊出現(xiàn)企鵝：

目標驅(qū)動視頻生成：Dreamix 還可以獲取顯示相同主題的圖像集合，并以該主題為運動對象生成新的視頻。如下圖是一條在葉子上蠕動的毛毛蟲：

除了定性分析外，該研究還進行了基線比較，主要是將 Dreamix 與 Imagen-Video、 Plug-and-Play (PnP) 兩種基線方法進行對比。下表為評分結(jié)果：

圖 8 展示了由 Dreamix 編輯的視頻和兩個基線示例：文本到視頻模型實現(xiàn)了低保真度的編輯，因為它不以原始視頻為條件。PnP 保留了場景，但不同幀之間缺乏一致性；Dreamix 在這三個目標上都表現(xiàn)良好。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

視頻

視頻

+關(guān)注

關(guān)注
6

文章
2005

瀏覽量
74980
編輯器

編輯器

+關(guān)注

關(guān)注
1

文章
828

瀏覽量
32916
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
572

瀏覽量
11323

原文標題：谷歌新作Dreamix：視頻擴散模型是通用視頻編輯器，效果驚艷！

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

電子發(fā)燒友

關(guān)于我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

版權(quán)所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级
国产操人视频在线|亚洲欧美第一区第二区在线视频观看|日本A片在线看一级无码片|sese国产sy导航|久久国产老熟女按摩AV|久久无码最新视频|免费靥色AV在线青草热|亚洲AV无码乱码一区二三区|成人免费在线A片|一级片在线免费天天久久 97亚洲国产怡红啊AV|a片大全免费在线观看|在线能看的黄色视频网站|日韩精品国模成人午夜福利|AV毛片在线看三级片黄片免费|日韩成人av在线观看|日本不卡小说欧美一区大毛片|超碰人妻AV在线|日韩精妻视频美日韩性爱|手机看片日韩一区二区图片一区中文字幕亚洲|国产在线一区二区三区有字幕|黄色影片无码五月亭AV|日韩一级久久视频|人人爱人人操人人爱|亚洲av激情电影|日韩一区二区三区制服师生中出|动漫五码中文字幕|日韩人妻精品中文字幕专区不卡|成人伦理Av一级一级a片