我們研究視頻到視頻的合成問題,其目的是學(xué)習從輸入源視頻(例如,一系列語義分割掩碼)到精確描述源視頻內(nèi)容的輸出真實感視頻的映射功能。
雖然它的圖像對應(yīng)物(圖像到圖像合成問題)是一個受歡迎的話題,但是視頻到視頻合成問題在文獻中很少探討。在不了解時間動態(tài)的情況下,將現(xiàn)有的圖像合成方法直接應(yīng)用于輸入視頻通常會導(dǎo)致視覺質(zhì)量低下的時間不連貫視頻。
在本文中,我們提出了一種在生成對抗性學(xué)習框架下的新穎的視頻合成方法。通過精心設(shè)計的生成器和鑒別器架構(gòu)以及時空對抗目標,我們可以通過多種輸入格式(包括分割蒙版,草圖和姿勢)獲得高分辨率,逼真的,時間上連貫的視頻結(jié)果。在多個基準上進行的實驗表明,與強基準相比,我們的方法具有優(yōu)勢。
尤其是,我們的模型能夠合成長達30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測,其性能超過了幾個最先進的競爭系統(tǒng)。
我們的模型能夠合成長達30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測,其性能超過了幾個最先進的競爭系統(tǒng)。
我們的模型能夠合成長達30秒的街道場景的2K分辨率視頻,從而大大提高了視頻合成的最新水平。最后,我們將我們的方法應(yīng)用于未來的視頻預(yù)測,其性能超過了幾個最先進的競爭系統(tǒng)。
-
視頻
+關(guān)注
關(guān)注
6文章
2006瀏覽量
74991 -
模型
+關(guān)注
關(guān)注
1文章
3767瀏覽量
52138 -
生成器
+關(guān)注
關(guān)注
7文章
322瀏覽量
22733
發(fā)布評論請先 登錄
NVIDIA和ComfyUI攜手簡化本地AI視頻生成工作流
SeaVerse發(fā)布全球首個AI Native平臺,“All in AI Native”引領(lǐng)AI創(chuàng)作前瞻革命
商湯科技日日新Seko系列模型與寒武紀成功適配
使用Firebase AI Logic生成圖像模型的兩種新功能
OpenAI Sora 2模型上線微軟Azure AI Foundry國際版
全球首個動漫專屬AI視頻生成平臺Animon,國內(nèi)版"萌動AI"正式發(fā)布
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)
【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)
生成式 AI 重塑自動駕駛仿真:4D 場景生成技術(shù)的突破與實踐
一種基于擴散模型的視頻生成框架RoboTransfer
4種用于視頻生成的尖端AI技術(shù)
評論