Single-View View Synthesis with Multiplane Images

最近在視圖合成方面的一系列工作使用深度學(xué)習(xí)來生成多平面圖像——一種以相機(jī)為中心的分層 3D 表示——給定兩個(gè)或多個(gè)已知視點(diǎn)的輸入圖像。我們將此表示應(yīng)用于單視圖視圖合成,這是一個(gè)更具挑戰(zhàn)性但可能具有更廣泛應(yīng)用的問題。我們的方法直接從單個(gè)圖像輸入中學(xué)習(xí)預(yù)測多平面圖像,并且我們引入了用于監(jiān)督的尺度不變視圖合成,使我們能夠在在線視頻上進(jìn)行訓(xùn)練。我們展示了這種方法適用于幾個(gè)不同的數(shù)據(jù)集,它還生成了合理的深度圖,并且它學(xué)會(huì)了在背景層中填充前景對象邊緣后面的內(nèi)容。
ASSET: Autoregressive Semantic Scene Editing with Transformers atHigh Resolutions

我們提出了資產(chǎn),一種神經(jīng)架構(gòu),用于根據(jù)用戶對其語義分割圖的編輯自動(dòng)修改輸入的高分辨率圖像。我們的架構(gòu)基于具有新穎注意力機(jī)制的轉(zhuǎn)換器。我們的關(guān)鍵思想是在高分辨率下稀疏變換器的注意力矩陣,由在較低圖像分辨率下提取的密集注意力引導(dǎo)。雖然以前的注意力機(jī)制在處理高分辨率圖像時(shí)計(jì)算成本太高,或者在阻礙遠(yuǎn)程交互的特定圖像區(qū)域內(nèi)受到過度限制,但我們新的注意力機(jī)制在計(jì)算上既高效又有效。我們的稀疏注意力機(jī)制能夠捕捉遠(yuǎn)程交互和上下文,從而合成場景中有趣的現(xiàn)象,例如景觀到水面上的反射或與景觀的其余部分一致的論壇,這些是以前的卷積網(wǎng)絡(luò)無法可靠生成的和變壓器方法。我們提供定性和定量結(jié)果,以及用戶研究,證明我們方法的有效性。
我們的代碼和數(shù)據(jù)集可在我們的項(xiàng)目頁面上找到:https://github.com/DifanLiu/ASSET
審核編輯 :李倩
-
圖像
+關(guān)注
關(guān)注
2文章
1096瀏覽量
42362 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5600瀏覽量
124475
原文標(biāo)題:2022 siggrqph:圖像和視頻生成(2)
文章出處:【微信號:計(jì)算機(jī)視覺芯片設(shè)計(jì),微信公眾號:計(jì)算機(jī)視覺芯片設(shè)計(jì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
多通道兼容圖像采集卡:一機(jī)搞定多路圖像信號處理
MAX20361:小型單/多電池太陽能收集器的卓越之選
超景深顯微鏡在材料學(xué)中的應(yīng)用
應(yīng)用多光譜數(shù)字圖像區(qū)分苗期作物與雜草的研究進(jìn)展
電線是多芯的好還是單芯的好
平面以太網(wǎng)配線架的優(yōu)點(diǎn)有哪些
電壓放大器驅(qū)動(dòng)合成射流的渦結(jié)構(gòu)演化與摻混增強(qiáng)機(jī)制研究
TechWiz LCD 3D應(yīng)用:FFS仿真
VirtualLab Fusion:平面透鏡|從光滑表面到菲涅爾、衍射和超透鏡的演變
多層板設(shè)計(jì)經(jīng)驗(yàn)談:地平面布局易錯(cuò)點(diǎn)解析
瓶蓋檢測方案:從微米級測量到360° 無死角
集成電路版圖設(shè)計(jì)的基本概念和關(guān)鍵步驟
安森美Hyperlux ID系列深度傳感器技術(shù)介紹
多平面圖像的單視圖合成
評論