91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在圖像恢復(fù)中使用多個感受野會是什么效果?

電子工程師 ? 來源:Chu-Tak Li ? 作者:Chu-Tak Li ? 2021-04-28 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Chu-Tak Li

編譯:ronghuaiyang

在網(wǎng)絡(luò)結(jié)構(gòu)中使用多種感受野,并對損失函數(shù)進行了改進。

今天我們要講的另一種修復(fù)論文叫做Image inpainting via Generative Multi-column CNNs (GMCNN)。本文使用的網(wǎng)絡(luò)架構(gòu)類似于我們之前介紹的那些論文。本文的主要貢獻是對損失函數(shù)進行了若干修正。

回顧

正如我在以前的文章中提到的,如何利用圖像中其他像素所提供的信息,對提高圖像修復(fù)效果至關(guān)重要。圖像修復(fù)的一個非常直觀的意義是直接復(fù)制圖像本身中找到的最相似的圖像patch,并粘貼在缺失的區(qū)域。有趣的是,我們應(yīng)該意識到,在實踐中,對于缺失的區(qū)域沒有“正確”的答案。在現(xiàn)實中,給定一個損壞的/mask的圖像,你不可能知道原始圖像(ground truth)來進行比較。所以,我們有這么多的答案來解決缺失的區(qū)域。

介紹和動機

從以往的圖像修復(fù)論文中,我們了解到感受野野對圖像修復(fù)的重要性。對于3×3內(nèi)核,我們可以調(diào)整膨脹率來控制它的感受野。如果擴張率為1,我們的感受野為3×3。如果膨脹率是2,通過跳過一個相鄰像素,我們有一個5×5感受野,以此類推。這里,如果我們使用帶有膨脹卷積的3×3、5×5和7×7內(nèi)核會怎么樣?這在本文中被定義為一個多列結(jié)構(gòu)

在之前的文章中,尋找和缺失區(qū)域最相似的圖像patch的過程是嵌入到生成網(wǎng)絡(luò)中的,在這個工作中,該過程只是用來設(shè)計一個新的損失項用于訓(xùn)練。

由于缺少的區(qū)域沒有“正確”的答案,像素級重建精度損失項(即L1損失)似乎不適用于圖像修復(fù)。作者提出了基于缺失像素的空間位置,對L1損失項進行加權(quán)??拷行袼氐目臻g位置對于L1的損失應(yīng)該有更高的權(quán)值,因為它們對重構(gòu)有更合理的參考,反之亦然。

方案和貢獻

100063771-127840-1.png

圖1,給出了用該方法進行修復(fù)的一些結(jié)果

在我看來,本文遵循了我們之前提到的圖像修復(fù)的趨勢。首先,作者采用了擴展卷積的多分支CNN,而不是單一分支。三個不同的kernel大小被用于三個不同的分支,以實現(xiàn)不同的感受野和提取不同分辨率的特征。

其次,引入兩個新的損失項來訓(xùn)練網(wǎng)絡(luò),分別是置信度驅(qū)動的重建損失和隱多樣化馬爾可夫隨機場(ID-MRF)損失。置信度驅(qū)動的重建損失是一個加權(quán)的L1損失,而ID-MRF損失與預(yù)訓(xùn)練的VGG網(wǎng)絡(luò)計算的特征patch比較有關(guān)。

圖1顯示了本文方法的一些修復(fù)結(jié)果。你可以放大以更好地查看這些高質(zhì)量的結(jié)果。

方法

100063771-127841-2.png

圖2,提出的網(wǎng)絡(luò)架構(gòu)

圖2顯示了本文提出的生成式多列卷積神經(jīng)網(wǎng)絡(luò)(GMCNN)的網(wǎng)絡(luò)結(jié)構(gòu)。如你所見,有一個多列生成器網(wǎng)絡(luò)、兩個鑒別器(全局和局部)和一個用于計算ID-MRF損失的預(yù)訓(xùn)練VGG19。

生成網(wǎng)絡(luò)中有三列,每一列使用三種不同大小的過濾器,即3×3、5×5和7×7。、注意,這三列的輸出被連接到其他兩個卷積層以獲得完整的圖像。

ID-MRF正則化

100063771-127842-3.png

圖3,使用不同的相似性度量來搜索修復(fù)結(jié)果的最近鄰居。(a)余弦相似度的修復(fù)結(jié)果(b)提出的相對相似度的修復(fù)結(jié)果(c) Ground truth圖像(紅色矩形突出填充區(qū)域)

簡單地說,對于MRF目標(biāo),我們希望最小化生成的特征與通過預(yù)先訓(xùn)練的網(wǎng)絡(luò)計算出的ground truth中的最近鄰居特征之間的差異。在大多數(shù)以前的工作,余弦相似性測量被用來尋找最近的鄰居。然而,這種相似性度量通常對不同生成的特征塊給出相同的最近鄰,導(dǎo)致修復(fù)結(jié)果模糊,如圖3(a)所示。

為了避免使用余弦相似度度量可能導(dǎo)致完成圖像模糊,我們采用了相對距離度量,修復(fù)結(jié)果如圖3(b)所示。你可以看到,完成的圖像有更好的局部精細(xì)紋理。

我們來談?wù)勊鼈兪侨绾芜M行相對距離測量的。Y(hat)_g為缺失區(qū)域生成的內(nèi)容,Y(hat)^L_g 和 Y^L 為預(yù)訓(xùn)練網(wǎng)絡(luò)的第L層特征。對分別從Y(hat)^L_g 和 Y^L中提取的v和s特征塊,計算v與s的相對相似度:

100063771-127843-4.png

mu(. , .)是余弦相似度。r屬于Y^L, v除外。h和 epsilon是正的常數(shù)。顯然,如果v比其他特性patch更類似于s,那么RS(v, s)就會很大。你也可以考慮,如果v有兩個類似的patchs和r,那么RS(v, s)就會很小。我們鼓勵在缺失區(qū)域之外尋找類似的patches。

100063771-127844-5.png

最后,計算了在Y(hat)^L_g 和 Y^L 之間的ID-MRF損耗。

100063771-127845-6.png

其中參數(shù)max RS(bar)(v, s)表示s是v最近的鄰居,Z是一個歸一化因子。如果考慮所有生成的特征patch都接近于某一特征patch s的極端情況,則max RS(bar) (v, r)較小,因此ID-MRF損失較大。

另一方面,如果Y^L 中的每個r都有自己的最近鄰居Y(hat)^L_g,則max RS(bar) (v, r)很大,因而ID-MRF損失較小。這里,主要思想是強制/引導(dǎo)生成的特征patch有不同的最近鄰居,從而生成的feature具有更好的局部紋理。

與先前的工作一樣,作者使用預(yù)先訓(xùn)練的VGG19來計算ID-MRF損失。請注意,中間層conv3_2和conv4_2分別表示結(jié)構(gòu)特征和語義特征。

100063771-127847-7.png

作者聲稱這種損失與最近鄰搜索有關(guān),并且只在訓(xùn)練階段使用。這與在測試階段搜索最近鄰居的方法不同。

特征不變重建損失

所提出的空間變異重構(gòu)損失實際上是一個加權(quán)的L1損失。確定權(quán)值的方法有很多種,本文利用高斯濾波器對掩模進行卷積,生成加權(quán)掩模,計算加權(quán)L1損耗。加權(quán)L1損失的主要思想是,接近有效像素的像素?fù)p失比遠(yuǎn)離有效像素的像素?fù)p失受到更高的約束。因此,位于缺失區(qū)域中心的像素?fù)p失應(yīng)該有更低的L1損失權(quán)值(即更少的約束)。

對抗損失

與先前的工作類似,作者采用了改進的WGAN損失和局部和全局鑒別器。

最終的損失函數(shù)

100063771-127848-8.png

這是用于訓(xùn)練所提模型的最終的損失函數(shù)。與大多數(shù)修復(fù)論文相似,加權(quán)L1損失(第一損失項)的重要性為1。Lambda_mrf和Lambda_adv是控制局部紋理mrf正則化和對抗訓(xùn)練重要性的參數(shù)。

實驗

作者在5個公共數(shù)據(jù)集上評估了他們的方法,即Paris StreetView, Places2, ImageNet, CelebA和CelebA- hq數(shù)據(jù)集。在他們的訓(xùn)練期間,所有的圖像都被調(diào)整為256×256,最大的中心孔的大小128×128。在GPU上測試256×256和512×512大小的圖像,每個圖像大約需要49.37 ms和146.11 ms。

100063771-127850-9.png

圖4,定性比較巴黎街景(上)和ImageNet(下)。(a)輸入圖像(b)上下文編碼器(c) MSNPS (d)上下文注意(e)提出的方法。

圖4顯示了Paris StreetView和ImageNet數(shù)據(jù)集的定性比較。請放大以更清楚地看到修復(fù)結(jié)果。很明顯,本文提出的方法GMCNN給出了具有最佳視覺質(zhì)量的修復(fù)結(jié)果。

100063771-127852-10.png

表1,五個數(shù)據(jù)集的定量結(jié)果

正如我在之前的文章和本文開頭提到的,PSNR與像素級重建精度有關(guān),這可能不適用于評估圖像修復(fù)。研究人員仍然報告PSNR和SSIM供讀者參考,因為這些數(shù)值指標(biāo)是所有圖像處理任務(wù)的基礎(chǔ)。如表1所示,本文提出的方法在五個數(shù)據(jù)集上獲得了相當(dāng)甚至更好的PSNR和SSIM。

消融研究

100063771-127854-11.png

表2,巴黎街景數(shù)據(jù)集上不同網(wǎng)絡(luò)結(jié)構(gòu)的定量結(jié)果

100063771-127856-12.png

圖5,對巴黎街景數(shù)據(jù)集上不同網(wǎng)絡(luò)結(jié)構(gòu)的定性比較。(a)輸入圖像(b)單個編碼器-解碼器(c)粗到細(xì)(d) 3個分支中感受野固定的GMCNN (e)感受野不同的GMCNN

對不同網(wǎng)絡(luò)結(jié)構(gòu)在圖像修復(fù)中的性能進行了評價。在他們的實驗中,對于從粗到細(xì)的結(jié)構(gòu),沒有使用上下文注意力。對于三個分支中感受野固定的GMCNN,采用大小為5×5的過濾器。對于具有不同感受野的GMCNN,三個分支分別使用了3×3、5×5和7×7的kernel。定量和定性結(jié)果分別見表2和圖5。顯然,具有不同感受野的GMCNN提供了最好的修復(fù)效果。

除了網(wǎng)絡(luò)結(jié)構(gòu)的選擇和多重感受野的使用,作者還研究了兩個提出的損失項的有效性,即信心驅(qū)動重建損失和ID-MRF損失。

100063771-127859-13.png

圖6,對Paris StreetView數(shù)據(jù)集上不同重建損失的定性比較。(a)輸入圖像(b)空間折現(xiàn)損失(c)提出的置信驅(qū)動重建損失

圖6顯示了不同重建損失的視覺對比,即空間折現(xiàn)損失和提出的置信度驅(qū)動重建損失。請注意,空間折現(xiàn)損失根據(jù)像素的空間位置獲得權(quán)重掩碼,而提出的置信驅(qū)動重建損失通過將掩碼圖像與高斯濾波器進行多次卷積獲得權(quán)重掩碼。兩位作者聲稱,由置信度驅(qū)動的重建損失效果更好。從我自己的經(jīng)驗來看,這兩種重建損失是相似的。也許你可以試一試。

100063771-127939-14.png

表3,在Paris StreetView數(shù)據(jù)集上使用不同的lambda_mrf的定量結(jié)果

100063771-127940-15.png

圖7,在Paris StreetView數(shù)據(jù)集上使用ID-MRF損失與否的定性比較 (a) 輸入圖像(b)使用ID-MRF損失的修復(fù)結(jié)果(c)沒有使用ID-MRF損失的修復(fù)結(jié)果

100063771-127941-16.png

圖8,在Paris StreetView數(shù)據(jù)集上使用ID-MRF loss與不同的lambda_mrf進行定性比較。(a) Input image (b) lambda_mrf = 2 (c) lambda_mrf = 0.2 (d) lambda_mrf = 0.02 (e) lambda_mrf = 0.002

更重要的是,ID-MRF損失項是本文最強調(diào)的。因此,作者表明了這一失項的重要性,定量結(jié)果列在表3中。圖7顯示了使用ID-MRF損失和不使用ID-MRF損失訓(xùn)練的模型之間的區(qū)別。我們可以看到,使用ID-MRF可以增強生成像素的局部細(xì)節(jié)。此外,圖8顯示了使用不同的lambda_mrf來控制ID-MRF損失的重要性的效果。你可以放大以便更好地查看結(jié)果。我個人認(rèn)為,修復(fù)的結(jié)果是相似的。從表3可以看出,lambda_mrf = 0.02提供了PSNR和視覺質(zhì)量之間的良好平衡。

總結(jié)

綜上所述,本文的創(chuàng)新之處在于使用ID-MRF損失項來進一步增強生成內(nèi)容的局部細(xì)節(jié)。這種損失的主要思想是引導(dǎo)生成的特征patch在缺失區(qū)域之外尋找最近的鄰居作為參考,并且最近的鄰居應(yīng)該是多樣化的,這樣可以模擬更多的局部細(xì)節(jié)。

多重感受野(多列或多分支)的使用是由于感受野的大小對圖像修復(fù)任務(wù)很重要。由于局部相鄰像素缺失,我們必須借用遙遠(yuǎn)空間位置的信息來填補缺失的像素。如果你看過我之前的文章,我想這個想法對你來說并不難理解。

使用加權(quán)L1損失也是由于缺少區(qū)域沒有“正確”答案的事實。對于那些更接近缺失區(qū)域邊界的缺失像素,它們相對受到接近有效像素的約束,因此需要對L1的損失賦予更高的權(quán)值。另一方面,對于位于缺失區(qū)域中心的缺失像素,它們的L1約束應(yīng)該更小。

要點

參考我在上面的結(jié)論,我希望你能理解提出的ID-MRF損失的意義,因為這是本文的核心思想。對于本文的其他兩個思路,即多列結(jié)構(gòu)和加權(quán)L1損失。事實上,如果你關(guān)注過我之前的文章,我認(rèn)為你可以很好地理解背后的原因。我認(rèn)為多重/多種感受野的概念是深層語義修復(fù)的常見做法。

對于加權(quán)的L1損失,從我個人的經(jīng)驗來看,我不認(rèn)為它會對修復(fù)性能帶來明顯的改善。當(dāng)然,實現(xiàn)加權(quán)L1損失的方法有很多。如果你對此感興趣,可以試一試。

英文原文:https://towardsdatascience.com/what-if-multiple-receptive-fields-are-used-for-image-inpainting-ea44003ea7e9

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42336
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8266

    瀏覽量

    94873
  • 卷積
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    19012
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    355

    瀏覽量

    23429
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    莓平臺關(guān)鍵詞商品搜索API接口使用指南

    ? 電商平臺開發(fā)中,API接口是實現(xiàn)高效商品搜索的關(guān)鍵。莓平臺(假設(shè)為一個虛構(gòu)的電商平臺)提供了關(guān)鍵詞商品搜索API,允許開發(fā)者通過HTTP請求快速檢索商品信息。本技術(shù)帖將逐步介紹該API
    的頭像 發(fā)表于 02-04 16:48 ?520次閱讀
    <b class='flag-5'>野</b>莓平臺關(guān)鍵詞商品搜索API接口使用指南

    調(diào)用莓平臺商品詳情API接口實踐

    ? ?電商平臺的技術(shù)棧中,商品詳情信息的獲取是高頻且核心的操作。莓平臺提供了穩(wěn)定、高效的API接口供開發(fā)者查詢商品詳情數(shù)據(jù)。本文將詳細(xì)介紹如何調(diào)用莓平臺的商品詳情API接口,包括接口概述、認(rèn)證
    的頭像 發(fā)表于 02-04 16:42 ?532次閱讀
    調(diào)用<b class='flag-5'>野</b>莓平臺商品詳情API接口實踐

    東芝推出縮小圖像型CCD線性圖像傳感器TCD2400DG

    東芝電子元件及存儲裝置株式會社(“東芝”)宣布,推出一款專為視覺檢測中使用的線陣相機[1]開發(fā)的縮小圖像型[2]CCD[3]線性圖像傳感器——“TCD2400DG”。該產(chǎn)品于近日起開始支持批量出貨。
    的頭像 發(fā)表于 01-09 16:37 ?1172次閱讀
    東芝推出縮小<b class='flag-5'>圖像</b>型CCD線性<b class='flag-5'>圖像</b>傳感器TCD2400DG

    索尼FCB-EV7520與USB編碼板CM2001U重塑醫(yī)療術(shù)攝像新生態(tài)

    醫(yī)療技術(shù)飛速發(fā)展的今天,術(shù)攝像系統(tǒng)已成為現(xiàn)代手術(shù)室不可或缺的核心設(shè)備之一。它不僅是手術(shù)過程實時記錄、遠(yuǎn)程會診協(xié)作的重要載體,更直接關(guān)系到手術(shù)精準(zhǔn)度提升與醫(yī)療質(zhì)量保障。索尼FCB-EV7520高清
    的頭像 發(fā)表于 12-17 16:31 ?244次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EqualLogic存儲上raid5磁盤陣列數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境&故障: 某品牌EqualLogic PS6100存儲陣列上有一組由16塊硬盤組建的raid5磁盤陣列。磁盤陣列上層劃分多個大小不同的卷,存放虛擬機文件。 硬盤出現(xiàn)故障導(dǎo)致存儲陣列不可用,需要恢復(fù)存儲陣
    的頭像 發(fā)表于 10-21 15:04 ?344次閱讀

    數(shù)字化手術(shù)室遙控版術(shù)攝像機

    術(shù)攝像機遙控版均都支持無線遙控,可以同時采用有線和無線的控制方式,圖像輸出方面,可以選擇HD-SDI+3G-SDI或者4K HDMI或者6G-SDI+4K HDMI等解決方案。
    的頭像 發(fā)表于 07-17 15:25 ?594次閱讀

    PFC和逆變電路中使用MDD快恢復(fù)整流器:如何優(yōu)化效率與EMI?

    高頻電源設(shè)計與能量轉(zhuǎn)換系統(tǒng)中,功率因數(shù)校正電路和逆變電路是提升系統(tǒng)性能與能效的關(guān)鍵單元。隨著系統(tǒng)開關(guān)頻率日益提高,傳統(tǒng)整流器件的性能瓶頸逐漸暴露出來,特別是反向恢復(fù)時間長、電磁干擾(EMI)嚴(yán)重
    的頭像 發(fā)表于 06-23 10:05 ?747次閱讀
    <b class='flag-5'>在</b>PFC和逆變電路<b class='flag-5'>中使</b>用MDD快<b class='flag-5'>恢復(fù)</b>整流器:如何優(yōu)化效率與EMI?

    FX3為什么無法Windows中使用Gstreamer?

    我正在開發(fā) FX3,我可以 Linux 和 Windows 中使用 y8 格式的 ffmpeg 流式傳輸相機, Linux 中使用 y8 格式的 Gstreamer,但我無法
    發(fā)表于 05-29 06:59

    廣汽日與廣汽能源簽署戰(zhàn)略合作協(xié)議

    近日,廣汽日汽車有限公司(以下簡稱“廣汽日”)與廣汽能源科技有限公司(以下簡稱“廣汽能源”)廣州簽署戰(zhàn)略合作協(xié)議,并共同發(fā)布廣汽商用車能源戰(zhàn)略規(guī)劃,雙方將圍繞廣汽商用車能源生態(tài)建設(shè)展開深度合作
    的頭像 發(fā)表于 04-14 10:31 ?875次閱讀

    如何實現(xiàn)MC33774ICSimulink環(huán)境中使用基于模型的設(shè)計?

    我想熟悉如何實現(xiàn)MC33774IC Simulink 環(huán)境中使用基于模型的設(shè)計。 盡管 MATLAB 提供了一些示例文件,但它們似乎是最終版本。要更深入地了解如何配置MC33774,我正在尋找一個教程,該教程解釋了如何從頭開始
    發(fā)表于 04-10 08:05

    為什么S32G中使用32個GPIO進行啟動配置?

    我很好奇為什么 S32G 中使用 32 個 GPIO 進行啟動配置。 是否必須使用所有 32 個 GPIO 進行引導(dǎo)模式配置? 要使用分配給引導(dǎo)配置的 GPIO,是否需要額外的開關(guān)?
    發(fā)表于 04-10 06:48

    MDD超快恢復(fù)二極管的耐壓與電流選型:如何確??煽啃??

    高頻開關(guān)電源、功率變換器和新能源應(yīng)用中,超快恢復(fù)二極管因其短反向恢復(fù)時間(trr)和低開關(guān)損耗而被廣泛采用。然而,選擇MDD超快恢復(fù)二極
    的頭像 發(fā)表于 04-09 10:21 ?1055次閱讀
    MDD超快<b class='flag-5'>恢復(fù)</b>二極管的耐壓與電流選型:如何確??煽啃??

    廣汽日與因湃簽署戰(zhàn)略合作協(xié)議

    近日,廣汽日汽車有限公司(以下簡稱“廣汽日”)與因湃電池科技有限公司(以下簡稱“因湃”)廣州正式簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 04-01 14:22 ?916次閱讀
    廣汽日<b class='flag-5'>野</b>與因湃簽署戰(zhàn)略合作協(xié)議

    MDD快恢復(fù)二極管開關(guān)電源中的應(yīng)用:如何提高轉(zhuǎn)換效率?

    開關(guān)電源(SMPS)是現(xiàn)代電子設(shè)備中不可或缺的供電方式,其核心特點是高效能、體積小、重量輕。高頻工作的開關(guān)電源中,整流二極管的反向恢復(fù)特性直接影響能量損耗和轉(zhuǎn)換效率。相比普通整流二極管,快恢復(fù)
    的頭像 發(fā)表于 03-25 09:39 ?1042次閱讀
    MDD快<b class='flag-5'>恢復(fù)</b>二極管<b class='flag-5'>在</b>開關(guān)電源中的應(yīng)用:如何提高轉(zhuǎn)換效率?

    異形拼接處理器可以實現(xiàn)的效果

    組合,創(chuàng)造出獨特的視覺效果。 2、自由拼接模式:用戶可以根據(jù)實際需求,自由選擇拼接模式,如自由拼接、曲線拼接、弧形拼接等,以滿足特殊應(yīng)用場景的需求。 二、高質(zhì)量圖像展示 1、高精度圖像校正:通過內(nèi)置的
    的頭像 發(fā)表于 03-21 12:39 ?684次閱讀
    異形拼接處理器可以實現(xiàn)的<b class='flag-5'>效果</b>