91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種全新的數(shù)據(jù)蒸餾方法來(lái)加速NeRF

電子工程師 ? 來(lái)源:機(jī)器之心 ? 作者:Huan Wang ? 2022-08-08 10:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經(jīng)輻射場(chǎng) (Neural Radiance Field, or NeRF) [Mildenhall et al., ECCV, 2020] 開(kāi)啟了用神經(jīng)網(wǎng)絡(luò)表征三維場(chǎng)景的新范式。NeRF 這兩年在學(xué)術(shù)界和工業(yè)界都很火熱, 但 NeRF 一個(gè)比較大的缺點(diǎn)是, 渲染速度慢。雖然 NeRF 用的神經(jīng)網(wǎng)絡(luò) (11 層的 MLP) 本身很小, 但是渲染一個(gè)像素需要采集一條光線上的很多點(diǎn)(上百個(gè)), 這導(dǎo)致渲染一張圖的計(jì)算量非常大, 如下圖所示: 用 PyTorch 在單張 NVIDIA V100 顯卡測(cè)試, 渲染 400x400 的圖片就需要 6.7s 的時(shí)間, 這顯然不利于 NeRF 在業(yè)界落地 (例如各種 AR/VR 設(shè)備, meta universe 等)。

90536e9a-16c2-11ed-ba43-dac502259ad0.png

學(xué)術(shù)界已有不少研究工作來(lái)加速 NeRF。比較流行的一種方式是, 給定訓(xùn)練好的 NeRF, 采用更高效的數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲(chǔ), 如 Sparse Voxel Octree [Yu et al., ICCV, 2021]. 盡管加速很可觀 (如 [Yu et al., ICCV, 2021] 實(shí)現(xiàn)了 3000x 的渲染加速), 但這種數(shù)據(jù)結(jié)構(gòu)也破壞了 NeRF 作為場(chǎng)景表征存儲(chǔ)小的優(yōu)點(diǎn)。譬如, 原始 NeRF 網(wǎng)絡(luò)僅僅 2.4MB 大小就可以存儲(chǔ)一個(gè)場(chǎng)景, 而采用 Sparse Voxel Octree 則需要 1.93GB [Yu et al., ICCV, 2021], 這顯然難以在端上應(yīng)用。 因此, 如何加速 NeRF 渲染并維持其存儲(chǔ)小的優(yōu)點(diǎn) (簡(jiǎn)言之: 小且快), 仍然是當(dāng)前的研究熱點(diǎn), 也是本文的動(dòng)因。

908ec648-16c2-11ed-ba43-dac502259ad0.png

Arxiv: https://arxiv.org/abs/2203.17261

Code: https://github.com/snap-research/R2L

Webpage: https://snap-research.github.io/R2L/

核心方法 我們所提出的核心方法從整體范式上來(lái)說(shuō)非常簡(jiǎn)單: 通過(guò)數(shù)據(jù)蒸餾將神經(jīng)輻射場(chǎng) (NeRF) 轉(zhuǎn)化為神經(jīng)光場(chǎng)(Neural Light Field, or NeLF) -- 從 NeRF 到 NeLF, 所以我們把方法命名為 R2L。 NeLF 與 NeRF 一樣, 都可以作為一個(gè)場(chǎng)景的表征. 不同的是:

NeRF 的輸入是場(chǎng)景中的一個(gè)點(diǎn) (該點(diǎn)的坐標(biāo) + 該點(diǎn)所在視線的方向), 輸出是該點(diǎn)的 RGB 和不透明度。NeRF 網(wǎng)絡(luò)的輸出是中間結(jié)果, 并不是圖片上的 RGB 值. 要想得到一個(gè)像素的 RGB 值, 需要對(duì)該像素對(duì)應(yīng)光線上的很多點(diǎn)進(jìn)行積分 (即 Alpha Compositing)。

而 NeLF 的輸入是一條光線, 輸出直接是該光線對(duì)應(yīng)圖片上像素值, 不需要 Alpha Compositing 這一步。

對(duì)于 Novel View Synthesis 這個(gè)任務(wù)來(lái)說(shuō), NeLF 的優(yōu)勢(shì)很明顯: 速度快! 要得到一個(gè)像素的 RGB 只需要跑一次網(wǎng)絡(luò), 而 NeRF 則需要跑上百次。

909aa80a-16c2-11ed-ba43-dac502259ad0.png

但它的缺點(diǎn)也很明顯, 主要有兩個(gè)缺點(diǎn): (1)NeLF 網(wǎng)絡(luò)要擬合的目標(biāo)函數(shù)比 NeRF 更難。這一點(diǎn)可以這么理解: 在一張圖片上相鄰兩個(gè)像素的 RGB 可能突變 (因?yàn)檎趽?, 而相鄰兩個(gè)像素的光線方向其實(shí)差別很小, 這就意味著, 這個(gè)函數(shù)的輸入稍微變化一點(diǎn), 輸出可能劇變, 這種函數(shù)的不連續(xù)性強(qiáng), 復(fù)雜度高. 相比之下, NeRF 表達(dá)的函數(shù)是空間中的點(diǎn), 空間中的點(diǎn)由于物理世界的連續(xù)性, 相鄰位置上 RGB 劇變的可能性小, 所以函數(shù)相對(duì)簡(jiǎn)單。 (2)同樣一堆圖片, 用來(lái)訓(xùn)練 NeLF 的話, 樣本量會(huì)大幅降低. 一張圖片, 長(zhǎng)寬為 H, W, 用來(lái)訓(xùn)練 NeLF 的話樣本量就是 H*W, 而訓(xùn)練 NeRF 樣本量是 H*W*K (K 是 NeRF 中的一條光線上的采樣點(diǎn)個(gè)數(shù), 在 NeRF 原文中 K=256). 所以, 從 NeRF 到 NeLF 訓(xùn)練樣本量會(huì)變?yōu)樵瓉?lái)的 1/K, 這是很大的縮減。 神經(jīng)網(wǎng)絡(luò)有效, 通常需要有大量的訓(xùn)練數(shù)據(jù)。從 NeRF 變?yōu)?NeLF, 一方面要擬合的目標(biāo)函數(shù)變復(fù)雜了, 同時(shí)樣本量卻減小了, 無(wú)疑雪上加霜. 如何解決這些問(wèn)題呢? 為了解決上述問(wèn)題(1), 我們需要用一個(gè)更深的網(wǎng)絡(luò)來(lái)表征更復(fù)雜的函數(shù), 所以在我們的文章中提出了一個(gè) 88 層的深度殘差 MLP (deep residual MLP), 網(wǎng)絡(luò)結(jié)構(gòu)如下:

90c1ad74-16c2-11ed-ba43-dac502259ad0.png

這樣的深層網(wǎng)絡(luò)在之前 NeRF 相關(guān)的工作沒(méi)有出現(xiàn)過(guò) (之前的 NeRF 相關(guān)工作大多繼承了原始 NeRF 文章中的網(wǎng)絡(luò)結(jié)構(gòu), 小修小補(bǔ))。為了能讓它訓(xùn)練起來(lái), 我們引入了殘差結(jié)構(gòu)的設(shè)計(jì)。這一點(diǎn)跟 ResNet 的思想一樣, 本身并沒(méi)有更多的創(chuàng)新, 但把這一點(diǎn)引入到 NeRF/NeLF 中, 據(jù)我們所知, 本文是第一篇工作。殘差結(jié)構(gòu)的引入很有必要, 因?yàn)樯疃染W(wǎng)絡(luò)沒(méi)有殘差結(jié)構(gòu)基本訓(xùn)練不起來(lái), 這一點(diǎn)在文中的消融實(shí)驗(yàn)中也得到了證實(shí)。 另一個(gè)值得注意的創(chuàng)新點(diǎn)是關(guān)于如何表征一條光線。理論上說(shuō), 一條光線用一個(gè)方向向量就可以確定, 但如果真的只用方向向量去表征, 就會(huì)出現(xiàn)上面說(shuō)的 “輸入很接近, 輸出卻可能劇變” 的情況, 這就無(wú)疑會(huì)給 NeLF 網(wǎng)絡(luò)的學(xué)習(xí)帶來(lái)困難。為了使得 NeLF 網(wǎng)絡(luò)要學(xué)習(xí)的函數(shù)更容易一些, 我們需要增強(qiáng)輸入的差別. 具體來(lái)說(shuō), 我們采用一條光線上采樣的多個(gè)點(diǎn)的坐標(biāo) (如下圖所示), 將其串聯(lián)(concat) 起來(lái)成一個(gè)向量, 以此作為該光線的表征, 作為我們 NeLF 網(wǎng)絡(luò)的輸入。

90da5ebe-16c2-11ed-ba43-dac502259ad0.png

這種表征非常簡(jiǎn)單直接, 同時(shí)也很有效。在文中, 我們也展示了它比之前的 NeLF 工作中用到的其他表征 (例如 Plucker 坐標(biāo) [Sitzmann et al, NeurIPS, 2021]) 要更為有效。 為了解決上述問(wèn)題(2), 我們使用了一個(gè)預(yù)訓(xùn)練好的 NeRF 模型來(lái)產(chǎn)生大量偽數(shù)據(jù) (pseudo data)。具體來(lái)說(shuō), 當(dāng) NeRF 對(duì)一個(gè)場(chǎng)景學(xué)習(xí)完之后, 給定任意一個(gè)角度 (ray direction), NeRF 都能返回這個(gè)角度下的圖片, 我們就把這些圖片收集起來(lái), 形成了很多 (origin, direction, RGB) triplets。這些 triplets 就是訓(xùn)練我們模型的數(shù)據(jù), loss 函數(shù)是 mean squared error (MSE), 如下所示:

90e8e182-16c2-11ed-ba43-dac502259ad0.png

在我們的實(shí)驗(yàn)中, 我們收集了 10k 張圖片, 是原始數(shù)據(jù)集 (大概 100 張圖片) 的 100 倍, 這些數(shù)據(jù)確保了有充足的樣本去訓(xùn)練 NeLF。文中的消融實(shí)驗(yàn)也表明, 大量偽數(shù)據(jù)對(duì)性能至關(guān)重要 (6.9dB PSNR 提升)! 值得一提的是, 如果僅僅是用偽數(shù)據(jù)訓(xùn)練, 我們的模型最優(yōu)也只能復(fù)制 teacher NeRF, 無(wú)法超越它。為了能超越, 我們?cè)谠紙D片上再微調(diào) (Finetune) 一下模型。這個(gè)操作被證明有非常顯著的效果, 使得我們的模型可以顯著超越 teacher NeRF。 實(shí)驗(yàn)效果 總的來(lái)說(shuō), 我們的模型在 NeRF Synthetic 數(shù)據(jù)集 (圖片尺寸 400x400) 上實(shí)現(xiàn)了將近 30x 的加速, 并把 PSNR 大幅提升了 1.4dB, 比同類其他方法更加高效。

91175b0c-16c2-11ed-ba43-dac502259ad0.png

視覺(jué)效果圖對(duì)比如下, 可以看到, 相比于 NeRF, 我們的模型 (Ours-2, 即在原始數(shù)據(jù)上微調(diào)后的模型)有肉眼可見(jiàn)的提升, 且計(jì)算量?jī)H僅是 NeRF 的 1/26。

912cf0d4-16c2-11ed-ba43-dac502259ad0.png

更多結(jié)果請(qǐng)參考我們的文章。代碼已經(jīng)開(kāi)源: https://github.com/snap-research/R2L, 歡迎嘗試! 總結(jié)與未來(lái)工作 本文提出了一種全新的數(shù)據(jù)蒸餾方法來(lái)加速 NeRF: 我們使用訓(xùn)練好的 NeRF 模型產(chǎn)生偽數(shù)據(jù), 來(lái)訓(xùn)練提出的深度殘差 NeLF 網(wǎng)絡(luò)。該 NeLF 網(wǎng)絡(luò)可以達(dá)到超過(guò) NeRF 的渲染質(zhì)量, 且實(shí)現(xiàn)將近 30x 加速, 并維持了存儲(chǔ)小的優(yōu)點(diǎn)。 未來(lái)工作方向: (1) 從 NeRF 中可以得到深度信息, 目前我們還沒(méi)提供從 NeLF 網(wǎng)絡(luò)中得到深度信息的方法, 這是不錯(cuò)的探索方向。(2) 如何用更少, 更高質(zhì)量的偽數(shù)據(jù) (譬如進(jìn)行數(shù)據(jù)篩選) 來(lái)加速 NeLF 的訓(xùn)練也非常值得探索。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:ECCV 2022|Snap&東北大學(xué)提出R2L:用數(shù)據(jù)蒸餾加速NeRF

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    用于窄帶匹配高速射頻ADC的全新方法

    本期,為大家?guī)?lái)的是《用于窄帶匹配高速射頻 ADC 的全新方法》,介紹了一種用于窄帶匹配高速射頻 ADC 的全新方法,以解決高中間頻率系統(tǒng)中 ADC 前端窄帶匹配的設(shè)計(jì)難題,可在 ADC 額定帶寬內(nèi)應(yīng)用,能提升 ADC 性能、減
    的頭像 發(fā)表于 01-04 15:56 ?6376次閱讀
    用于窄帶匹配高速射頻ADC的<b class='flag-5'>全新方法</b>

    指令集測(cè)試的一種糾錯(cuò)方法

    本文描述在進(jìn)行指令集測(cè)試的一種糾錯(cuò)方法 1.打開(kāi)測(cè)試指令集對(duì)應(yīng)的dump文件 dump文件是指由匯編文件進(jìn)行反匯編之后,可以供人閱讀指令的反匯編文件。其包含了每條指令的具體操作的信息。指令集測(cè)試
    發(fā)表于 10-24 14:04

    利用e203中NICE協(xié)處理器加速濾波運(yùn)算

    和加法器的方法來(lái)加速濾波運(yùn)算。 使用NICE協(xié)處理器加速的程序?yàn)?b class='flag-5'>一個(gè)長(zhǎng)循環(huán),計(jì)算較長(zhǎng)(100到1000量級(jí))的兩個(gè)浮點(diǎn)數(shù)組乘累加的結(jié)果,分別命名為ifm (Input Feature
    發(fā)表于 10-21 13:40

    一種新的無(wú)刷直流電機(jī)反電動(dòng)勢(shì)檢測(cè)方法

    無(wú)位置傳感器無(wú)刷直流電機(jī)的控制算法是近年來(lái)研究的熱點(diǎn)之,有霍爾位置信號(hào)直流電機(jī)根據(jù)霍爾狀態(tài)來(lái)確定通斷功率器件。利用無(wú)刷直流電機(jī)的數(shù)學(xué)模型,根據(jù)反電動(dòng)勢(shì)檢測(cè)原理,提出了一種新的線反電動(dòng)勢(shì)檢測(cè)
    發(fā)表于 08-07 14:29

    一種新的無(wú)刷直流電機(jī)反電動(dòng)勢(shì)檢測(cè)方法

    無(wú)位置傳感器無(wú)刷直流電機(jī)的控制算法是近年來(lái)研究的熱點(diǎn)之,有霍爾位置信號(hào)直流電機(jī)根據(jù)霍爾狀態(tài)來(lái)確定通斷功率器件。利用無(wú)刷直流電機(jī)的數(shù)學(xué)模型,根據(jù)反電動(dòng)勢(shì)檢測(cè)原理,提出了一種新的線反電動(dòng)勢(shì)檢測(cè)
    發(fā)表于 08-04 14:59

    一種無(wú)序超均勻固體器件的網(wǎng)格優(yōu)化方法

    近日,天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實(shí)驗(yàn)室研發(fā)了一種無(wú)序超均勻固體器件的網(wǎng)格優(yōu)化方法,成果獲中國(guó)發(fā)明專利(ZL202410659505.2)授權(quán)。
    的頭像 發(fā)表于 07-28 16:10 ?967次閱讀
    <b class='flag-5'>一種</b>無(wú)序超均勻固體器件的網(wǎng)格優(yōu)化<b class='flag-5'>方法</b>

    電池?zé)峁芾恚菏褂脭?shù)字孿生和多尺度方法來(lái)設(shè)計(jì)和優(yōu)化能源效率

    理系統(tǒng)(BTMS),但同時(shí)也會(huì)增加額外的能源需求。本文介紹了一種多方面方法,不僅可用于開(kāi)發(fā)和優(yōu)化BTMS,同時(shí)還能平衡電池壽命、快速充電能力、車輛續(xù)航里程和安全性。S
    的頭像 發(fā)表于 07-23 10:50 ?789次閱讀
    電池?zé)峁芾恚菏褂脭?shù)字孿生和多尺度<b class='flag-5'>方法來(lái)</b>設(shè)計(jì)和優(yōu)化能源效率

    漢思新材料取得一種PCB板封裝膠及其制備方法的專利

    漢思新材料取得一種PCB板封裝膠及其制備方法的專利漢思新材料(深圳市漢思新材料科技有限公司)于2023年取得了項(xiàng)關(guān)于PCB板封裝膠及其制備方法的發(fā)明專利(專利號(hào):CN20231015
    的頭像 發(fā)表于 06-27 14:30 ?757次閱讀
    漢思新材料取得<b class='flag-5'>一種</b>PCB板封裝膠及其制備<b class='flag-5'>方法</b>的專利

    想在rtsmart中使用uart2,是不是只能通過(guò)修改設(shè)備樹(shù)方法來(lái)實(shí)現(xiàn)uart2的復(fù)用呀?

    我想在rtsmart中使用uart2,是不是只能通過(guò)修改設(shè)備樹(shù)方法來(lái)實(shí)現(xiàn)uart2的復(fù)用呀? 修改設(shè)備樹(shù)后如何只編譯設(shè)備樹(shù)文件? 編譯生成的文件可以直接替換到廬山派里嗎,具體替換路徑在哪里呀?
    發(fā)表于 06-24 07:04

    一種適用于動(dòng)態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

    當(dāng)前基于神經(jīng)輻射場(chǎng)(NeRF)或3D高斯?jié)姙R(3DGS)的SLAM方法在重建靜態(tài)3D場(chǎng)景方面表現(xiàn)出色,但在動(dòng)態(tài)環(huán)境中的跟蹤和重建方面卻面臨著挑戰(zhàn)。
    的頭像 發(fā)表于 06-13 10:10 ?1428次閱讀
    <b class='flag-5'>一種</b>適用于動(dòng)態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

    NVIDIA GTC巴黎亮點(diǎn):全新Cosmos Predict-2世界基礎(chǔ)模型與CARLA集成加速智能汽車訓(xùn)練

    。這種向使用大模型的過(guò)渡大大增加了對(duì)用于訓(xùn)練、測(cè)試和驗(yàn)證的高質(zhì)量、基于物理學(xué)傳感器數(shù)據(jù)的需求。 為加速代輔助駕駛架構(gòu)的開(kāi)發(fā),NVIDIA 發(fā)布了?NVIDIA Cosmos Predict-2,這是
    的頭像 發(fā)表于 06-12 10:00 ?1108次閱讀

    使用ad9467-250來(lái)采集低頻信號(hào),請(qǐng)問(wèn)有什么方法來(lái)提高sfdr嗎?

    你好,我現(xiàn)在在使用ad9467-250來(lái)采集低頻信號(hào),在測(cè)試3Mhz部分時(shí)sfdr只有86,采樣頻率是102.4Mhz,請(qǐng)問(wèn)有什么方法來(lái)提高sfdr嗎
    發(fā)表于 04-24 06:05

    如何使用NTAG213單擊次即可執(zhí)行多項(xiàng)作?

    于我的用例來(lái)說(shuō)并不理想。 我正在尋找一種方法來(lái)執(zhí)行所有這些任務(wù)(設(shè)置密碼、刪除密碼、讀取和寫入) 單擊單擊.NTAG213 可以嗎?如果沒(méi)有,是否有其他 NFC 標(biāo)簽(例如 NTAG216、NTAG424
    發(fā)表于 04-11 08:03

    一種永磁電機(jī)用轉(zhuǎn)子組件制作方法

    一種永磁電機(jī)所使用的轉(zhuǎn)子組件,是由磁鋼與芯軸組裝而成,產(chǎn)品工作轉(zhuǎn)速80 000 r /mi n,磁鋼相對(duì)于芯軸的同軸度要小于O.015 mm。現(xiàn)有的裝配方法是:先在芯軸兩端面制作中心孔,然后直接
    發(fā)表于 03-25 15:20

    PDM產(chǎn)品數(shù)據(jù)管理是什么?文詳細(xì)了解三品PDM系統(tǒng)

    在當(dāng)今競(jìng)爭(zhēng)激烈的商業(yè)環(huán)境中,企業(yè)為了提升自身的競(jìng)爭(zhēng)力,不斷尋求各種方法來(lái)優(yōu)化產(chǎn)品開(kāi)發(fā)流程、提高生產(chǎn)效率以及降低成本。PDM(產(chǎn)品數(shù)據(jù)管理)系統(tǒng)作為一種強(qiáng)大的工具,正在逐漸成為企業(yè)實(shí)現(xiàn)這些目標(biāo)的關(guān)鍵。
    的頭像 發(fā)表于 03-25 14:01 ?1009次閱讀