91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

<button id="ygy4o"></button>

<code id="ygy4o"></code>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評(píng)論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費(fèi)

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會(huì)員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動(dòng)

完善資料讓更多小伙伴認(rèn)識(shí)你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

CVPR 2018 上10篇最酷論文，渴望進(jìn)步的人都在看

▌前言

作為計(jì)算機(jī)視覺領(lǐng)域的頂級(jí)會(huì)議，2018年的計(jì)算機(jī)視覺和模式識(shí)別會(huì)議(CVPR) 上周在美國鹽湖城舉行。今年的 CVPR共收到3300份來稿并接收了其中的979份。超過6500人參加了今年的會(huì)議，這間容納6500人的房間座無虛席，堪稱是一屆史詩般的盛會(huì)：

每年的 CVPR都會(huì)吸引眾多優(yōu)秀的人才和他們最新的研究成果，總可以看到學(xué)到新的東西。當(dāng)然還有那些發(fā)表了最新并具有突破性成果的論文，為該領(lǐng)域帶來很棒的新知識(shí)。這些論文經(jīng)常在計(jì)算機(jī)視覺的許多子領(lǐng)域形成最新的技術(shù)。

最近，我們看到了一些開箱即用且富有創(chuàng)意的論文！隨著最近深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的突破性進(jìn)展，我們?nèi)匀辉谔剿鞑l(fā)現(xiàn)一切未知的可能性。許多論文展示了深度神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域中的全新應(yīng)用。它們可能不是最根本的開創(chuàng)性作品，但就它們從新穎有趣的角度呈現(xiàn)出全新的想法，為相關(guān)領(lǐng)域提供了創(chuàng)造性和啟發(fā)性的視角。總而言之，這些都是非?？岬淖髌罚?/p>

在這里，我將展示我認(rèn)為在本屆 CVPR上最酷的10篇論文。我們將看到最近使用深度網(wǎng)絡(luò)實(shí)現(xiàn)的一些新應(yīng)用，以及如何進(jìn)一步使用它們。你可以在閱讀過程中根據(jù)自己的喜好選擇性地進(jìn)行閱讀。讓我們開始吧！

▌Training Deep Networks with Synthetic Data: Bridging the Reality Gap by Domain Randomization(用合成數(shù)據(jù)訓(xùn)練深度網(wǎng)絡(luò)：通過領(lǐng)域隨機(jī)化來彌合現(xiàn)實(shí)差距)

這篇論文出自Nvidia團(tuán)隊(duì)的研究，使用合成數(shù)據(jù)來訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)。他們?yōu)樘摶靡?Unreal Engine 4) 創(chuàng)建了一個(gè)插件用于生成合成的訓(xùn)練數(shù)據(jù)。這項(xiàng)研究的關(guān)鍵在于他們對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行了隨機(jī)化，使其能夠包含多種變量，包括：

目標(biāo)的數(shù)量和類型

干擾物的數(shù)量，類型，顏色和尺度

感興趣物體的紋理特征及圖片的背景

虛擬攝像機(jī)相對(duì)于場景的位置

相機(jī)相對(duì)于場景的角度

光點(diǎn)的數(shù)量和位置

他們展示了一些非常有前途的實(shí)驗(yàn)結(jié)果，證明了合成數(shù)據(jù)預(yù)訓(xùn)練的有效性，這是先前研究從未實(shí)現(xiàn)過的結(jié)果。如果你之前并不了解這個(gè)重要知識(shí)的話，那么這項(xiàng)研究將會(huì)啟發(fā)你如何生成并使用合成數(shù)據(jù)。

▌WESPE: Weakly Supervised Photo Enhancer for Digital?Cameras(WESPE：用于數(shù)碼相機(jī)的弱監(jiān)督照片增強(qiáng)器)

這項(xiàng)研究通過訓(xùn)練生成對(duì)抗網(wǎng)絡(luò)(GAN) 來從美學(xué)上自動(dòng)化增強(qiáng)圖片。該研究最酷的地方在于以一種弱監(jiān)督的方式：你不需要輸入-輸出的圖像對(duì)。訓(xùn)練網(wǎng)絡(luò)時(shí)，你只需要一組“好看”的圖像(用于輸出基礎(chǔ)事實(shí)) 和一組想要增強(qiáng)的“不好看”的圖像(用于輸入圖像)。然后，通過訓(xùn)練GAN產(chǎn)生輸入圖像的增強(qiáng)版本，通常所生成的圖像會(huì)極大地增強(qiáng)原圖像的顏色和對(duì)比度。

由于不需要精確的圖像對(duì)，因而你能夠快捷方便地使用這個(gè)圖像增強(qiáng)器。我喜歡這項(xiàng)研究的原因主要是因?yàn)樗且环N弱監(jiān)督的方法。雖然我們離無監(jiān)督學(xué)習(xí)似乎還很遙遠(yuǎn)，但對(duì)計(jì)算機(jī)視覺的許多子領(lǐng)域而言，弱監(jiān)督學(xué)習(xí)似乎是一個(gè)充滿希望且值得研究的方向。

▌Efficient Interactive Annotation of Segmentation Datasets with Polygon-RNN++(用Polygon-RNN ++對(duì)圖像分割數(shù)據(jù)集進(jìn)行高效地交互式標(biāo)注)

深度神經(jīng)網(wǎng)絡(luò)之所以能夠表現(xiàn)出如此強(qiáng)大性能的主要原因之一是大型且完全帶標(biāo)注的可用的數(shù)據(jù)集。然而，對(duì)于許多計(jì)算機(jī)視覺任務(wù)而言，這樣的數(shù)據(jù)既費(fèi)時(shí)又昂貴。特別對(duì)于圖像分割任務(wù)而言，我們需要對(duì)圖像中的每個(gè)像素進(jìn)行類別標(biāo)注，你可以想象其中的困難性有多大！

Polygon-RNN ++這項(xiàng)研究允許研究者只需在圖像中每個(gè)目標(biāo)周圍設(shè)置粗糙的多邊形點(diǎn)，然后該網(wǎng)絡(luò)能夠自動(dòng)生成圖像分割所需的標(biāo)注信息！本文研究表明這種方法能夠在實(shí)際應(yīng)用中很好地推廣，并可以用來為分段任務(wù)創(chuàng)建快速簡便的數(shù)據(jù)標(biāo)注！

▌Creating Capsule Wardrobes from Fashion?Images

(從時(shí)尚配圖中創(chuàng)造自己的衣柜)

“嗯，我今天應(yīng)該穿什么？”如果有人能夠每天早上為你解決這個(gè)問題，那將再好不過了。

本文研究中，作者設(shè)計(jì)了一種模型，基于給定的候選服裝和配件清單，模型通過收集一組最小的項(xiàng)目集，提供最全面的服裝混合搭配的方案。研究中模型使用目標(biāo)函數(shù)進(jìn)行訓(xùn)練，這些目標(biāo)函數(shù)旨在捕獲視覺兼容性，多功能性及特定用戶的偏好等關(guān)鍵要素。有了這種衣柜 (Capsule Wardrobes)，你可以輕松從衣櫥中挑選最佳的服裝搭配。

▌Super SloMo: High Quality Estimation of Multiple Intermediate Frames for Video Interpolation (Super SloMo：視頻插值中多個(gè)中間幀的高質(zhì)量估計(jì))

你曾經(jīng)是否想過以超慢的動(dòng)作拍攝超級(jí)酷炫的東西呢？Nvdia的這項(xiàng)研究 Super SloMo就能幫你實(shí)現(xiàn)！研究中他們使用 CNN估計(jì)視頻的中間幀，并能將標(biāo)準(zhǔn)的30fps視頻轉(zhuǎn)換為240fps的慢動(dòng)作！該模型估計(jì)視頻中間幀之間的光流信息，并在這些信息中間插入視頻幀，使慢動(dòng)作的視頻看起來也能清晰銳利。

▌Who Let The Dogs Out? Modeling Dog Behavior From Visual?Data(用視覺數(shù)據(jù)構(gòu)建狗的行為模型)

這可能是有史以來最酷的研究論文！這項(xiàng)研究的想法是試圖模擬狗的思想和行為。研究人員將許多傳感器連接到狗的四肢以收集其運(yùn)動(dòng)和行為數(shù)據(jù);。此外，他們還在狗的頭部安裝一個(gè)攝像頭，以便從狗的視角獲取相應(yīng)的運(yùn)動(dòng)信息。然后，將一組CNN特征提取器用于從視頻幀獲取圖像特征，并將其與傳感器數(shù)據(jù)一起傳遞給一組LSTM模型，以便學(xué)習(xí)并預(yù)測狗的動(dòng)作和行為。這是一項(xiàng)非常新穎而富有創(chuàng)造性的應(yīng)用研究，其整體的任務(wù)框架及獨(dú)特的執(zhí)行方式都是本文的亮點(diǎn)！希望這項(xiàng)研究能夠?yàn)槲覀兾磥硎占瘮?shù)據(jù)和應(yīng)用深度學(xué)習(xí)技術(shù)的方式帶來更多的創(chuàng)造力。

▌Learning to Segment Every?Thing(學(xué)習(xí)分割一切)

在過去的幾年里，何凱明團(tuán)隊(duì) (以前在微軟研究院，現(xiàn)就職于 Facebook AI Research) 提出了許多重大的計(jì)算機(jī)視覺研究成果。他們的研究最棒之處在于將創(chuàng)造力和簡單性相結(jié)合，諸如將 ResNets和Mask R-CNN相結(jié)合的研究，這些都不是最瘋狂或最復(fù)雜的研究思路，但是它們簡單易行，并在實(shí)踐中非常有效。

該團(tuán)隊(duì)最新的研究 Learning to Segment Every Thing是 Mask R-CNN研究的擴(kuò)展，它使模型準(zhǔn)確地分割訓(xùn)練期間未出現(xiàn)的類別目標(biāo)！這對(duì)于獲取快速且廉價(jià)的分割數(shù)據(jù)標(biāo)注是非常有用的。事實(shí)上，該研究能夠獲得一些未知目標(biāo)的基準(zhǔn)分割效果(baseline segment)，這對(duì)于在自然條件中部署這樣的分割模型來說是至關(guān)重要的，因?yàn)樵谶@樣的環(huán)境下可能存在許多未知的目標(biāo)?？偟膩碚f，這絕對(duì)是我們思考如何充分利用深層神經(jīng)網(wǎng)絡(luò)模型的正確方向。

▌Soccer on Your?Tabletop(桌上足球)

本文的研究是在FIFA世界杯開幕時(shí)正式發(fā)表的，理應(yīng)獲得最佳時(shí)機(jī)獎(jiǎng)！這的確是CVPR上在計(jì)算機(jī)視覺領(lǐng)域的“更酷”應(yīng)用之一。簡而言之，作者訓(xùn)練了一個(gè)模型，在給定足球比賽視頻的情況下，該模型能夠輸出相應(yīng)視頻的動(dòng)態(tài)3D重建，這意味著你可以利用增強(qiáng)現(xiàn)實(shí)技術(shù)在任何地方查看它！

本文最大的亮點(diǎn)是結(jié)合使用許多不同類型的信息。使用視頻比賽數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)，從而相當(dāng)容易地提取3D網(wǎng)格信息。在測試時(shí)，提取運(yùn)動(dòng)員的邊界框，姿勢及跨越多個(gè)幀的運(yùn)動(dòng)軌跡以便分割運(yùn)動(dòng)員。接著你可以輕松地將這些3D片段投射到任何平面上。在這種情況下，你可以通過制作虛擬的足球場，以便在 AR條件下觀看的足球比賽！在我看來，這是一種使用合成數(shù)據(jù)進(jìn)行訓(xùn)練的方法。無論如何它都是一個(gè)有趣的應(yīng)用程序！

▌LayoutNet: Reconstructing the 3D Room Layout from a Single RGBImage(LayoutNet：從單個(gè)RGB圖像重建3D房間布局)

這是一個(gè)計(jì)算機(jī)視覺的應(yīng)用程序，我們可能曾經(jīng)想過：使用相機(jī)拍攝某些東西，然后用數(shù)字3D技術(shù)重建它。這也正是本文研究的目的，特別是重建 3D房間布局。研究人員使用全景圖像作為網(wǎng)絡(luò)的輸入，以獲得房間的完整視圖。網(wǎng)絡(luò)的輸出是3D重建后的房間布局，具有相當(dāng)高的準(zhǔn)確性！該模型足夠強(qiáng)大，可以推廣到不同形狀、包含許多不同家具的房間。這是一個(gè)有趣而好玩、又不需要投入太多研究人員就能實(shí)現(xiàn)的應(yīng)用程序。

▌Learning Transferable Architectures for Scalable Image Recognition (學(xué)習(xí)可遷移的結(jié)構(gòu)用于可擴(kuò)展的圖像識(shí)別任務(wù))

最后要介紹的是一項(xiàng)許多人都認(rèn)為是深度學(xué)習(xí)未來的研究：神經(jīng)架構(gòu)搜索(NAS)。NAS背后的基本思想是我們可以使用另一個(gè)網(wǎng)絡(luò)來“搜索”最佳的模型結(jié)構(gòu)，而不需要手動(dòng)地設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)。結(jié)構(gòu)搜索過程是基于獎(jiǎng)勵(lì)函數(shù)進(jìn)行的，通過獎(jiǎng)勵(lì)模型以使其在驗(yàn)證數(shù)據(jù)集上有良好的表現(xiàn)。此外，作者在論文中表明，這種模型結(jié)構(gòu)比起手動(dòng)設(shè)計(jì)的模型能夠獲得更高的精度。這將是未來巨大的研究方向，特別是對(duì)于設(shè)計(jì)特定的應(yīng)用程序而言。因?yàn)槲覀冋嬲P(guān)注的是設(shè)計(jì)好的NAS算法，而不是為我們特定的應(yīng)用設(shè)計(jì)特定的網(wǎng)絡(luò)。精心設(shè)計(jì)的NAS算法將足夠靈活，并能夠?yàn)槿魏稳蝿?wù)找到良好的網(wǎng)絡(luò)結(jié)構(gòu)。

▌結(jié)束語

希望你能從中學(xué)到一些新的、有用的東西，甚至能夠?yàn)槟阕约旱难芯颗c工作找到一些新的想法！

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

3D

3D

+關(guān)注

關(guān)注
9

文章
3013

瀏覽量
115205
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5599

瀏覽量
124457
cnn

cnn

+關(guān)注

關(guān)注
3

文章
355

瀏覽量
23455

原文標(biāo)題：CVPR 2018 上10篇最酷論文，圈兒里最Cool的人都在看

文章出處：【微信號(hào)：AI_Thinker，微信公眾號(hào)：人工智能頭條】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設(shè)計(jì)技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動(dòng)

處理器/DSP

EDA/IC設(shè)計(jì)

存儲(chǔ)技術(shù)

光電顯示

EMC/EMI設(shè)計(jì)

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實(shí)

可穿戴設(shè)備

機(jī)器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動(dòng)通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計(jì)資源

設(shè)計(jì)技術(shù)

電子百科

電子視頻

元器件知識(shí)

工具箱

VIP會(huì)員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評(píng)測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

媒體服務(wù)

網(wǎng)站廣告

在線研討會(huì)

活動(dòng)策劃

新聞發(fā)布

新品發(fā)布

小測驗(yàn)

設(shè)計(jì)大賽

電子發(fā)燒友

關(guān)于我們

聯(lián)系我們

舉報(bào)投訴

社交網(wǎng)絡(luò)

微博

移動(dòng)端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

版權(quán)所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號(hào)聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023036445號(hào)-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级
国产操人视频在线|亚洲欧美第一区第二区在线视频观看|日本A片在线看一级无码片|sese国产sy导航|久久国产老熟女按摩AV|久久无码最新视频|免费靥色AV在线青草热|亚洲AV无码乱码一区二三区|成人免费在线A片|一级片在线免费天天久久 97亚洲国产怡红啊AV|a片大全免费在线观看|在线能看的黄色视频网站|日韩精品国模成人午夜福利|AV毛片在线看三级片黄片免费|日韩成人av在线观看|日本不卡小说欧美一区大毛片|超碰人妻AV在线|日韩精妻视频美日韩性爱|手机看片日韩一区二区图片一区中文字幕亚洲|国产在线一区二区三区有字幕|黄色影片无码五月亭AV|日韩一级久久视频|人人爱人人操人人爱|亚洲av激情电影|日韩一区二区三区制服师生中出|动漫五码中文字幕|日韩人妻精品中文字幕专区不卡|成人伦理Av一级一级a片