91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)的StyleGAN僅需小樣本就可以做到圖像到圖像的轉(zhuǎn)換!

DPVg_AI_era ? 來源:lq ? 2019-05-11 09:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前一陣子英偉達(dá)的StyleGAN可謂是火了一把,近日又出大招了!以往圖像到圖像轉(zhuǎn)換需要大量的圖像做訓(xùn)練樣本,但是在英偉達(dá)的這項(xiàng)工作中,僅需小樣本就可以做到圖像到圖像的轉(zhuǎn)換(代碼已開源)!

小樣本,大成就!

當(dāng)我們看到一只站著的老虎時,我們很容易想象出來它躺著的樣子。

這是因?yàn)槲覀兏鶕?jù)其它動物平躺的姿勢就是可以做聯(lián)想。

然而,對于機(jī)器來說就沒有這么簡單了。在現(xiàn)存的非監(jiān)督圖像到圖像轉(zhuǎn)換模型需要大量的訓(xùn)練圖像。

不僅如此,一個模型能夠轉(zhuǎn)換圖像的另一個前提是圖像中的對象必須在訓(xùn)練集中存在。

近期,英偉達(dá)、康納爾大學(xué)和阿爾托大學(xué)聯(lián)合發(fā)表了一篇文章——小樣本(few-shot)非監(jiān)督圖像到圖像轉(zhuǎn)換。

論文地址:

https://arxiv.org/pdf/1905.01723.pdf

簡單來說,就是輸入一只金毛,在訓(xùn)練過程當(dāng)中,即便第一次看到一種新動物,也能讓它像金毛那樣吐舌頭、閉嘴巴、歪頭。

若是輸入一張炒面的圖,該模型也可以讓其它食物變成炒面。

這項(xiàng)工作還提供了在線測試,新智元小編們便拿自家的貓主子“西瓜”和“多比”做了一下測試:

輸入“西瓜”得到的結(jié)果

輸入“多比”得到的結(jié)果

在線測試連接如下,讀者們快快玩起來吧:

https://nvlabs.github.io/FUNIT/petswap.html

該項(xiàng)目的代碼也已開源,地址如下:

https://github.com/NVlabs/FUNIT

FUNIT:2階段圖像轉(zhuǎn)換,非常有趣!

我們提出的FUNIT框架旨在通過利用在測試時可用的幾個目標(biāo)類圖像,將源類的圖像映射到目標(biāo)類的類似圖像。

為了訓(xùn)練FUNIT,我們使用來自一組對象類(例如各種動物物種的圖像)中的圖像,稱為源類(source classes)。我們不假設(shè)任何兩個類之間存在配對的圖像(即,不同物種的任何兩個動物都不會是完全相同的姿勢)。

我們使用源類里的圖像來訓(xùn)練一個multi-class無監(jiān)督圖像到圖像轉(zhuǎn)換模型。

在測試過程中,我們從一個稱為目標(biāo)類(target class)的新對象類中提供少量幾張圖像。模型必須利用少量的目標(biāo)圖像來將源類里的任何圖像轉(zhuǎn)換為目標(biāo)類里的類似圖像。

圖1

訓(xùn)練。訓(xùn)練集由各種對象類(源類)的圖像組成。我們訓(xùn)練了一個模型在這些源對象類之間轉(zhuǎn)換圖像。

部署。我們向訓(xùn)練模型顯示極少量目標(biāo)類里的圖像,這就足以將源類的圖像轉(zhuǎn)換為目標(biāo)類的類似圖像了,即使模型在訓(xùn)練期間從未見過目標(biāo)類的任何圖像。

需要注意的是,F(xiàn)UNIT生成器有兩個輸入:1)一個內(nèi)容圖像;2)一組目標(biāo)類圖像。它的目的是生成與目標(biāo)類圖像相似的輸入圖像的轉(zhuǎn)換。

我們的框架由一個有條件的圖像發(fā)生器G和一個多任務(wù)對抗性鑒別器D組成。

與現(xiàn)有無監(jiān)督image-to-image translation框架中有條件的圖像生成器不同,它們是將一張圖像作為輸入,而我們的生成器G需要同時將一張內(nèi)容圖像x和一組K類圖像{y1, ..., yK}作為輸入,生成輸出圖像xˉ,公式如下:

實(shí)驗(yàn)結(jié)果:姿態(tài)和種類一起轉(zhuǎn)換,超越基準(zhǔn)模型

主要結(jié)果

如表1所示,F(xiàn)UNIT框架在Animal Faces和North American Birds兩個數(shù)據(jù)集的所有性能指標(biāo)都優(yōu)于用于小樣本無監(jiān)督圖像到圖像轉(zhuǎn)換任務(wù)的基線模型。

FUNIT在Animal Faces數(shù)據(jù)集的1-shot和5-shot設(shè)置上分別達(dá)到82.36和96.05 的Top-5 測試精度,以及在North American Birds數(shù)據(jù)集上分別達(dá)到60.19和75.75的Top-5 測試精度。

這些指標(biāo)都明顯優(yōu)于相應(yīng)的基準(zhǔn)模型。

表1:FUNIT與基線模型的性能比較。↑表示數(shù)值越大越好,↓表示越小越好。

在圖2中,我們對FUNIT-5計(jì)算的few-shot translation的結(jié)果進(jìn)行了可視化。

圖2:無監(jiān)督圖像-圖像轉(zhuǎn)換結(jié)果的可視化。計(jì)算結(jié)果采用FUNIT-5模型。

從上到下分別是來自動物面孔、鳥、花和食物數(shù)據(jù)集的結(jié)果。每個示例隨機(jī)展示了2張目標(biāo)類中的圖像,輸入內(nèi)容圖像x,以及轉(zhuǎn)換后的輸出圖像xˉ。

結(jié)果表明,模型能夠成功地將源類的圖像轉(zhuǎn)換為新的類中的相似圖像。對象在輸入內(nèi)容圖像x和相應(yīng)輸出圖像xˉ中的姿態(tài)基本保持不變。輸出圖像也非常逼真,類似于目標(biāo)類中的圖像。

圖3提供FUNIT與基線模型的結(jié)果比較??梢钥吹?,F(xiàn)UNIT生成了高質(zhì)量的圖像轉(zhuǎn)換輸出。

圖3:小樣本圖像到圖像轉(zhuǎn)換效果的比較。

從左到右的列分別是輸入內(nèi)容圖像x,兩個輸入目標(biāo)類圖像y1,y2,來自不公平的StarGAN基線的轉(zhuǎn)換結(jié)果,來自公平的StarGAN基線的轉(zhuǎn)換結(jié)果,以及來自FUNIT框架的結(jié)果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42361
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4972

    瀏覽量

    74123
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4102

    瀏覽量

    99365

原文標(biāo)題:一圖生萬物!英偉達(dá)推超強(qiáng)圖像轉(zhuǎn)換神器,小樣本一秒貓變狗

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用JPU對jpg圖像進(jìn)行轉(zhuǎn)換,使用的工具為ffmpeg,轉(zhuǎn)換出來的圖像顏色失調(diào)嚴(yán)重,請問這是什么情況?

    我正在使用JPU對jpg圖像進(jìn)行轉(zhuǎn)換,使用的工具為ffmpeg,轉(zhuǎn)換出來的圖像顏色失調(diào)嚴(yán)重,請問這是什么情況?
    發(fā)表于 02-05 07:19

    圖像采集卡:連接設(shè)備與數(shù)據(jù)的圖像樞紐

    在機(jī)器視覺與圖像傳輸體系中,圖像采集卡是無可替代的重要樞紐——它一端承接相機(jī)、內(nèi)窺鏡、攝像機(jī)等前端圖像設(shè)備的信號輸出,另一端對接后端數(shù)據(jù)處理、存儲、展示系統(tǒng),通過信號轉(zhuǎn)換、同步協(xié)調(diào)、高
    的頭像 發(fā)表于 01-22 13:51 ?269次閱讀
    <b class='flag-5'>圖像</b>采集卡:連接設(shè)備與數(shù)據(jù)的<b class='flag-5'>圖像</b>樞紐

    英偉達(dá)重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆收購。但
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!AI 推理存儲全面覺醒

    圖像采集卡:機(jī)器視覺時代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術(shù)本質(zhì):從信號數(shù)據(jù)的“轉(zhuǎn)換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機(jī)器視覺系統(tǒng)的核心硬件組件,本質(zhì)是通過專用芯片(如FPGA、ASIC)實(shí)
    的頭像 發(fā)表于 11-12 15:15 ?687次閱讀
    <b class='flag-5'>圖像</b>采集卡:機(jī)器視覺時代的<b class='flag-5'>圖像</b>數(shù)據(jù)核心樞紐

    模板驅(qū)動 無需訓(xùn)練數(shù)據(jù) SmartDP解決小樣本AI算法模型開發(fā)難題

    。但是這個平臺不適用于小樣本AI模型開發(fā),特別是一些特殊行業(yè),數(shù)據(jù)本來就不多,但又有著需求,因此陷于兩難。面臨這種市場困境,慧視光電推出了一個全新的AI平臺Sma
    的頭像 發(fā)表于 09-09 17:57 ?1443次閱讀
    模板驅(qū)動  無需訓(xùn)練數(shù)據(jù)  SmartDP解決<b class='flag-5'>小樣本</b>AI算法模型開發(fā)難題

    英偉達(dá)自研HBM基礎(chǔ)裸片

    "后的下一代AI GPU "Feynman"。 ? 有分析指出,英偉達(dá)此舉或是將部分GPU功能集成基礎(chǔ)裸片中,旨在提高HBM和GPU的整體性能。英偉
    的頭像 發(fā)表于 08-21 08:16 ?2892次閱讀

    【EASY EAI Orin Nano開發(fā)板試用體驗(yàn)】使用Linux posix文件讀取接口和LVGL的animimg(圖像動畫)控件實(shí)現(xiàn)動畫播放以及

    Linux系統(tǒng)這種帶有標(biāo)準(zhǔn)posix文件讀取接口的就不需要這么麻煩了,直接通過posix api就可以打開存放在文件夾中的文件即可,非常簡便也容易理解。 根據(jù)以上思路,那就可以直接進(jìn)行操作了,首先將多張
    發(fā)表于 07-22 00:34

    英偉達(dá):CUDA 已經(jīng)開始移植 RISC-V 架構(gòu)上

    ,著重介紹了將 CUDA 移植 RISC-V 架構(gòu)的相關(guān)工作和計(jì)劃,展現(xiàn)了對 RISC-V 架構(gòu)的高度重視與積極布局。 ? Frans Sijstermanns 首先回顧了英偉達(dá)與 RISC-V 之間
    發(fā)表于 07-17 16:30 ?3972次閱讀

    無法使用OpenVINO?在 GPU 設(shè)備上運(yùn)行穩(wěn)定擴(kuò)散文本圖像的原因?

    在OpenVINO? GPU 設(shè)備上使用圖像大小 (1024X576) 運(yùn)行穩(wěn)定擴(kuò)散文本圖像,并收到錯誤消息: RuntimeError: Exception from
    發(fā)表于 06-25 06:36

    HarmonyOS應(yīng)用圖像stride處理方案

    當(dāng)圖像存儲在內(nèi)存中時,內(nèi)存緩沖區(qū)可能在每行像素之后包含額外的填充字節(jié)。填充字節(jié)會影響圖像在內(nèi)存中的存儲方式,但不會影響圖像的顯示方式。stride是內(nèi)存中一行像素內(nèi)存中下一行像素的字
    的頭像 發(fā)表于 06-10 14:17 ?1273次閱讀
    HarmonyOS應(yīng)用<b class='flag-5'>圖像</b>stride處理方案

    工業(yè)相機(jī)圖像采集卡:機(jī)器視覺的核心樞紐

    應(yīng)用廣泛。工業(yè)相機(jī)圖像采集卡的主要功能在機(jī)器視覺系統(tǒng)中,工業(yè)相機(jī)負(fù)責(zé)捕獲目標(biāo)對象的圖像,而圖像采集卡則負(fù)責(zé)將這些圖像信息轉(zhuǎn)換為計(jì)算機(jī)
    的頭像 發(fā)表于 05-21 12:13 ?907次閱讀
    工業(yè)相機(jī)<b class='flag-5'>圖像</b>采集卡:機(jī)器視覺的核心樞紐

    從游戲智能駕駛,英偉達(dá)有哪些技術(shù)升級?

    兼首席執(zhí)行官黃仁勛在發(fā)布會上表示,未來自動駕駛汽車市場的潛力巨大,整體規(guī)模有望達(dá)到數(shù)萬億美元。他預(yù)測,2026財(cái)年,英偉達(dá)的汽車業(yè)務(wù)收入將有望達(dá)到50億美元(約合人民幣365億元),顯示出該業(yè)務(wù)板塊日益增長的重要戰(zhàn)略地位。 作
    的頭像 發(fā)表于 05-16 09:02 ?1057次閱讀
    從游戲<b class='flag-5'>到</b>智能駕駛,<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>有哪些技術(shù)升級?

    基于LockAI視覺識別模塊:C++使用圖像的統(tǒng)計(jì)信息

    圖像處理中,統(tǒng)計(jì)信息可以幫助我們了解圖像的特性,例如區(qū)域內(nèi)的像素分布、顏色轉(zhuǎn)換以及特定區(qū)域的分析。本文將介紹基于LockAI視覺識別模塊如何提取興趣區(qū)域(ROI)、
    發(fā)表于 05-08 10:31

    基于LockAI視覺識別模塊:C++使用圖像的統(tǒng)計(jì)信息

    圖像處理中,統(tǒng)計(jì)信息可以幫助我們了解圖像的特性,例如區(qū)域內(nèi)的像素分布、顏色轉(zhuǎn)換以及特定區(qū)域的分析。本文將介紹基于LockAI視覺識別模塊如何提取興趣區(qū)域(ROI)、
    的頭像 發(fā)表于 05-08 10:09 ?806次閱讀
    基于LockAI視覺識別模塊:C++使用<b class='flag-5'>圖像</b>的統(tǒng)計(jì)信息