91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌大腦打造“以一當十”的GAN:僅用10%標記數(shù)據(jù),生成圖像卻更逼真

DPVg_AI_era ? 來源:YXQ ? 2019-03-22 08:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,谷歌大腦研究人員提出了一種基于自監(jiān)督和半監(jiān)督學習的“條件GAN”,使用的標記數(shù)據(jù)量大降90%,生成圖像的質(zhì)量比現(xiàn)有全監(jiān)督最優(yōu)模型BigGAN高出20%(以FID得分計),有望緩解圖像生成和識別領(lǐng)域標記數(shù)據(jù)量嚴重不足的問題。

生成對抗網(wǎng)絡(luò)(GAN)是一類強大的深度生成模型。GAN背后的主要思想是訓練兩個神經(jīng)網(wǎng)絡(luò):生成器負責學習如何合成數(shù)據(jù),而判別器負責學習如何區(qū)分真實數(shù)據(jù)與生成器合成的虛假數(shù)據(jù)。目前,GAN已成功用于高保真自然圖像合成,改善學習圖像壓縮質(zhì)量,以及數(shù)據(jù)增強等任務(wù)。

對于自然圖像合成任務(wù)來說,現(xiàn)有的最優(yōu)結(jié)果是通過條件GAN實現(xiàn)的。與無條件GAN不同,條件GAN在訓練期間要使用標簽(比如汽車,狗等)。雖然數(shù)據(jù)標記讓圖像合成任務(wù)變得更容易實現(xiàn),在性能上獲得了顯著提升,但是這種方法需要大量標記數(shù)據(jù),而在實際任務(wù)中很少有大量標記數(shù)據(jù)可用。

隨著ImageNet上訓練過程的持續(xù),生成的圖像逼真度進步明顯

谷歌大腦的研究人員在最近的《用更少的數(shù)據(jù)標簽生成高保真圖像》中,提出了一種新方法來減少訓練最先進條件GAN所需的標記數(shù)據(jù)量。文章提出結(jié)合大規(guī)模GAN的最新進展,將高保真自然圖像合成技術(shù)與最先進技術(shù)相結(jié)合,使數(shù)據(jù)標記數(shù)量減少到原來的10%。

在此基礎(chǔ)上,研究人員還發(fā)布了Compare GAN庫的重大更新,其中包含了訓練和評估現(xiàn)代GAN所需的所有組件。

利用半監(jiān)督和自監(jiān)督方式提升預(yù)測性能

條件GAN與基線BigGAN的FID分數(shù)對比,圖中黑色豎線為BigGAN基線模型(使用全部標記數(shù)據(jù))得分。S3GAN在僅使用10%標記數(shù)據(jù)的情況下,得分比基線模型最優(yōu)得分高20%

在條件GAN中,生成器和判別器通常都以分類標簽為應(yīng)用條件?,F(xiàn)在,研究人員建議使用推斷得出的數(shù)據(jù)標簽,來替換手工標記的真實標簽。

上行:BigGAN全監(jiān)督式學習生成的128×128像素最優(yōu)圖像樣本。下行為S3GAN生成的圖像樣本,標記數(shù)據(jù)量降低了90%,F(xiàn)ID得分與BigGAN表現(xiàn)相當

為了推斷大型數(shù)據(jù)集中多數(shù)未標記數(shù)據(jù)的高質(zhì)量標簽,可以采取兩步方法:首先,僅使用數(shù)據(jù)集的未標記部分來學習特征表示。

為了學習特征表示,需要利用新方法,以不同的方法利用自我監(jiān)督機制:將未標記的圖像進行隨機旋轉(zhuǎn),由深度卷積神經(jīng)網(wǎng)絡(luò)負責預(yù)測旋轉(zhuǎn)角度。這背后的思路是,模型需要能夠識別主要對象及其形狀,才能在此類任務(wù)中獲得成功。

對一幅未標記的圖像進行隨機旋轉(zhuǎn),網(wǎng)絡(luò)的任務(wù)是預(yù)測旋轉(zhuǎn)角度。成功的模型需要捕捉有意義的語義圖像特征,這些特征可用于完成其他視覺任務(wù)

研究人員將訓練網(wǎng)絡(luò)的一個中間層的激活模式視為輸入的新特征表示,并訓練分類器,以使用原始數(shù)據(jù)集的標記部分識別該輸入的標簽。由于網(wǎng)絡(luò)經(jīng)過預(yù)訓練,可以從數(shù)據(jù)中提取具有語義意義的特征,因此,訓練此分類器比從頭開始訓練整個網(wǎng)絡(luò)更具樣本效率。最后使用分類器對未標記的數(shù)據(jù)進行標記。

為了進一步提高模型質(zhì)量和訓練的穩(wěn)定性,最好讓判別器網(wǎng)絡(luò)學習有意義的特征表示。通過這些改進手段,在加上大規(guī)模的訓練,使得新的條件GAN在ImageNet圖像合成任務(wù)上達到了最優(yōu)性能。

給定潛在向量,由生成器網(wǎng)絡(luò)生成圖像。在每行中,最左側(cè)和最右側(cè)圖像的潛在代碼之間的線性插值導致圖像空間中的語義插值

CompareGAN:用于訓練和評估GAN的庫

對GAN的前沿研究在很大程度上依賴于經(jīng)過精心設(shè)計和測試的代碼庫,即使只是復制或再現(xiàn)先前的結(jié)果和技術(shù),也需要付出巨大努力。

為了促進開放科學并讓研究界從最近的進步中獲益,研究人員發(fā)布了Compare GAN庫的重大更新。該庫包括現(xiàn)代GAN中常用的損失函數(shù),正則化和歸一化方案,神經(jīng)架構(gòu)和量化指標,現(xiàn)已支持:

GPU和TPU訓練

通過Gin進行輕量級配置(含實例)

通過TensorFlow數(shù)據(jù)集庫提供大量數(shù)據(jù)集

未來方向:自監(jiān)督學習會讓GAN更強大

由于標記數(shù)據(jù)源和未標記數(shù)據(jù)源之間的差距越來越大,讓模型具備從部分標記的數(shù)據(jù)中學習的能力變得越來越重要。

目前來看,自監(jiān)督學習和半監(jiān)督學習的簡單而有力的結(jié)合,有助于縮小GAN的這一現(xiàn)實差距。自監(jiān)督是一個值得研究的領(lǐng)域,值得在該領(lǐng)域開展面向其他生成建模任務(wù)的研究。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111554
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    21

    文章

    2372

    瀏覽量

    82872

原文標題:谷歌大腦打造“以一當十”的GAN:僅用10%標記數(shù)據(jù),生成圖像卻更逼真

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    谷歌自己發(fā)電,AI 系統(tǒng)會回到基礎(chǔ)工程嗎?

    2026年,谷歌開始自己發(fā)電。這不是能源布局,這是系統(tǒng)焦慮。全球算力頂端的公司,把注意力轉(zhuǎn)向電力,意味著個信號——AI的瓶頸,正在下沉。 不再只是芯片,不再只是參數(shù)。而是系統(tǒng)能否在現(xiàn)實世界里
    的頭像 發(fā)表于 02-12 15:59 ?2402次閱讀
    <b class='flag-5'>當</b><b class='flag-5'>谷歌</b>自己發(fā)電,AI 系統(tǒng)會回到基礎(chǔ)工程嗎?

    谷歌評論卡,碰碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應(yīng)用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其是 Imagen 專屬編輯功
    的頭像 發(fā)表于 11-30 09:28 ?458次閱讀

    Leadway GaN系列模塊的工作溫度范圍

    、電動汽車、數(shù)據(jù)中心等場景提供了可靠、緊湊的電源解決方案。、溫度范圍優(yōu)勢極端環(huán)境適應(yīng)性 Leadway GaN模塊的工作溫度下限低至-40℃,可滿足極寒地區(qū)(如北極科考站、高緯度工業(yè)區(qū))的低溫啟動需求
    發(fā)表于 11-12 09:19

    Leadway GaN系列模塊的功率密度

    場景提供高性價比的全國產(chǎn)解決方案。、功率密度提升的核心邏輯材料特性突破: GaN(氮化鎵)作為寬禁帶半導體,電子遷移率(2000cm2/Vs)和飽和漂移速度(2.5×10?cm/s)遠超傳統(tǒng)硅基器件
    發(fā)表于 10-22 09:09

    看點:谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國產(chǎn)龍頭西安奕材今日申購

    給大家?guī)?b class='flag-5'>一些業(yè)界資訊: 谷歌Veo 3.1迎來重大更新硬剛Sora 2 據(jù)外媒報道,在10月16日,谷歌發(fā)布了AI視頻生成模型Veo 3.
    的頭像 發(fā)表于 10-16 16:00 ?1043次閱讀

    借助NVIDIA Cosmos模型提升機器人訓練效率

    隨著物理 AI 系統(tǒng)的不斷發(fā)展,對豐富標記數(shù)據(jù)集的需求正在急速增長,已經(jīng)超出了在現(xiàn)實世界中通過人工采集所能滿足的范圍。世界基礎(chǔ)模型(WFMs)是經(jīng)過訓練的生成式 AI 模型,能夠根據(jù)現(xiàn)實世界環(huán)境的動態(tài),對未來的世界狀態(tài)進行仿真、預(yù)測和推理,這類模型有望幫助突破這
    的頭像 發(fā)表于 09-23 15:30 ?1052次閱讀
    借助NVIDIA Cosmos模型提升機器人訓練效率

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    圖像的快速鑒別,滿足實時或準實時的應(yīng)用需求。 3. 數(shù)據(jù)采集 AI圖片數(shù)據(jù)集,本項目使用gemini生成圖片,使用的是gem來實現(xiàn)的。 提示詞如下 你是
    發(fā)表于 08-21 13:59

    晶眾光電耗散孤子光參量振蕩器介紹

    在追求更高效率、更優(yōu)性能的激光應(yīng)用領(lǐng)域,工程師們總在尋找那把能“以一當十”的鑰匙。今天,晶眾光電帶來的耗散孤子光參量振蕩器(DS-OPO),正是這樣位激光界的“平衡效能大師”——它化繁為簡,讓曾經(jīng)復雜的光源難題迎刃而解。
    的頭像 發(fā)表于 08-05 14:51 ?1034次閱讀

    PCB絲印極性標記的實用設(shè)計技巧

    對應(yīng)位置 。這種標記方式簡潔明了,符合大眾的認知習慣,有效避免了因標記模糊導致的誤解,為電路板的安裝、測試與維修提供了有力保障。 2、使用側(cè)橫線標記極性
    發(fā)表于 07-09 11:43

    利用NVIDIA 3D引導生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進,從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在
    的頭像 發(fā)表于 06-05 09:24 ?921次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發(fā)者現(xiàn)在可以通過 Gemini API 訪問 Google 最先進的圖像生成模型 Imagen 3。該模型最初僅對付費用戶開放,不久后也將面向免費用戶推出。
    的頭像 發(fā)表于 05-14 16:53 ?1305次閱讀

    技術(shù)分享 | 高逼真合成數(shù)據(jù)助力智駕“看得更準、學得更快”

    自動駕駛研發(fā)如何高效獲取海量訓練數(shù)據(jù)?高逼真合成數(shù)據(jù)技術(shù)正在提供新解法。通過仿真平臺可生成多場景、多傳感器的精準標注數(shù)據(jù)。文章詳解如何構(gòu)建符
    的頭像 發(fā)表于 04-29 10:47 ?3546次閱讀
    技術(shù)分享 | 高<b class='flag-5'>逼真</b>合成<b class='flag-5'>數(shù)據(jù)</b>助力智駕“看得更準、學得更快”

    如何使用離線工具od SPSDK生成完整圖像

    SDSDK)會生成個缺少前 4KB 的文件。 這些將由 flashloader 直接在目標上填充,使用將要傳達給它的參數(shù),對吧? 我需要離線工作。我需要生成個 “完整
    發(fā)表于 03-28 06:51

    ?Diffusion生成式動作引擎技術(shù)解析

    Diffusion生成式動作引擎 Diffusion生成式動作引擎是種基于擴散模型(Diffusion Models)的生成式人工智能技術(shù),專注于
    的頭像 發(fā)表于 03-17 15:14 ?3099次閱讀