91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種新型解決方案:將表征學(xué)習(xí)和分類器學(xué)習(xí)分開

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:通信信號(hào)處理研究所 ? 2020-06-13 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在圖像分類任務(wù)中類別不均衡問題一直是個(gè)難點(diǎn),在實(shí)際應(yīng)用中大部分的分類樣本很可能呈現(xiàn)長(zhǎng)尾分布。新加坡國(guó)立大學(xué)和 Facebook AI 的研究者提出了一種新型解決方案:將表征學(xué)習(xí)和分類器學(xué)習(xí)分開,從而尋找合適的表征來最小化長(zhǎng)尾樣本分類的負(fù)面影響。該論文已被 ICLR 2020 接收。

圖像分類一直是深度學(xué)習(xí)領(lǐng)域中非?;厩夜I(yè)應(yīng)用廣泛的任務(wù),然而如何處理待分類樣本中存在的類別不均衡問題是長(zhǎng)期困擾學(xué)界與工業(yè)界的一個(gè)難題。相對(duì)來說,學(xué)術(shù)研究提供的普通圖像分類數(shù)據(jù)集維持了較為均衡的不同類別樣本分布;然而在實(shí)際應(yīng)用中,大部分的分類樣本很可能呈現(xiàn)長(zhǎng)尾分布(long-tail distribution),這很有可能導(dǎo)致分類模型效果偏差:對(duì)于尾部的類別分類準(zhǔn)確率不高。 針對(duì)長(zhǎng)尾分布的圖像識(shí)別任務(wù),目前的研究和實(shí)踐提出了大致幾種解決思路,比如分類損失權(quán)重重分配(loss re-weighting)、數(shù)據(jù)集重采樣、尾部少量樣本過采樣、頭部過多樣本欠采樣,或者遷移學(xué)習(xí)。 在 ICLR 2020 會(huì)議上,新加坡國(guó)立大學(xué)與 Facebook AI 合著了一篇論文《Decoupling Representation and classifier for long-tailed recognition》,提出了一個(gè)新穎的解決角度:在學(xué)習(xí)分類任務(wù)的過程中,將通常默認(rèn)為聯(lián)合起來學(xué)習(xí)的類別特征表征與分類器解耦(decoupling),尋求合適的表征來最小化長(zhǎng)尾樣本分類的負(fù)面影響。

論文鏈接:https://openreview.net/pdf?id=r1gRTCVFvB

GitHub 鏈接:https://github.com/facebookresearch/classifier-balancing

該研究系統(tǒng)性地探究了不同的樣本均衡策略對(duì)長(zhǎng)尾型數(shù)據(jù)分類的影響,并進(jìn)行了詳實(shí)的實(shí)驗(yàn),結(jié)果表明:a) 當(dāng)學(xué)習(xí)到高質(zhì)量的類別表征時(shí),數(shù)據(jù)不均衡很可能不會(huì)成為問題;b) 在學(xué)得上述表征后,即便應(yīng)用最簡(jiǎn)單的樣本均衡采樣方式,也一樣有可能在僅調(diào)整分類器的情況下學(xué)習(xí)到非常魯棒的長(zhǎng)尾樣本分類模型。 該研究將表征學(xué)習(xí)和分類器學(xué)習(xí)分離開來,分別進(jìn)行了延伸探究。 表征學(xué)習(xí) 對(duì)于表征學(xué)習(xí)來說,理想情況下好的類別表征能夠準(zhǔn)確識(shí)別出各種待分類類別。目前針對(duì)長(zhǎng)尾類型數(shù)據(jù)分類任務(wù),不同的采樣策略、損失權(quán)重重分配,以及邊界正則化(margin regularization)都可用于改善類別不均。 假設(shè) p_j 為樣本來自類別 j 中的概率,則 p_j 可用如下公式表示:

其中 n 為訓(xùn)練樣本總數(shù),C 為訓(xùn)練類別總數(shù),而 q 為 [0,1] 其中一個(gè)值。 采樣策略包含以下幾種常用采樣方式:

樣本均衡采樣(Instance-balanced sampling):該方法最為常見,即每一個(gè)訓(xùn)練樣本都有均等的機(jī)會(huì)概率被選中,即上述公式中 q=1 的情況。

類別均衡采樣(Class-balanced sampling):每個(gè)類別都有同等的概率被選中,即公平地選取每個(gè)類別,然后再?gòu)念悇e中進(jìn)行樣本選取,即上述公式中 q=0 的情況。

平方根采樣(Square-root sampling):本質(zhì)上是之前兩種采樣方式的變種,通常是將概率公式中的 q 定值為 0.5。

漸進(jìn)式均衡采樣(Progressively-balanced sampling):根據(jù)訓(xùn)練中的迭代次數(shù) t(epoch)同時(shí)引入樣本均衡(IB)與類別均衡(CB)采樣并進(jìn)行適當(dāng)權(quán)重調(diào)整的一種新型采樣模式,公式為

其中 T 為數(shù)據(jù)集訓(xùn)練迭代總數(shù)。 分類器學(xué)習(xí) 該研究也針對(duì)單獨(dú)拆分出來的分類器訓(xùn)練進(jìn)行了調(diào)研和分類概括:

重訓(xùn)練分類器(Classifier Re-training, cRT):保持表征固定不變,隨機(jī)重新初始化分類器并進(jìn)行訓(xùn)練。

最近類別平均分類器(Nereast Class Mean classifier, NCM):首先計(jì)算學(xué)習(xí)到的每個(gè)類別特征均值,然后執(zhí)行最近鄰搜索來確定類別。

τ-歸一化分類器(τ-normalized classifier):作者提出使用該方法對(duì)分類器中的類別邊界進(jìn)行重新歸一化,以取得均衡。

實(shí)驗(yàn)結(jié)果 通過以上觀察和學(xué)習(xí)拆分,該研究在幾個(gè)公開的長(zhǎng)尾分類數(shù)據(jù)集上重新修改了頭部類別和尾部類別的分類決策邊界,并且搭配不同的采樣策略進(jìn)行交叉訓(xùn)練實(shí)驗(yàn)。訓(xùn)練出的不同分類器之間的對(duì)比結(jié)果如下圖所示:

同時(shí),在 Places-LT、Imagenet-LT 和 iNaturalist2018 三個(gè)公開標(biāo)準(zhǔn)數(shù)據(jù)集上,該研究提出的策略也獲得了同比更高的分類準(zhǔn)確率,實(shí)現(xiàn)了新的 SOTA 結(jié)果:

通過各類對(duì)比實(shí)驗(yàn),該研究得到了如下觀察: 1. 解耦表征學(xué)習(xí)與分類為兩個(gè)過程均取得了非常好的效果,并且打破了人們對(duì)長(zhǎng)尾分類固有的「樣本均衡采樣學(xué)習(xí)效果最好,擁有最具泛化性的特征表示」這一經(jīng)驗(yàn)之談。 2. 重新調(diào)整分類邊界對(duì)于長(zhǎng)尾分布的物體識(shí)別來說是非常有效的。 3. 將該研究提出的解耦學(xué)習(xí)規(guī)則應(yīng)用到傳統(tǒng)網(wǎng)絡(luò)(如 ResNeXt)中,仍能取得很好的效果,這說明該策略確實(shí)對(duì)長(zhǎng)尾分類具備一定指導(dǎo)意義。 該研究針對(duì)業(yè)界和學(xué)界頻繁遇到的長(zhǎng)尾樣本分類難題,提出解構(gòu)傳統(tǒng)的「分類器表征聯(lián)合學(xué)習(xí)」范式,從另一個(gè)角度提供了新思路:調(diào)整它們?cè)诒碚骺臻g的分類邊界或許是更加高效的方法。 該研究思路比較新穎,實(shí)驗(yàn)結(jié)果也具有一定的代表性。對(duì)于研究長(zhǎng)尾分類的學(xué)者或者業(yè)界工程師而言,這在傳統(tǒng)采樣方式下「面多了加水,水多了加面」的經(jīng)驗(yàn)之外,提供了額外思路。目前該研究的相關(guān)代碼已在 GitHub 上開源,感興趣的讀者可以下載進(jìn)行更多的嘗試。 代碼實(shí)現(xiàn) 研究者在 GitHub 項(xiàng)目中提供了對(duì)應(yīng)的訓(xùn)練代碼和必要的訓(xùn)練步驟。代碼整體是相對(duì)基本的分類訓(xùn)練代碼,比較容易實(shí)現(xiàn)。具體到復(fù)現(xiàn)模型訓(xùn)練,作者也給出了幾點(diǎn)注意事項(xiàng)。 1. 表征學(xué)習(xí)階段

學(xué)習(xí)過程中保持網(wǎng)絡(luò)結(jié)構(gòu)(比如 global pooling 之后不需要增加額外的全連接層)、超參數(shù)選擇、學(xué)習(xí)率和 batch size 的關(guān)系和正常分類問題一致(比如 ImageNet),以確保表征學(xué)習(xí)的質(zhì)量。

類別均衡采樣:采用多 GPU 實(shí)現(xiàn)的時(shí)候,需要考慮使得每塊設(shè)備上都有較為均衡的類別樣本,避免出現(xiàn)樣本種類在卡上過于單一,從而使得 BN 的參數(shù)估計(jì)不準(zhǔn)。

漸進(jìn)式均衡采樣:為提升采樣速度,該采樣方式可以分兩步進(jìn)行。第一步先從類別中選擇所需類別,第二步從對(duì)應(yīng)類別中隨機(jī)選擇樣本。

2. 分類器學(xué)習(xí)階段

重新學(xué)習(xí)分類器(cRT):重新隨機(jī)初始化分類器或者繼承特征表示學(xué)習(xí)階段的分類器,重點(diǎn)在于保證學(xué)習(xí)率重置到起始大小并選擇 cosine 學(xué)習(xí)率。

τ-歸一化(tau-normalization):τ 的選取在驗(yàn)證集上進(jìn)行,如果沒有驗(yàn)證集可以從訓(xùn)練集模仿平衡驗(yàn)證集,可參考原論文附錄 B.5。

可學(xué)習(xí)參數(shù)放縮(LWS):學(xué)習(xí)率的選擇與 cRT 一致,學(xué)習(xí)過程中要保證分類器參數(shù)固定不變,只學(xué)習(xí)放縮因子。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像分類
    +關(guān)注

    關(guān)注

    0

    文章

    97

    瀏覽量

    12499
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124426

原文標(biāo)題:ICLR 2020 | 如何解決圖像分類中的類別不均衡問題?不妨試試分開學(xué)習(xí)表征和分類器

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機(jī)器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的
    的頭像 發(fā)表于 02-10 15:58 ?350次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>特征工程:<b class='flag-5'>分類</b>變量的數(shù)值化處理方法

    強(qiáng)化學(xué)習(xí)會(huì)讓自動(dòng)駕駛模型學(xué)習(xí)更快嗎?

    一種讓機(jī)器通過“試錯(cuò)”學(xué)會(huì)決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強(qiáng)化學(xué)習(xí)不會(huì)把每步的“正確答案”都告訴
    的頭像 發(fā)表于 01-31 09:34 ?664次閱讀
    強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>會(huì)讓自動(dòng)駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    Bamtone ICT系列:一種新型高效的離子污染測(cè)試儀?

    設(shè)計(jì)的款精密離子污染檢測(cè)儀器,被定位為一種新型高效的離子污染測(cè)試儀,代表了當(dāng)前PCBA離子污染檢測(cè)向自動(dòng)化、智能化和高效化發(fā)展的趨勢(shì),是國(guó)產(chǎn)替代高端進(jìn)口設(shè)備的個(gè)有力
    的頭像 發(fā)表于 01-12 11:28 ?430次閱讀
    Bamtone ICT系列:<b class='flag-5'>一種</b><b class='flag-5'>新型</b>高效的離子污染測(cè)試儀?

    分享個(gè)嵌入式開發(fā)學(xué)習(xí)路線

    操作系統(tǒng)(RTOS):學(xué)習(xí)FreeRTOS或RT-Thread,掌握任務(wù)創(chuàng)建與刪除、任務(wù)調(diào)度、信號(hào)量、隊(duì)列、定時(shí)等核心概念。 物聯(lián)網(wǎng)通信技術(shù):掌握WiFi、Bluetooth、LoRa等至少一種通信
    發(fā)表于 12-04 11:01

    學(xué)習(xí)物聯(lián)網(wǎng)怎么入門?

    聯(lián)網(wǎng)的基本概念和技術(shù)是學(xué)習(xí)物聯(lián)網(wǎng)的重要第步。物聯(lián)網(wǎng)是指互聯(lián)網(wǎng)上的物品相互連接,通過網(wǎng)絡(luò)實(shí)現(xiàn)信息交流和共享的一種技術(shù)。學(xué)習(xí)物聯(lián)網(wǎng)需要了解物聯(lián)網(wǎng)的基本概念,如物聯(lián)網(wǎng)的架構(gòu)、物聯(lián)網(wǎng)的協(xié)議、
    發(fā)表于 10-14 10:34

    DWDM光模塊分類與光網(wǎng)傳輸解決方案

    DWDM光模塊分類與光網(wǎng)傳輸解決方案解析
    的頭像 發(fā)表于 10-10 15:12 ?863次閱讀

    Andes晶心科技推出新代深度學(xué)習(xí)加速

    高效能、低功耗 32/64 位 RISC-V 處理核與 AI 加速解決方案的領(lǐng)導(dǎo)供貨商—Andes晶心科技(Andes Technology)今日正式發(fā)表最新深度學(xué)習(xí)加速 Ande
    的頭像 發(fā)表于 08-20 17:43 ?2450次閱讀

    ARM入門學(xué)習(xí)方法分享

    ARM7/ARM9等多個(gè)版本。除了些Unix圖形工作站外,大多數(shù)ARM核心的處理都使用在嵌入式領(lǐng)域。 ARM,既可以認(rèn)為是個(gè)公司的名字,也可以認(rèn)為是對(duì)類微處理
    發(fā)表于 07-23 10:21

    寬調(diào)速范圍低轉(zhuǎn)矩脈動(dòng)的一種新型內(nèi)置式永磁同步電機(jī)的設(shè)計(jì)與分析

    摘要:寬調(diào)速范圍與低轉(zhuǎn)矩脈動(dòng)直是設(shè)計(jì)電動(dòng)汽車用內(nèi)置式永礎(chǔ)同步電機(jī)時(shí)所追求的重要目標(biāo)。設(shè)計(jì)了一種轉(zhuǎn)子結(jié)構(gòu)為胃的新型內(nèi)置式永礎(chǔ)同步電機(jī),并進(jìn)行了繞組結(jié)構(gòu)優(yōu)化與性能分析。利用有限元分析法,
    發(fā)表于 06-06 14:13

    一種新型寬帶鞭狀套筒天線

    電子發(fā)燒友網(wǎng)站提供《一種新型寬帶鞭狀套筒天線.pdf》資料免費(fèi)下載
    發(fā)表于 05-28 14:05 ?0次下載

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    無監(jiān)督學(xué)習(xí)一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?1466次閱讀
    使用MATLAB進(jìn)行無監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>

    基于RV1126開發(fā)板實(shí)現(xiàn)自學(xué)習(xí)圖像分類方案

    在RV1126開發(fā)板上實(shí)現(xiàn)自學(xué)習(xí):在識(shí)別前對(duì)物體圖片進(jìn)行模型學(xué)習(xí),訓(xùn)練完成后通過算法分類得出圖像的模型ID。 方案設(shè)計(jì)邏輯流程圖,方案
    的頭像 發(fā)表于 04-21 13:37 ?11次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)自<b class='flag-5'>學(xué)習(xí)</b>圖像<b class='flag-5'>分類</b><b class='flag-5'>方案</b>

    一種分段氣隙的CLLC變換平面變壓設(shè)計(jì)

    氣隙設(shè)計(jì)的優(yōu)點(diǎn)。 目錄1 概述2 一種分段氣隙的CLLC平面變壓設(shè)計(jì)3 實(shí)驗(yàn)驗(yàn)證4 參考文獻(xiàn) 1 概述學(xué)者們從LLC拓?fù)湓怼?b class='flag-5'>新型器件、改進(jìn)拓?fù)?、先進(jìn)調(diào)制方法、諧振參數(shù)優(yōu)化方法、磁性器件設(shè)計(jì)方法
    發(fā)表于 03-27 13:57

    一種新型直流電機(jī)控制

    以前控制直流電機(jī)多由單片機(jī)完成。該方式缺點(diǎn)是接口繁瑣、速度慢,且不易在高溫、高壓等惡劣環(huán)境下工作[1]。采用一種新型直流電機(jī)控制——DSP 控制解決了單片機(jī)控制的缺點(diǎn),其具備很多優(yōu)
    發(fā)表于 03-25 15:25

    一種無刷直流電機(jī)霍耳信號(hào)與定子繞組關(guān)系自學(xué)習(xí)方法

    的關(guān)系。提出了一種無刷直流電機(jī)霍耳信號(hào)與定子繞組關(guān)系自學(xué)習(xí)方法,該方法通過不同的繞組通電組合電機(jī)轉(zhuǎn)子依次轉(zhuǎn)到6個(gè)不同的位置并記錄對(duì)應(yīng)的霍耳信號(hào),然后得出霍耳信號(hào)與定子繞組的對(duì)應(yīng)關(guān)系。所提出的方法快速
    發(fā)表于 03-25 15:15