91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

湯新加坡團(tuán)隊(duì) 針對(duì)長(zhǎng)尾數(shù)據(jù)分布提出了視覺(jué)識(shí)別方案

ss ? 來(lái)源:學(xué)術(shù)頭條 ? 作者:學(xué)術(shù)頭條 ? 2020-11-25 17:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀:在NeurIPS 2020上,商湯新加坡團(tuán)隊(duì)提出的Balanced-Meta Softmax (BALMS), 針對(duì)真實(shí)世界中常見(jiàn)的長(zhǎng)尾數(shù)據(jù)分布提出了新的視覺(jué)識(shí)別方案。在優(yōu)化目標(biāo)方面,BALMS 提出一種新的損失函數(shù),Balanced Softmax,來(lái)修正長(zhǎng)尾設(shè)定下因訓(xùn)練與測(cè)試標(biāo)簽分布不同而導(dǎo)致的偏差。在優(yōu)化過(guò)程方面,BALMS提出 Meta Sampler來(lái)自動(dòng)學(xué)習(xí)最優(yōu)采樣率以配合Balanced Softmax,避免過(guò)平衡問(wèn)題。BALMS在長(zhǎng)尾圖像分類(lèi)與長(zhǎng)尾實(shí)例分割的共四個(gè)數(shù)據(jù)集上取得SOTA表現(xiàn)。這項(xiàng)研究也被收錄為ECCV LVIS workshop的spotlight。

論文名稱(chēng): Balanced Meta-Softmax for Long-Tailed Visual Recognition

問(wèn)題和挑戰(zhàn)

真實(shí)世界中的數(shù)據(jù)分布大多符合長(zhǎng)尾分布:常見(jiàn)類(lèi)比占據(jù)了數(shù)據(jù)集中的主要樣本,而大量的罕見(jiàn)類(lèi)別只在數(shù)據(jù)集中少量出現(xiàn)。例如一個(gè)動(dòng)物圖片數(shù)據(jù)集中,寵物貓的圖片數(shù)量可能遠(yuǎn)遠(yuǎn)超過(guò)熊貓的圖片數(shù)量。

由于長(zhǎng)尾現(xiàn)象對(duì)算法落地造成了很大的挑戰(zhàn),視覺(jué)社區(qū)對(duì)這一問(wèn)題的關(guān)注日漸增加,近年陸續(xù)推出了一些長(zhǎng)尾數(shù)據(jù)集,例如大規(guī)模實(shí)例分割數(shù)據(jù)集LVIS。我們發(fā)現(xiàn)長(zhǎng)尾問(wèn)題的難點(diǎn)主要存在于以下兩個(gè)方面:

1)優(yōu)化目標(biāo)。根據(jù)長(zhǎng)尾問(wèn)題的設(shè)定,訓(xùn)練集是類(lèi)別不均衡的。然而主流的指標(biāo),如mean AP (mAP),衡量全部類(lèi)別上的平均精度,因此鼓勵(lì)算法在類(lèi)別平衡的測(cè)試集上取得較好的表現(xiàn)。這導(dǎo)致了訓(xùn)練與測(cè)試時(shí)標(biāo)簽分布不同的問(wèn)題,我們稱(chēng)之為標(biāo)簽分布遷移。

2)優(yōu)化過(guò)程。罕見(jiàn)類(lèi)別在模型訓(xùn)練過(guò)程中很少出現(xiàn),因此無(wú)法在優(yōu)化過(guò)程中提供足夠的梯度。這使得即使我們有了一個(gè)較好的優(yōu)化目標(biāo),也很難使模型收斂到對(duì)應(yīng)的全局最優(yōu)。

方法介紹

1. Balanced Softmax

Softmax函數(shù)常常被用來(lái)將模型輸出轉(zhuǎn)化為物體屬于每個(gè)類(lèi)別的條件概率。

應(yīng)用貝葉斯定理可以發(fā)現(xiàn)常規(guī)的Softmax回歸會(huì)受到標(biāo)簽分布遷移的影響,并作出帶偏差的估計(jì)。這個(gè)偏差導(dǎo)致Softmax回歸出的分類(lèi)器更傾向于認(rèn)為樣本屬于常見(jiàn)類(lèi)別。

舉一個(gè)簡(jiǎn)單的例子,考慮這樣一個(gè)任務(wù):通過(guò)性別來(lái)分類(lèi)貓和狗。這個(gè)任務(wù)看起來(lái)是無(wú)法完成的,因?yàn)槲覀冎佬詣e在貓和狗上是均勻分布的。無(wú)論貓還是狗,都有50%的可能性是雌性和50%的可能性是雄性,因此只靠性別我們無(wú)法區(qū)別貓和狗。

有趣的是,當(dāng)我們的訓(xùn)練數(shù)據(jù)是類(lèi)別不平衡的時(shí),比如有90%的貓和10%的狗,我們的估計(jì)就會(huì)出現(xiàn)偏差:這時(shí)無(wú)論是雄性還是雌性,我們都會(huì)傾向于認(rèn)為它是一只貓。在這樣的訓(xùn)練數(shù)據(jù)上學(xué)習(xí)到的分類(lèi)器就會(huì)天然帶有對(duì)常見(jiàn)類(lèi)別的偏愛(ài)。

為了避免這個(gè)偏差,我們從多項(xiàng)分布的Exponential Family形式出發(fā)重新對(duì)Softmax進(jìn)行了推導(dǎo)并顯式考慮了標(biāo)簽分布遷移,得到了適合長(zhǎng)尾問(wèn)題的Balanced Softmax。同時(shí),我們發(fā)現(xiàn)Balanced Softmax可以近似地最小化長(zhǎng)尾設(shè)定下的泛化錯(cuò)誤上界。

為了分析Balanced Softmax的效果,我們將模型在測(cè)試集上預(yù)測(cè)的分?jǐn)?shù)在每個(gè)類(lèi)別上累加,用來(lái)計(jì)算模型預(yù)測(cè)的標(biāo)簽分布。理想情況下,模型在測(cè)試集上預(yù)測(cè)出的標(biāo)簽分布應(yīng)該是平衡的。在下圖中我們對(duì)不同模型的預(yù)測(cè)類(lèi)別進(jìn)行了可視化,類(lèi)別按照出現(xiàn)頻率降序排列,第0類(lèi)為出現(xiàn)次數(shù)最多的類(lèi)。我們發(fā)現(xiàn)藍(lán)色線(xiàn)代表的常規(guī)Softmax明顯地偏向于常見(jiàn)類(lèi)別,橙色線(xiàn)代表的Equalization Loss [1] 通過(guò)去除某閾值以下罕見(jiàn)類(lèi)別的負(fù)樣本梯度緩解了這一問(wèn)題,而紅色線(xiàn)代表的Balanced Softmax則進(jìn)一步達(dá)到了最平衡的預(yù)測(cè)類(lèi)別分布。

2. 元采樣器Meta Sampler

雖然我們得到了一個(gè)適合長(zhǎng)尾問(wèn)題的理想的優(yōu)化目標(biāo),優(yōu)化過(guò)程本身依然充滿(mǎn)挑戰(zhàn):罕見(jiàn)類(lèi)別只能在訓(xùn)練中出現(xiàn)極少次數(shù),因此無(wú)法很好地貢獻(xiàn)到訓(xùn)練梯度。解決這一問(wèn)題的最常見(jiàn)的方法是類(lèi)別均衡采樣 (CBS)[2],也就是對(duì)每個(gè)類(lèi)別采樣同樣數(shù)量的樣本來(lái)組成訓(xùn)練批次。然而,實(shí)驗(yàn)表明直接將Balanced Softmax與CBS一起使用會(huì)導(dǎo)致模型表現(xiàn)下降,于是我們對(duì)兩者一起使用時(shí)的梯度進(jìn)行了分析。在假設(shè)接近收斂時(shí),我們有:

理想情況下每個(gè)類(lèi)別的梯度的權(quán)重應(yīng)和類(lèi)別內(nèi)樣本數(shù)量成反比,但上式中的權(quán)重為和類(lèi)別內(nèi)樣本數(shù)量成平方反比。我們將這個(gè)現(xiàn)象稱(chēng)為過(guò)平衡問(wèn)題。

下圖展示了一個(gè)對(duì)過(guò)平衡問(wèn)題的可視化。這是一個(gè)類(lèi)別不平衡的二維數(shù)據(jù)三分類(lèi)問(wèn)題,三個(gè)類(lèi)別分別為紅、黃、藍(lán),樣本數(shù)量分別為10000、100和1??梢园l(fā)現(xiàn)Balanced Softmax和CBS一起使用時(shí),優(yōu)化過(guò)程會(huì)被藍(lán)色的罕見(jiàn)類(lèi)別主導(dǎo)。

為了解決過(guò)平衡問(wèn)題,我們提出了Meta Sampler(元采樣器),一種可學(xué)習(xí)版本的CBS。Meta Sampler使用元學(xué)習(xí)的方法,顯式地學(xué)習(xí)當(dāng)前最佳的采樣率,從而更好地配合Balanced Softmax的使用。

下圖展示了我們對(duì)不同模型預(yù)測(cè)的標(biāo)簽分布進(jìn)行的可視化。其中,紫色線(xiàn)代表的Balanced Softmax與CBS的組合由于過(guò)平衡問(wèn)題,明顯地偏向于尾部類(lèi)別。而紅色線(xiàn)代表的Balanced Softmax與Meta Sampler的組合則很好地解決了這一問(wèn)題,最終取得了最為均衡的標(biāo)簽分布。

實(shí)驗(yàn)結(jié)果

我們?cè)趫D像分類(lèi)(CIFAR-10/100-LT,ImageNet-LT,Places-LT)與實(shí)例分割(LVIS-v0.5)兩個(gè)任務(wù)上分別進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果顯示了Balanced Softmax和Meta Sampler對(duì)模型表現(xiàn)都有明顯的貢獻(xiàn)。兩者的組合,Balanced Meta-Softmax (BALMS),在這兩個(gè)任務(wù)上都達(dá)到或超過(guò)了SOTA結(jié)果,尤其在最具挑戰(zhàn)性的LVIS數(shù)據(jù)集上大幅超過(guò)了之前的SOTA結(jié)果。

這項(xiàng)研究也被收錄為ECCV LVIS workshop的Spotlight,關(guān)于LVSI-v1.0的相關(guān)實(shí)驗(yàn)結(jié)果可以在LVSI workshop主頁(yè)上找到(Team Innova)。

結(jié)語(yǔ)

BALMS對(duì)長(zhǎng)尾問(wèn)題下的概率建模以及采樣策略進(jìn)行了探討。我們發(fā)現(xiàn)常用的Softmax回歸在存在標(biāo)簽分布遷移時(shí)會(huì)出現(xiàn)估計(jì)偏差,并提出了Balanced Softmax來(lái)避免這個(gè)偏差。另一方面,我們發(fā)現(xiàn)類(lèi)別均衡采樣器在與Balanced Softmax一起使用時(shí)會(huì)導(dǎo)致過(guò)平衡問(wèn)題,于是提出元采樣器來(lái)顯式學(xué)習(xí)最優(yōu)采樣策略。我們的解決方案在長(zhǎng)尾圖像分類(lèi)與長(zhǎng)尾實(shí)例分割任務(wù)上均得到了驗(yàn)證。歡迎關(guān)注我們的開(kāi)源代碼庫(kù),希望BALMS可以成為未來(lái)長(zhǎng)尾學(xué)習(xí)的良好基線(xiàn)。

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淘寶搜索API:長(zhǎng)尾詞挖掘,SEO提升的利器!

    ? 在淘寶這個(gè)巨大的生態(tài)中,商品能否被買(mǎi)家精準(zhǔn)地搜索到,直接關(guān)系到店鋪的流量和轉(zhuǎn)化。而搜索優(yōu)化的核心之一,就是關(guān)鍵詞策略。除了競(jìng)爭(zhēng)激烈的頭部熱詞, 長(zhǎng)尾關(guān)鍵詞 往往蘊(yùn)含著巨大的潛力。它們搜索意圖明確
    的頭像 發(fā)表于 01-09 14:48 ?279次閱讀
    淘寶搜索API:<b class='flag-5'>長(zhǎng)尾</b>詞挖掘,SEO提升的利器!

    思奧特智能視覺(jué)側(cè)發(fā)光與平行面光源在視覺(jué)檢測(cè)中的創(chuàng)新

    檢測(cè)的應(yīng)用場(chǎng)景日益復(fù)雜,特殊檢測(cè)需求層出不窮: 空間緊湊環(huán)境需要超薄光源、透明物體表面劃痕和內(nèi)部異物檢測(cè)、大面積電路板電子元器件檢測(cè)、精密零件尺寸測(cè)量與邊緣破損檢測(cè),這些特殊場(chǎng)景對(duì)光源提出了更高要求,需要針對(duì)
    的頭像 發(fā)表于 11-17 14:30 ?373次閱讀

    機(jī)器視覺(jué)檢測(cè)PIN針

    : 結(jié)合形態(tài)學(xué)處理、特征提取(如長(zhǎng)寬比、面積)及深度學(xué)習(xí)(針對(duì)復(fù)雜缺陷),自動(dòng)檢出彎曲、斷裂、變形、污染等。輸出與控制:實(shí)時(shí)顯示檢測(cè)結(jié)果(OK/NG)及具體參數(shù)數(shù)值。生成檢測(cè)報(bào)告,支持數(shù)據(jù)追溯。NG品自動(dòng)剔除信號(hào)輸出,無(wú)縫對(duì)接產(chǎn)線(xiàn)。了解更多機(jī)器
    發(fā)表于 09-26 15:09

    NVIDIA助力元科技突破智能駕駛數(shù)據(jù)獲取與生成瓶頸

    蘇州元科技有限公司(以下簡(jiǎn)稱(chēng)“元科技”)是一家專(zhuān)注于三維重建與世界模型的科技公司,為自動(dòng)駕駛與具身智能提供高質(zhì)量、多樣化的訓(xùn)練數(shù)據(jù)。通過(guò)將自研的世界模型技術(shù)與 NVIDIA Cosmos 結(jié)合,實(shí)現(xiàn)真實(shí)物理世界的三維重建、場(chǎng)
    的頭像 發(fā)表于 09-06 15:16 ?1497次閱讀

    基于凌智視覺(jué)識(shí)別模塊的基于單目視覺(jué)的目標(biāo)物測(cè)量裝置

    1.視覺(jué)測(cè)量整體方案視覺(jué)測(cè)量系統(tǒng)采用單目視覺(jué)技術(shù)實(shí)現(xiàn)目標(biāo)物距離
    的頭像 發(fā)表于 07-31 15:35 ?993次閱讀
    基于凌智<b class='flag-5'>視覺(jué)</b><b class='flag-5'>識(shí)別</b>模塊的基于單目<b class='flag-5'>視覺(jué)</b>的目標(biāo)物測(cè)量裝置

    基于LockAI視覺(jué)識(shí)別模塊:C++人臉識(shí)別

    本文基于RV1106做成的LockAI視覺(jué)識(shí)別模塊,采用 LZ-Picodet 模型訓(xùn)練的人臉檢測(cè)模型 LZ-Face,以及ArcFace人臉識(shí)別模型,實(shí)現(xiàn)人臉識(shí)別系統(tǒng)。 源代碼:ht
    發(fā)表于 07-01 12:01

    基于LockAI視覺(jué)識(shí)別模塊:C++人臉識(shí)別

    本文基于RV1106做成的LockAI視覺(jué)識(shí)別模塊,采用LZ-Picodet模型訓(xùn)練的人臉檢測(cè)模型LZ-Face,以及ArcFace人臉識(shí)別模型,實(shí)現(xiàn)人臉識(shí)別系統(tǒng)。
    的頭像 發(fā)表于 07-01 10:09 ?871次閱讀
    基于LockAI<b class='flag-5'>視覺(jué)</b><b class='flag-5'>識(shí)別</b>模塊:C++人臉<b class='flag-5'>識(shí)別</b>

    基于LockAI視覺(jué)識(shí)別模塊:手寫(xiě)數(shù)字識(shí)別

    手寫(xiě)數(shù)字識(shí)別是一種經(jīng)典的模式識(shí)別和圖像處理問(wèn)題,旨在通過(guò)計(jì)算機(jī)自動(dòng)識(shí)別用戶(hù)手寫(xiě)的數(shù)字。 本文將教會(huì)你如何使用基于RV1106的 LockAI視覺(jué)識(shí)別
    發(fā)表于 06-30 16:45

    基于LockAI視覺(jué)識(shí)別模塊:手寫(xiě)數(shù)字識(shí)別

    手寫(xiě)數(shù)字識(shí)別是一種經(jīng)典的模式識(shí)別和圖像處理問(wèn)題,旨在通過(guò)計(jì)算機(jī)自動(dòng)識(shí)別用戶(hù)手寫(xiě)的數(shù)字。本文將教會(huì)你如何使用基于RV1106的LockAI視覺(jué)識(shí)別
    的頭像 發(fā)表于 06-30 15:44 ?1146次閱讀
    基于LockAI<b class='flag-5'>視覺(jué)</b><b class='flag-5'>識(shí)別</b>模塊:手寫(xiě)數(shù)字<b class='flag-5'>識(shí)別</b>

    中科慧眼亮相2025新加坡亞洲科技展

    近日,為期三天的ATx新加坡亞洲科技展盛大開(kāi)幕。作為汽車(chē)產(chǎn)業(yè)鏈領(lǐng)軍企業(yè),中科慧眼將本次參展作為開(kāi)拓東南亞市場(chǎng)的關(guān)鍵布局,攜雙目及三目立體視覺(jué)核心產(chǎn)品重磅亮相,不僅展示了覆蓋智能駕駛與智能底盤(pán)的前沿方案,更首次公開(kāi)了機(jī)器人
    的頭像 發(fā)表于 06-03 17:21 ?936次閱讀

    基于LockAI視覺(jué)識(shí)別模塊:C++條碼識(shí)別

    條碼識(shí)別視覺(jué)模塊經(jīng)常使用到的功能之一,經(jīng)常用于識(shí)別超市的貨物信息。本文我們將演示如何基于瑞芯微RV1106的LockAI視覺(jué)識(shí)別進(jìn)行條碼
    發(fā)表于 05-27 10:26

    基于LockAI視覺(jué)識(shí)別模塊:C++條碼識(shí)別

    條碼識(shí)別視覺(jué)模塊經(jīng)常使用到的功能之一,經(jīng)常用于識(shí)別超市的貨物信息。本文我們將演示如何基于瑞芯微RV1106的LockAI視覺(jué)識(shí)別進(jìn)行條碼
    的頭像 發(fā)表于 05-27 09:32 ?851次閱讀
    基于LockAI<b class='flag-5'>視覺(jué)</b><b class='flag-5'>識(shí)別</b>模塊:C++條碼<b class='flag-5'>識(shí)別</b>

    基于LockAI視覺(jué)識(shí)別模塊:C++二維碼識(shí)別

    二維碼識(shí)別視覺(jué)模塊經(jīng)常使用到的功能之一。我們將演示如何使用基于瑞芯微RV1106的LockAI視覺(jué)識(shí)別模塊進(jìn)行二維碼識(shí)別。
    的頭像 發(fā)表于 05-26 09:42 ?1041次閱讀
    基于LockAI<b class='flag-5'>視覺(jué)</b><b class='flag-5'>識(shí)別</b>模塊:C++二維碼<b class='flag-5'>識(shí)別</b>

    基于LockAI視覺(jué)識(shí)別模塊:C++使用圖像的統(tǒng)計(jì)信息

    在圖像處理中,統(tǒng)計(jì)信息可以幫助我們了解圖像的特性,例如區(qū)域內(nèi)的像素分布、顏色轉(zhuǎn)換以及特定區(qū)域的分析。本文將介紹基于LockAI視覺(jué)識(shí)別模塊如何提取興趣區(qū)域(ROI)、轉(zhuǎn)換顏色通道、計(jì)算均值和標(biāo)準(zhǔn)差,以及查找最小值和最大值,并通過(guò)
    的頭像 發(fā)表于 05-08 10:09 ?755次閱讀
    基于LockAI<b class='flag-5'>視覺(jué)</b><b class='flag-5'>識(shí)別</b>模塊:C++使用圖像的統(tǒng)計(jì)信息

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    視覺(jué)巡線(xiàn),展示了如何從數(shù)據(jù)采集、模型訓(xùn)練到機(jī)器人部署的完整流程。 值得注意的是,深度學(xué)習(xí)模型的實(shí)時(shí)性對(duì)機(jī)器人計(jì)算資源提出了較高要求,優(yōu)化模型(如TensorRT加速)是實(shí)際部署的關(guān)鍵。 二、SLAM
    發(fā)表于 05-03 19:41