91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新方法:用知識(shí)蒸餾給數(shù)據(jù)集瘦身

OpenCV學(xué)堂 ? 來(lái)源:量子位 ? 作者:量子位 ? 2022-07-10 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


	

這兩天,推特上一個(gè)任務(wù)懸賞火得一塌糊涂。

一家AI公司提供25萬(wàn)美金(折合人民幣約167萬(wàn)元),懸賞什么任務(wù)能讓模型越大、性能反而越差。

b24de934-fecc-11ec-ba43-dac502259ad0.png

評(píng)論區(qū)里已經(jīng)討論得熱火朝天了。

b267ad60-fecc-11ec-ba43-dac502259ad0.png

不過這事兒倒也不是單純整活,而是為了進(jìn)一步探索大模型。

畢竟,這兩年大家越發(fā)意識(shí)到,AI模型不能單純比“大”。

一方面,隨著模型的規(guī)模越來(lái)越大,訓(xùn)練付出的成本開始呈現(xiàn)指數(shù)型增長(zhǎng);

b2793e72-fecc-11ec-ba43-dac502259ad0.jpg

另一方面,模型性能的提升也已經(jīng)逐漸到達(dá)瓶頸期,哪怕想要讓誤差再下降1%,都需要更多的數(shù)據(jù)集增量和計(jì)算增量。

比如對(duì)于Transformer而言,交叉熵?fù)p失想要從3.4奈特降低到2.8奈特,就需要原本10倍量的訓(xùn)練數(shù)據(jù)。

針對(duì)這些問題,AI學(xué)者們已經(jīng)在從各種方向上找解決路子了。

Meta斯坦福的學(xué)者們,最近想到了從數(shù)據(jù)集上切入。

他們提出,對(duì)數(shù)據(jù)集進(jìn)行知識(shí)蒸餾,使得數(shù)據(jù)集規(guī)模雖小,但還能保持模型性能不下降。

實(shí)驗(yàn)驗(yàn)證,在剪掉ImageNet 20%的數(shù)據(jù)量后,ResNets表現(xiàn)和使用原本數(shù)據(jù)時(shí)的正確率相差不大。

研究人員表示,這也為AGI實(shí)現(xiàn)找出了一條新路子。

b2845424-fecc-11ec-ba43-dac502259ad0.png

超大數(shù)據(jù)集的效率并不高

本文提出的辦法,其實(shí)就是對(duì)原本的數(shù)據(jù)集進(jìn)行優(yōu)化精簡(jiǎn)。

研究人員表示,過去許多方法都表明,許多訓(xùn)練示例是高度冗余的,理論上可以把數(shù)據(jù)集“剪”得更小。

而且最近也有研究提出了一些指標(biāo),可以根據(jù)訓(xùn)練示例的難度或重要性對(duì)它們進(jìn)行排序,并通過保留其中一些難度高的示例,就能完成數(shù)據(jù)修剪。

基于前人的發(fā)現(xiàn)和研究,此次學(xué)者們進(jìn)一步提出了一些可具體操作的方法。

首先,他們提出了一種數(shù)據(jù)分析方法,可以讓模型只學(xué)習(xí)部分?jǐn)?shù)據(jù),就能實(shí)現(xiàn)同等的性能。

b2956eb2-fecc-11ec-ba43-dac502259ad0.png

通過數(shù)據(jù)分析,研究人員初步得出結(jié)論:

一個(gè)數(shù)據(jù)集怎樣修剪效果最好?這和它本身的規(guī)模有關(guān)。

初始數(shù)據(jù)量越多,越應(yīng)該保留難度高的示例;

初始數(shù)據(jù)量越少,則應(yīng)該保留難度低的示例。

b29f7cfe-fecc-11ec-ba43-dac502259ad0.png

而在保留困難示例進(jìn)行數(shù)據(jù)修剪后,模型和數(shù)據(jù)規(guī)模的對(duì)應(yīng)關(guān)系,可以打破冪律分布。

常被提起的二八定律就是基于冪律提出的。

即20%的數(shù)據(jù)會(huì)影響80%的結(jié)果。

同時(shí)在此情況下,還能找到一個(gè)處于帕累托最優(yōu)的下的極值。

這里所說的帕累托最優(yōu)是指資源分配的一種理想狀態(tài)。

它假設(shè)固定有一群人和可分配的資源,從一種分配狀態(tài)調(diào)整到另一種分配狀態(tài),在沒有使任何一個(gè)人變差的前提下,至少使得一個(gè)人變得更好。

在本文中,調(diào)整分配狀態(tài)即可理解為,修剪多少比例的數(shù)據(jù)集。

然后,研究人員進(jìn)行了實(shí)驗(yàn)來(lái)驗(yàn)證這一理論。

b2c326f4-fecc-11ec-ba43-dac502259ad0.png

從實(shí)驗(yàn)結(jié)果來(lái)看,當(dāng)數(shù)據(jù)集越大,修剪后的效果就越明顯。

在SVHN、CIFAR-10、ImageNet幾個(gè)數(shù)據(jù)集上,ResNet的錯(cuò)誤率總體和數(shù)據(jù)集修剪規(guī)模呈反比。

在ImageNet上可以看到,數(shù)據(jù)集規(guī)模保留80%的情況下,和原本數(shù)據(jù)集訓(xùn)練下的錯(cuò)誤率基本相同。

這一曲線也逼近了帕累托最優(yōu)。

接下來(lái),研究人員聚焦在ImageNet上,對(duì)10種不同情況進(jìn)行了大規(guī)模基準(zhǔn)測(cè)試。

結(jié)果表明,隨機(jī)修剪以及一些修剪指標(biāo),在ImageNet上的表現(xiàn)并不夠好。

b2d27fbe-fecc-11ec-ba43-dac502259ad0.png

所以更進(jìn)一步,研究人員還提出了一種自監(jiān)督方法來(lái)修剪數(shù)據(jù)。

也就是知識(shí)蒸餾(教師學(xué)生模型),這是模型壓縮的一種常見方法。

b2e464fe-fecc-11ec-ba43-dac502259ad0.png

結(jié)果顯示,在自監(jiān)督方法下,它在找數(shù)據(jù)集中簡(jiǎn)單/困難示例上的表現(xiàn)都還不錯(cuò)。

b2f3c05c-fecc-11ec-ba43-dac502259ad0.png

使用自監(jiān)督方法修剪數(shù)據(jù)后,正確率明顯提高(圖C中淺藍(lán)色線)。

b308ec34-fecc-11ec-ba43-dac502259ad0.png

還存在一些問題

不過在論文中,研究人員也提到,雖然通過如上方法可以在不犧牲性能的情況下修剪數(shù)據(jù)集,但是有些問題仍舊值得關(guān)注。

比如數(shù)據(jù)集縮小后,想要訓(xùn)練出同等性能的模型,需要的時(shí)間可能會(huì)更長(zhǎng)。

因此,在進(jìn)行數(shù)據(jù)集修剪時(shí),應(yīng)該平衡縮減規(guī)模和訓(xùn)練增長(zhǎng)時(shí)間兩方面因素。

與此同時(shí),對(duì)數(shù)據(jù)集進(jìn)行修剪,勢(shì)必會(huì)喪失一些群體的樣本,由此也可能造成模型在某一個(gè)方面出現(xiàn)弊端。

在這方面會(huì)容易引起道德倫理方面的問題。

研究團(tuán)隊(duì)

本文作者之一Surya Ganguli,是量子神經(jīng)網(wǎng)絡(luò)科學(xué)家。

論文地址: https://arxiv.org/abs/2206.14486

審核編輯 :李倩
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107869
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39911

    瀏覽量

    301545
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26208

原文標(biāo)題:剪掉ImageNet 20%數(shù)據(jù)量,模型性能不下降!Meta斯坦福等提出新方法,用知識(shí)蒸餾給數(shù)據(jù)集瘦身

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    用于窄帶匹配高速射頻ADC的全新方法

    本期,為大家?guī)?lái)的是《用于窄帶匹配高速射頻 ADC 的全新方法》,介紹了一種用于窄帶匹配高速射頻 ADC 的全新方法,以解決高中間頻率系統(tǒng)中 ADC 前端窄帶匹配的設(shè)計(jì)難題,可在 ADC 額定帶寬內(nèi)應(yīng)用,能提升 ADC 性能、減少模擬停機(jī)時(shí)間。
    的頭像 發(fā)表于 01-04 15:56 ?6408次閱讀
    用于窄帶匹配高速射頻ADC的全<b class='flag-5'>新方法</b>

    奧松電子榮獲2025年中國(guó)創(chuàng)新方法大賽全國(guó)總決賽二等獎(jiǎng)

    2025年11月18日-21日,2025年中國(guó)創(chuàng)新方法大賽總決賽在山東省泰安市成功舉辦。國(guó)內(nèi)MEMS智能傳感器與半導(dǎo)體關(guān)鍵零部件領(lǐng)域的國(guó)家級(jí)專精特新“小巨人”企業(yè)——廣州奧松電子股份有限公司,憑借
    的頭像 發(fā)表于 12-05 15:17 ?627次閱讀

    ??低晿s獲2025年中國(guó)創(chuàng)新方法大賽總決賽金獎(jiǎng)

    近日,2025年中國(guó)創(chuàng)新方法大賽圓滿落幕。??低晳{借《工業(yè)聽診師——超長(zhǎng)距離皮帶運(yùn)輸機(jī)托輥聲紋監(jiān)測(cè)系統(tǒng)》項(xiàng)目脫穎而出,斬獲全國(guó)總決賽唯一金獎(jiǎng)。
    的頭像 發(fā)表于 12-04 10:55 ?517次閱讀

    奧松半導(dǎo)體榮獲2025中國(guó)創(chuàng)新方法大賽重慶賽區(qū)二等獎(jiǎng)

    近日,2025年中國(guó)創(chuàng)新方法大賽(重慶賽區(qū))暨第八屆重慶市創(chuàng)新方法大賽圓滿落幕。本屆大賽以“培育創(chuàng)新人才,服務(wù)產(chǎn)業(yè)發(fā)展”為主題,旨在激發(fā)企業(yè)創(chuàng)新活力,推動(dòng)科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合。大賽由重慶市科協(xié)
    的頭像 發(fā)表于 11-19 11:34 ?862次閱讀
    奧松半導(dǎo)體榮獲2025中國(guó)創(chuàng)<b class='flag-5'>新方法</b>大賽重慶賽區(qū)二等獎(jiǎng)

    奧松兩項(xiàng)創(chuàng)新技術(shù)榮獲2025中國(guó)創(chuàng)新方法大賽廣東賽區(qū)一等獎(jiǎng)

    近日,在2025年中國(guó)創(chuàng)新方法大賽廣東區(qū)域賽中,廣州奧松電子股份有限公司的《基于TRIZ的新一代氣體質(zhì)量流量控制器》與旗下子公司廣州奧坤科技有限公司的《TRIZ驅(qū)動(dòng)的智能終端全生命周期運(yùn)維創(chuàng)新》兩個(gè)
    的頭像 發(fā)表于 10-30 18:58 ?763次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    、Transformer 模型的后繼者 二、創(chuàng)新方法實(shí)現(xiàn)深度學(xué)習(xí)AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令架構(gòu)(ISA)。優(yōu)勢(shì)如下: ①模塊化特性②標(biāo)準(zhǔn)接口③開源
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    、集成芯片、分子器件與分子憶阻器,以及打印類腦芯片等。 第五章至第八章分別探討化學(xué)或生物方法實(shí)現(xiàn)AI、AI在科學(xué)發(fā)現(xiàn)中創(chuàng)新應(yīng)用、實(shí)現(xiàn)神經(jīng)形態(tài)計(jì)算與類腦芯片的創(chuàng)新方法,以及具身智能芯片。 第九章
    發(fā)表于 09-05 15:10

    芯片制造中高精度膜厚測(cè)量與校準(zhǔn):基于紅外干涉技術(shù)的新方法

    、環(huán)境光干擾及薄膜傾斜等因素限制,測(cè)量精度難以滿足高精度工業(yè)需求。為此,本研究提出一種融合紅外干涉與激光校準(zhǔn)的薄膜厚度測(cè)量新方法,旨在突破傳統(tǒng)技術(shù)瓶頸,實(shí)現(xiàn)更精準(zhǔn)、
    的頭像 發(fā)表于 07-21 18:17 ?2911次閱讀
    芯片制造中高精度膜厚測(cè)量與校準(zhǔn):基于紅外干涉技術(shù)的<b class='flag-5'>新方法</b>

    熔池監(jiān)測(cè)的創(chuàng)新方法

    先進(jìn)監(jiān)控技術(shù),如熱成像和機(jī)器視覺,提升焊接工藝精度,實(shí)現(xiàn)對(duì)熔池、焊縫等特征的精準(zhǔn)分析與跟蹤。
    的頭像 發(fā)表于 07-18 09:49 ?583次閱讀
    熔池監(jiān)測(cè)的創(chuàng)<b class='flag-5'>新方法</b>

    高光譜成像技術(shù):植物“看病”的新“眼睛”——作物病蟲害監(jiān)測(cè)新方法

    想象一下,不用走到田里一片片葉子檢查,也不用等作物明顯枯萎了才發(fā)現(xiàn)問題,而是通過“看”作物反射的光線,就能早期發(fā)現(xiàn)它是不是生病或長(zhǎng)蟲了。這就是 光譜技術(shù)在作物病蟲害監(jiān)測(cè) 上的神奇應(yīng)用!它就像植物
    的頭像 發(fā)表于 07-11 17:39 ?1049次閱讀
    高光譜成像技術(shù):<b class='flag-5'>給</b>植物“看病”的新“眼睛”——作物病蟲害監(jiān)測(cè)<b class='flag-5'>新方法</b>

    無(wú)刷直流電機(jī)轉(zhuǎn)矩脈動(dòng)抑制新方法

    轉(zhuǎn)矩脈動(dòng)是影響無(wú)劇直流電機(jī)在高精度伺服系統(tǒng)中應(yīng)用的主要原因。提出了一種基于a-p變換和Lyapunov函數(shù)的轉(zhuǎn)矩脈動(dòng)抑制直接功率控制方法。該方法在a-β坐標(biāo)系下通過功率控制優(yōu)化了電磁有功功率和電磁
    發(fā)表于 07-09 14:12

    無(wú)刷直流電機(jī)滑模觀測(cè)器參數(shù)優(yōu)化設(shè)計(jì)方法

    摘要:滑模反電勢(shì)觀測(cè)器的增益參數(shù)會(huì)影響觀測(cè)器的收斂速度以及動(dòng)態(tài)響應(yīng)性能,常見的設(shè)計(jì)方法是基于觀測(cè)器穩(wěn)定性理論進(jìn)行設(shè)計(jì)。提出一種利用遺傳算法在穩(wěn)定域內(nèi)搜索觀測(cè)誤差最小的增益參數(shù)的新方法,既減少了參數(shù)
    發(fā)表于 06-27 16:48

    無(wú)刷直流電機(jī)反電勢(shì)過零檢測(cè)新方法

    新方法。在三相采樣等效電路上分別并聯(lián)一組三極管控制的電阻分壓開關(guān)電路,參考電機(jī)轉(zhuǎn)速線性調(diào)節(jié)控制信號(hào)占空比,以此控制三極管通斷,從而調(diào)節(jié)電阻分樂開關(guān)電路阻值,可以避免高速時(shí)反電勢(shì)幅值高于檢測(cè)電路供電電壓
    發(fā)表于 06-26 13:50

    使用AICube導(dǎo)入數(shù)據(jù)點(diǎn)創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯(cuò)誤日志** 但是使用示例的數(shù)據(jù)可以完成訓(xùn)練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04