91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PEMN:參數(shù)集約型掩碼網(wǎng)絡(luò)

CVer ? 來(lái)源:CVer ? 作者:CVer ? 2022-12-15 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NeurIPS 2022 | Parameter-Efficient Masking Networks,美國(guó)東北大學(xué),羅切斯特理工等,提出參數(shù)集約型掩碼網(wǎng)絡(luò),探索有限數(shù)量隨機(jī)數(shù)的表征能力并提升神經(jīng)網(wǎng)絡(luò)儲(chǔ)存和傳輸效率。

為了處理更復(fù)雜的任務(wù),近年來(lái)神經(jīng)網(wǎng)絡(luò)的規(guī)模也在不斷變大,如何高效的儲(chǔ)存和傳輸神經(jīng)網(wǎng)絡(luò)變得十分重要。另一方面,隨著彩票假說(shuō)(Lottery Ticket Hypothesis (LTH))的提出,隨機(jī)稀疏神經(jīng)網(wǎng)絡(luò)最近展現(xiàn)出很強(qiáng)的潛力,如何利用這種潛力來(lái)提高網(wǎng)絡(luò)的存儲(chǔ)和傳輸效率也很值得探索。

來(lái)自美國(guó)東北大學(xué)和羅切斯特理工的研究者提出參數(shù)集約型掩碼網(wǎng)絡(luò)(Parameter-Efficient Masking Networks (PEMN))。作者首先探索了有限數(shù)量隨機(jī)數(shù)生成的隨機(jī)網(wǎng)絡(luò)的表征能力。實(shí)驗(yàn)表明,即使網(wǎng)絡(luò)由有限數(shù)量的隨機(jī)數(shù)生成,通過(guò)選擇不同的子網(wǎng)絡(luò)結(jié)構(gòu),其依然具有很好的表征能力。通過(guò)這種探索性實(shí)驗(yàn),作者自然地提出使用一組有限數(shù)量隨機(jī)數(shù)作為prototype,結(jié)合一組mask來(lái)表達(dá)一個(gè)神經(jīng)網(wǎng)絡(luò)。因?yàn)橛邢迶?shù)量的隨機(jī)數(shù)和二值的mask占用很少的儲(chǔ)存空間,作者以此來(lái)提出一種新的思路來(lái)進(jìn)行網(wǎng)絡(luò)壓縮。文章已被NeurIPS 2022 接受。代碼已開(kāi)源。

1a33b5fe-7c3d-11ed-8abf-dac502259ad0.png

Parameter-Efficient Masking Networks

論文地址: https://arxiv.org/abs/2210.06699

論文代碼: https://github.com/yueb17/PEMN

1. 相關(guān)研究

MIT研究人員提出彩票假說(shuō) Lottery Ticket Hypothesis (ICLR’19):在一個(gè)隨機(jī)初始化網(wǎng)絡(luò)中,存在一個(gè)彩票子網(wǎng)絡(luò)(winning ticket)在被單獨(dú)訓(xùn)練的情況下達(dá)到很好的效果。彩票假說(shuō)探索了隨機(jī)稀疏網(wǎng)絡(luò)的可訓(xùn)練性。Uber研究人員提出Supermask (NeurIPS’19):在一個(gè)隨機(jī)初始化網(wǎng)絡(luò)中,存在一個(gè)子網(wǎng)絡(luò),可以直接用來(lái)做推斷而不需要訓(xùn)練。Supermask探索了隨機(jī)稀疏網(wǎng)絡(luò)的可用性。華盛頓大學(xué)研究人員提出Edge-Popup (CVPR’20):通過(guò)反向傳播學(xué)習(xí)子網(wǎng)絡(luò)的mask,大幅提升了隨機(jī)稀疏網(wǎng)絡(luò)的可用性。

2. 研究動(dòng)機(jī)/流程

以上相關(guān)研究從不同角度探索了隨機(jī)稀疏網(wǎng)絡(luò)的潛力,如可訓(xùn)練性和可用性,其中可用性也可以理解為表征能力。在此工作中,作者感興趣的是由隨機(jī)數(shù)生成的神經(jīng)網(wǎng)絡(luò)在不訓(xùn)練權(quán)重的情況下有多強(qiáng)的表征能力。隨著對(duì)該問(wèn)題的探索,作者提出了Parameter-Efficient Masking Networks (PEMN)。自然地,作者運(yùn)用PEMN為網(wǎng)絡(luò)壓縮提供了一種新的思路,并作為一個(gè)例子對(duì)PEMN的潛在應(yīng)用場(chǎng)景進(jìn)行探索。

3. 探索隨機(jī)數(shù)構(gòu)成的神經(jīng)網(wǎng)絡(luò)的表征能力

給定一個(gè)隨機(jī)網(wǎng)絡(luò),作者選擇Edge-Popup算法在其中選擇子網(wǎng)絡(luò)來(lái)探索其表征能力。不同的是,相對(duì)于對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行隨機(jī)初始化,作者提出了三種參數(shù)集約型的網(wǎng)絡(luò)生成策略來(lái)使用一個(gè)prototype構(gòu)建隨機(jī)網(wǎng)絡(luò)。

One-layer: 選擇網(wǎng)絡(luò)中重復(fù)結(jié)構(gòu)的權(quán)重作為prototype來(lái)填充其他的與之結(jié)構(gòu)相同的網(wǎng)絡(luò)層。

Max-layer padding (MP): 選擇參數(shù)量最多的網(wǎng)絡(luò)層作為prototype并且截?cái)嘞鄳?yīng)的參數(shù)量來(lái)填充其他網(wǎng)絡(luò)層。

Random vector padding (RP): 選擇一定長(zhǎng)度的隨機(jī)向量作為prototype并對(duì)其進(jìn)行復(fù)制來(lái)填充整個(gè)網(wǎng)絡(luò)。

1a5d0a6c-7c3d-11ed-8abf-dac502259ad0.png

三種不同的隨機(jī)網(wǎng)絡(luò)生成策略把網(wǎng)絡(luò)中不重復(fù)參數(shù)值(unique values)的數(shù)量逐步變小,我們基于不同策略得到的隨機(jī)網(wǎng)絡(luò)來(lái)選擇子網(wǎng)絡(luò),從而探索了有限數(shù)量隨機(jī)數(shù)生成的隨機(jī)網(wǎng)絡(luò)的表征潛力。

1a86ae1c-7c3d-11ed-8abf-dac502259ad0.png

上圖展示了使用ConvMixer 和 ViT 網(wǎng)絡(luò)CIFAR10圖像分類(lèi)的實(shí)驗(yàn)結(jié)果。Y軸為準(zhǔn)確率,X軸為使用不同策略得到的隨機(jī)網(wǎng)絡(luò)。隨之X軸的變大,隨機(jī)網(wǎng)絡(luò)中不重復(fù)隨機(jī)數(shù)數(shù)量逐漸變小 (RP后的數(shù)字表示相比較于MP,RP中不重復(fù)隨機(jī)數(shù)數(shù)量的比例)。根據(jù)實(shí)驗(yàn)結(jié)果,我們觀察到即使隨機(jī)網(wǎng)絡(luò)只有非常有限的不重復(fù)隨機(jī)數(shù)(比如PR_1e-3),依然可以很好的維持選擇出來(lái)的子網(wǎng)絡(luò)的表征能力。至此,作者通過(guò)不同的隨機(jī)網(wǎng)絡(luò)生成策略,探索了有限數(shù)量隨機(jī)數(shù)構(gòu)成的神經(jīng)網(wǎng)絡(luò)的表征能力并觀察到即使不重復(fù)隨機(jī)數(shù)非常有限,其對(duì)應(yīng)的隨機(jī)網(wǎng)絡(luò)依然可以很好地對(duì)數(shù)據(jù)進(jìn)行表征。同時(shí)作者基于這些隨機(jī)網(wǎng)絡(luò)生成策略,結(jié)合所得到的子網(wǎng)絡(luò)掩碼,提出了Parameter-Efficient Masking Networks(PEMN)這種新的神經(jīng)網(wǎng)絡(luò)類(lèi)型。

4. 一種新的網(wǎng)絡(luò)壓縮思路

本文選擇了神經(jīng)網(wǎng)路壓縮為例來(lái)拓展PEMN的潛在應(yīng)用。具體來(lái)說(shuō),文中所提出的不同隨機(jī)網(wǎng)絡(luò)生成策略可以高效的使用prototype來(lái)代表完整的隨機(jī)網(wǎng)絡(luò),尤其是最細(xì)粒度的random vector padding (RP)策略。作者使用RP策略中的隨機(jī)向量prototype和與之對(duì)應(yīng)的一組子網(wǎng)絡(luò)掩碼來(lái)表示一個(gè)隨機(jī)網(wǎng)絡(luò)。在其中prototype需要保存浮點(diǎn)數(shù)格式,而掩碼只需要保存成二值格式。因?yàn)镽P中的prototype長(zhǎng)度可以很短(因?yàn)橛邢迶?shù)量的不重復(fù)隨機(jī)數(shù)仍有很強(qiáng)的表征能力),所以表示一個(gè)神經(jīng)網(wǎng)絡(luò)的開(kāi)銷(xiāo)會(huì)變得很小,即儲(chǔ)存一個(gè)長(zhǎng)度有限的浮點(diǎn)數(shù)格式的隨機(jī)向量和一組二值格式的掩碼。相比較于傳統(tǒng)的稀疏網(wǎng)絡(luò)儲(chǔ)存子網(wǎng)絡(luò)的浮點(diǎn)值,本文提出了一種新的網(wǎng)絡(luò)壓縮思路用來(lái)高效的儲(chǔ)存和傳輸神經(jīng)網(wǎng)絡(luò)。

1aa0ec96-7c3d-11ed-8abf-dac502259ad0.png

在上圖中,作者使用PEMN對(duì)網(wǎng)絡(luò)進(jìn)行壓縮并與傳統(tǒng)的網(wǎng)絡(luò)剪枝方法進(jìn)行對(duì)比。實(shí)驗(yàn)使用ResNet網(wǎng)絡(luò)在CIFAR數(shù)據(jù)集做圖像分類(lèi)任務(wù)。我們觀察到,新的壓縮方案表現(xiàn)普遍優(yōu)于傳統(tǒng)的網(wǎng)絡(luò)剪枝,尤其是在很高的壓縮率下,PEMN仍然可以維持較好的準(zhǔn)確率。

5. 結(jié)論

本文受近來(lái)隨機(jī)網(wǎng)絡(luò)展現(xiàn)出來(lái)的潛力所啟發(fā),提出不同種參數(shù)集約策略來(lái)構(gòu)建隨機(jī)神經(jīng)網(wǎng)絡(luò),進(jìn)而探索了在只有有限的不重復(fù)隨機(jī)數(shù)的情況下所生成的隨機(jī)神經(jīng)網(wǎng)絡(luò)的表征潛力,并提出參數(shù)集約型掩碼網(wǎng)絡(luò)Parameter-Efficient Masking Networks (PEMN)。作者將PEMN應(yīng)用到網(wǎng)絡(luò)壓縮的場(chǎng)景中探索了其在實(shí)際應(yīng)用方面的潛力并且為網(wǎng)絡(luò)壓縮提供了一種新的思路。作者提供了廣泛的實(shí)驗(yàn),表明了即使隨機(jī)網(wǎng)絡(luò)中只有非常有限的不重復(fù)隨機(jī)數(shù),通過(guò)子網(wǎng)絡(luò)的選擇,其依然有較好的表征能力。此外,相比較于傳統(tǒng)剪枝算法,實(shí)驗(yàn)表明新提出的方法可以取得更好的網(wǎng)絡(luò)壓縮效果,驗(yàn)證了PEMN在該場(chǎng)景下的應(yīng)用潛力。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107879
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4785

    瀏覽量

    98116

原文標(biāo)題:NeurIPS 2022 | PEMN:參數(shù)集約型掩碼網(wǎng)絡(luò)

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    電壓驅(qū)動(dòng)PHY vs. 電流驅(qū)動(dòng)PHY:如何正確連接網(wǎng)絡(luò)變壓器?

    的疑問(wèn)。本文將圍繞電壓驅(qū)動(dòng)PHY和電流驅(qū)動(dòng)PHY,解析其與網(wǎng)絡(luò)變壓器的連接差異,幫助大家在設(shè)計(jì)中避免常見(jiàn)誤區(qū)。
    的頭像 發(fā)表于 01-20 18:15 ?310次閱讀
    電壓驅(qū)動(dòng)<b class='flag-5'>型</b>PHY vs. 電流驅(qū)動(dòng)<b class='flag-5'>型</b>PHY:如何正確連接<b class='flag-5'>網(wǎng)絡(luò)</b>變壓器?

    Vlan、三層交換機(jī)、網(wǎng)關(guān)、DNS、子網(wǎng)掩碼、MAC地址等網(wǎng)絡(luò)知識(shí)

    我們現(xiàn)在做的弱電工程,經(jīng)常用到網(wǎng)絡(luò)知識(shí),比如vlan、三層交換機(jī)、網(wǎng)關(guān)、DNS、子網(wǎng)掩碼、MAC地址等方面的知識(shí),作為從業(yè)人員,我們對(duì)這些知識(shí)了解并熟知的。 正文: 一、什么是VLAN VLAN中文
    的頭像 發(fā)表于 12-18 10:16 ?381次閱讀
    Vlan、三層交換機(jī)、網(wǎng)關(guān)、DNS、子網(wǎng)<b class='flag-5'>掩碼</b>、MAC地址等<b class='flag-5'>網(wǎng)絡(luò)</b>知識(shí)

    讀懂高效通信的星組網(wǎng)

    一、什么是星組網(wǎng)?一種網(wǎng)絡(luò)拓?fù)?,所有設(shè)備直接連接至一個(gè)中心節(jié)點(diǎn),形成“中心發(fā)散”的星形結(jié)構(gòu),實(shí)現(xiàn)集中管理、高效通信。二、三大核心特點(diǎn)1.高可靠易維護(hù)節(jié)點(diǎn)獨(dú)立連接,單點(diǎn)故障不影響全網(wǎng);中心化管理,運(yùn)
    發(fā)表于 12-09 14:17

    緊湊網(wǎng)絡(luò)運(yùn)動(dòng)控制卡ECI1808/ECI1A08

    緊湊網(wǎng)絡(luò)運(yùn)動(dòng)控制卡ECI1808/ECI1A08
    的頭像 發(fā)表于 11-28 11:17 ?774次閱讀
    緊湊<b class='flag-5'>型</b><b class='flag-5'>網(wǎng)絡(luò)</b>運(yùn)動(dòng)控制卡ECI1808/ECI1A08

    網(wǎng)絡(luò)接口:數(shù)字世界的“門(mén)鈴”,你了解多少?

    。要把計(jì)算機(jī)接入互聯(lián)網(wǎng),需要配置四個(gè)關(guān)鍵要素:IP地址、子網(wǎng)掩碼、網(wǎng)關(guān)地址和DNS服務(wù)器地址。 IP地址就像是網(wǎng)絡(luò)世界的“家庭地址”,能唯一標(biāo)識(shí)網(wǎng)絡(luò)中的每臺(tái)計(jì)算機(jī);網(wǎng)關(guān)則是子網(wǎng)與外界通信的“關(guān)口”;而
    發(fā)表于 11-26 18:53

    智慧供熱物聯(lián)網(wǎng)數(shù)字化改造方案

    近年來(lái),越來(lái)越多企業(yè)加快供熱生產(chǎn)管理信息化、自動(dòng)化、智慧化步伐,通過(guò)提高自動(dòng)化水平與管理效率,實(shí)現(xiàn)了供熱運(yùn)行管理模式由粗放集約型、智能化、精細(xì)化的轉(zhuǎn)變。 某大型供熱企業(yè)擔(dān)負(fù)該地集中供熱、供熱設(shè)施
    的頭像 發(fā)表于 11-18 13:47 ?462次閱讀
    智慧供熱物聯(lián)網(wǎng)數(shù)字化改造方案

    廣州郵科管理匯聚光纖交換機(jī):企業(yè)網(wǎng)絡(luò)升級(jí)的“智慧引擎”

    升級(jí)戰(zhàn)中, 廣州郵科管理匯聚光纖交換機(jī) 憑借其“高帶寬、低延遲、強(qiáng)管理”的特性,成為眾多企業(yè)網(wǎng)絡(luò)架構(gòu)中的“智慧引擎”。 為什么企業(yè)需要管理匯聚交換機(jī)? 傳統(tǒng)非管理交換機(jī)如同“傻瓜
    的頭像 發(fā)表于 10-20 10:00 ?547次閱讀
    廣州郵科管理<b class='flag-5'>型</b>匯聚光纖交換機(jī):企業(yè)<b class='flag-5'>網(wǎng)絡(luò)</b>升級(jí)的“智慧引擎”

    飛凌嵌入式ElfBoard-Linux系統(tǒng)基礎(chǔ)入門(mén)-網(wǎng)絡(luò)相關(guān)shell命令之網(wǎng)絡(luò)基礎(chǔ)知識(shí)

    網(wǎng)絡(luò)地址 (二)主機(jī)號(hào)全為1的IP地址,不分配給任何主機(jī),僅用作廣播地址 (三)IP地址127.0.0.1為回環(huán)結(jié)構(gòu),用于本地進(jìn)行軟件測(cè)試 4.子網(wǎng)掩碼 子網(wǎng)掩碼是一個(gè)32位的二進(jìn)制地址,用來(lái)屏蔽原來(lái)
    發(fā)表于 10-09 09:30

    管理 vs 非管理,工業(yè)網(wǎng)絡(luò)如何選擇以太網(wǎng)交換機(jī)?

    在工業(yè)網(wǎng)絡(luò)建設(shè)中,很多人會(huì)糾結(jié)該選管理還是非管理交換機(jī)。非管理交換機(jī)即插即用、價(jià)格實(shí)惠,適合小型場(chǎng)景;而管理交換機(jī)功能強(qiáng)大,可監(jiān)控、
    的頭像 發(fā)表于 08-25 15:37 ?782次閱讀
    管理<b class='flag-5'>型</b> vs 非管理<b class='flag-5'>型</b>,工業(yè)<b class='flag-5'>網(wǎng)絡(luò)</b>如何選擇以太網(wǎng)交換機(jī)?

    Linux系統(tǒng)中網(wǎng)絡(luò)配置詳解

    網(wǎng)絡(luò)配置是Linux系統(tǒng)運(yùn)維中的核心技能之一。正確理解和配置子網(wǎng)掩碼、網(wǎng)關(guān)等網(wǎng)絡(luò)參數(shù),直接影響系統(tǒng)的網(wǎng)絡(luò)連通性和性能。本文將深入探討Linu
    的頭像 發(fā)表于 07-17 11:01 ?1222次閱讀

    飛凌嵌入式ElfBoard ELF 1板卡-文件系統(tǒng)之配置網(wǎng)絡(luò)參數(shù)

    我們可以在系統(tǒng)啟動(dòng)之后,通過(guò)ifconfig命令配置網(wǎng)絡(luò)參數(shù)。root@ELF1:~# ifconfig eth0 192.168.0.232root@ELF1:~# ifconfig eth0
    發(fā)表于 07-01 17:49

    ON Semiconductor MC14013BDTR2G 雙D觸發(fā)器參數(shù)特性 EDA模型 數(shù)據(jù)手冊(cè)

    ON Semiconductor MC14013BDTR2G 雙D觸發(fā)器參數(shù)特性 EDA模型 數(shù)據(jù)手冊(cè)
    的頭像 發(fā)表于 05-29 14:41 ?1484次閱讀
    ON Semiconductor MC14013BDTR2G  雙D<b class='flag-5'>型</b>觸發(fā)器<b class='flag-5'>參數(shù)</b>特性 EDA模型 數(shù)據(jù)手冊(cè)

    手把手教你如何調(diào)優(yōu)Linux網(wǎng)絡(luò)參數(shù)

    在高并發(fā)網(wǎng)絡(luò)服務(wù)場(chǎng)景中,Linux內(nèi)核的默認(rèn)網(wǎng)絡(luò)參數(shù)往往無(wú)法滿足需求,導(dǎo)致性能瓶頸、連接超時(shí)甚至服務(wù)崩潰。本文基于真實(shí)案例分析,從參數(shù)解讀、問(wèn)題診斷到優(yōu)化實(shí)踐,手把手教你如何調(diào)優(yōu)Lin
    的頭像 發(fā)表于 05-29 09:21 ?1000次閱讀

    愛(ài)立信如何構(gòu)建意圖驅(qū)動(dòng)自主網(wǎng)絡(luò)

    意圖驅(qū)動(dòng)服務(wù)編排與AI相互協(xié)同,正在徹底改變網(wǎng)絡(luò)和服務(wù)的管理方式。這種協(xié)同究竟會(huì)如何革新OSS服務(wù)管理方式?又將如何發(fā)掘自動(dòng)化和可編程網(wǎng)絡(luò)的全部潛能?
    的頭像 發(fā)表于 04-12 15:00 ?1.6w次閱讀
    愛(ài)立信如何構(gòu)建意圖驅(qū)動(dòng)<b class='flag-5'>型</b>自主<b class='flag-5'>網(wǎng)絡(luò)</b>

    關(guān)于三菱PLC的網(wǎng)絡(luò)通訊時(shí)的‘生存確認(rèn)’參數(shù)

    最近項(xiàng)目用到三菱PLC的網(wǎng)絡(luò)通訊,終于理解了PLC的以太網(wǎng)通訊時(shí),有個(gè)網(wǎng)絡(luò)端口生存確認(rèn),原來(lái)是一個(gè)非常重要的參數(shù)。 生成確認(rèn)決定了網(wǎng)絡(luò)參數(shù)
    發(fā)表于 03-31 11:26