91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MIT韓松等人團(tuán)隊(duì)開(kāi)發(fā)了一種高效的神經(jīng)結(jié)構(gòu)搜索算法

DPVg_AI_era ? 來(lái)源:lp ? 2019-03-29 08:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

MIT韓松等人團(tuán)隊(duì)開(kāi)發(fā)了一種高效的神經(jīng)結(jié)構(gòu)搜索算法,可以為在特定硬件上自動(dòng)設(shè)計(jì)快速運(yùn)行的神經(jīng)網(wǎng)絡(luò)提供一個(gè)“按鈕型”解決方案,算法設(shè)計(jì)和優(yōu)化的機(jī)器學(xué)習(xí)模型比傳統(tǒng)方法快200倍。

使用算法自動(dòng)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)是人工智能的一個(gè)新領(lǐng)域,而且算法設(shè)計(jì)的系統(tǒng)比人類(lèi)工程師開(kāi)發(fā)的系統(tǒng)更準(zhǔn)確、更高效。

但是這種所謂的神經(jīng)結(jié)構(gòu)搜索(NAS)技術(shù)在計(jì)算上非常昂貴。

谷歌最近開(kāi)發(fā)的最先進(jìn)的NAS算法,它可以在一組GPU上運(yùn)行,需要48000小時(shí)來(lái)生成一個(gè)用于圖像分類(lèi)和檢測(cè)任務(wù)的卷積神經(jīng)網(wǎng)絡(luò)。當(dāng)然了,谷歌擁有并行運(yùn)行數(shù)百個(gè)GPU和其他專(zhuān)用硬件的資金實(shí)力,但這對(duì)其他大部分人來(lái)說(shuō)是遙不可及的。

在5月份即將舉行的ICLR會(huì)議發(fā)表的一篇論文中,MIT的研究人員描述了一種NAS算法,僅需200小時(shí),可以專(zhuān)為目標(biāo)硬件平臺(tái)(當(dāng)在大規(guī)模圖像數(shù)據(jù)集上運(yùn)行時(shí))直接學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)。這可以使這類(lèi)算法得到更廣泛的使用。

論文:ProxylessNAS: 在目標(biāo)任務(wù)和硬件上直接搜索神經(jīng)架構(gòu)

地址:https://arxiv.org/pdf/1812.00332.pdf

研究人員表示,資源匱乏的研究人員和企業(yè)可以從節(jié)省時(shí)間和成本的算法中受益。論文作者之一、MIT電子工程與計(jì)算機(jī)科學(xué)助理教授、微系統(tǒng)技術(shù)實(shí)驗(yàn)室研究員韓松(Song Han)表示,他們的總體目標(biāo)是“AI民主化”。

MIT電子工程與計(jì)算機(jī)科學(xué)助理教授韓松

他說(shuō):“我們希望通過(guò)在特定硬件上快速運(yùn)行的一個(gè)’按鈕型’(push-button)的解決方案,讓AI專(zhuān)家和非專(zhuān)家都能夠高效地設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)架構(gòu)。”

韓松補(bǔ)充說(shuō),這樣的NAS算法永遠(yuǎn)不會(huì)取代人類(lèi)工程師?!澳康氖菧p輕設(shè)計(jì)和改進(jìn)神經(jīng)網(wǎng)絡(luò)架構(gòu)所帶來(lái)的重復(fù)和繁瑣的工作,”他說(shuō)。他的團(tuán)隊(duì)中的兩位研究人員Han Cai和Ligeng Zhu參與了論文。

ImageNet最高精度,計(jì)算成本降低200倍

在他們的工作中,研究人員開(kāi)發(fā)了一些方法來(lái)刪除不必要的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)組件,以縮短計(jì)算時(shí)間,并僅使用一小部分硬件內(nèi)存來(lái)運(yùn)行NAS算法。另一項(xiàng)創(chuàng)新確保每個(gè)輸出的CNN在特定的硬件平臺(tái)(CPU、GPU和移動(dòng)設(shè)備)上運(yùn)行得比傳統(tǒng)方法更高效。在測(cè)試中,研究人員用手機(jī)測(cè)得CNN運(yùn)行速度是傳統(tǒng)方法的1.8倍,準(zhǔn)確度與之相當(dāng)。

CNN的架構(gòu)由可調(diào)參的計(jì)算層(稱(chēng)為“過(guò)濾器”)和過(guò)濾器之間可能的連接組成。過(guò)濾器處理正方形網(wǎng)格形式的圖像像素,如3x3、5x5或7x7,每個(gè)過(guò)濾器覆蓋一個(gè)正方形。過(guò)濾器基本上是在圖像上移動(dòng)的,并將其覆蓋的像素網(wǎng)格的所有顏色合并成單個(gè)像素。不同的層可能具有不同大小的過(guò)濾器,并以不同的方式連接以共享數(shù)據(jù)。輸出是一個(gè)壓縮圖像——來(lái)自所有過(guò)濾器的組合信息——因此可以更容易地由計(jì)算機(jī)進(jìn)行分析。

由于可供選擇的架構(gòu)的數(shù)量——稱(chēng)為“搜索空間”——是如此之大,因此應(yīng)用NAS在大型圖像數(shù)據(jù)集上創(chuàng)建神經(jīng)網(wǎng)絡(luò)在計(jì)算上是令人望而卻步的。工程師們通常在較小的proxy數(shù)據(jù)集上運(yùn)行NAS,并將它們學(xué)到的CNN架構(gòu)轉(zhuǎn)移到目標(biāo)任務(wù)。然而,這種泛化方法降低了模型的精度。此外,相同的輸出架構(gòu)也適用于所有硬件平臺(tái),這造成了效率問(wèn)題。

研究人員直接在ImageNet數(shù)據(jù)集中的一個(gè)圖像分類(lèi)任務(wù)上訓(xùn)練并測(cè)試了他們的新NAS算法。他們首先創(chuàng)建了一個(gè)搜索空間,其中包含所有可能的CNN候選“路徑”(paths)——即層和過(guò)濾器連接以處理數(shù)據(jù)的方式。這使得NAS算法可以自由地找到最優(yōu)的架構(gòu)。

ProxylessNAS在ImageNet上達(dá)到最高精度,且搜索成本的GPU hours減少了200倍

通常,這意味著所有可能的路徑都必須存儲(chǔ)在內(nèi)存中,這將超過(guò)GPU的內(nèi)存限制。為了解決這個(gè)問(wèn)題,研究人員利用了一種稱(chēng)為“路徑級(jí)二值化”(path-level binarization)的技術(shù),這種技術(shù)一次只存儲(chǔ)一個(gè)采樣路徑,并節(jié)省了一個(gè)數(shù)量級(jí)的內(nèi)存消耗。他們將這種二值化與“path-level pruning”相結(jié)合,后者是一種傳統(tǒng)的技術(shù),可以在不影響輸出的情況下學(xué)習(xí)刪除神經(jīng)網(wǎng)絡(luò)中的哪些“神經(jīng)元”。然而,他們提出的新NAS算法并不是丟棄神經(jīng)元,而是修剪了整個(gè)路徑,這完全改變了神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。

ImageNet上精度和延遲的結(jié)果

在訓(xùn)練中,所有路徑最初都被賦予相同的選擇概率。然后,該算法跟蹤路徑——一次只存儲(chǔ)一個(gè)路徑——以記錄輸出的準(zhǔn)確性和損失(對(duì)錯(cuò)誤預(yù)測(cè)的數(shù)字懲罰)。然后,它調(diào)整路徑的概率,以?xún)?yōu)化精度和效率。最后,該算法修剪掉所有低概率路徑,只保留了概率最高的路徑——這就是最終的CNN架構(gòu)。

硬件感知:測(cè)試延遲只需一部手機(jī)

韓松表示,該研究另一個(gè)關(guān)鍵的創(chuàng)新是使NAS算法具備“硬件感知”(hardware-aware),這意味著它將每個(gè)硬件平臺(tái)上的延遲作為反饋信號(hào)來(lái)優(yōu)化架構(gòu)。

例如,為了測(cè)量移動(dòng)設(shè)備上的延遲,Google這樣的大公司會(huì)使用大量的移動(dòng)設(shè)備,這是非常昂貴的。相反,研究人員構(gòu)建了一個(gè)模型,只使用一部手機(jī)就能預(yù)測(cè)延遲。

不同硬件的延遲結(jié)果

對(duì)于網(wǎng)絡(luò)的每個(gè)所選層,算法都對(duì)該延遲預(yù)測(cè)模型的架構(gòu)進(jìn)行采樣。然后,使用這些信息來(lái)設(shè)計(jì)一個(gè)盡可能快地運(yùn)行的架構(gòu),同時(shí)實(shí)現(xiàn)高精度。在實(shí)驗(yàn)中,研究人員的CNN在移動(dòng)設(shè)備上的運(yùn)行速度幾乎是標(biāo)準(zhǔn)模型的兩倍。

針對(duì)不同硬件優(yōu)化的高效模型

韓松說(shuō),一個(gè)有趣的結(jié)果是,他們的NAS算法設(shè)計(jì)的CNN架構(gòu)長(zhǎng)期以來(lái)被認(rèn)為效率太低,但在研究人員的測(cè)試中,它們實(shí)際上針對(duì)特定的硬件進(jìn)行了優(yōu)化。

例如,工程師基本上已經(jīng)停止使用7x7過(guò)濾器,因?yàn)樗鼈兊挠?jì)算成本比多個(gè)更小的過(guò)濾器更昂貴。然而,研究人員的NAS算法發(fā)現(xiàn),具有部分7x7過(guò)濾器層的架構(gòu)在GPU上運(yùn)行得最快。這是因?yàn)镚PU具有高并行性——意味著它們可以同時(shí)進(jìn)行許多計(jì)算——所以一次處理一個(gè)大過(guò)濾器比一次處理多個(gè)小過(guò)濾器效率更高。

“這與人類(lèi)以前的思維方式背道而馳,”韓松說(shuō)?!八阉骺臻g越大,你能找到的未知事物就越多。你不知道是否會(huì)有比過(guò)去的人類(lèi)經(jīng)驗(yàn)更好的選擇。那就讓AI來(lái)解決吧?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:MIT華人助理教授新作:加快神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)自動(dòng)化的步伐

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握系列跨學(xué)科的技能,涵蓋數(shù)學(xué)基礎(chǔ)、編程能力、算法理論、工程實(shí)踐以及業(yè)務(wù)理解等多個(gè)方面。 以下是具體技能及學(xué)習(xí)建議: 線性代數(shù)核心內(nèi)容:矩陣運(yùn)算、特征值分解、向量空間等。應(yīng)用場(chǎng)
    發(fā)表于 02-27 10:53

    MIT團(tuán)隊(duì)提出一種垂直集成的BEOL堆疊架構(gòu)

    近期發(fā)現(xiàn),通過(guò)在傳統(tǒng)CMOS芯片的后端工藝(BEOL)層添加額外的有源器件層,可將原本僅用于布線的區(qū)域改造為兼具邏輯晶體管與存儲(chǔ)功能的垂直堆疊結(jié)構(gòu)。
    的頭像 發(fā)表于 01-16 12:59 ?786次閱讀
    <b class='flag-5'>MIT</b><b class='flag-5'>團(tuán)隊(duì)</b>提出<b class='flag-5'>一種</b>垂直集成的BEOL堆疊架構(gòu)

    Bamtone ICT系列:一種新型高效的離子污染測(cè)試儀?

    設(shè)計(jì)的款精密離子污染檢測(cè)儀器,被定位為一種新型高效的離子污染測(cè)試儀,代表了當(dāng)前PCBA離子污染檢測(cè)向自動(dòng)化、智能化和高效化發(fā)展的趨勢(shì),是國(guó)產(chǎn)替代高端進(jìn)口設(shè)備的
    的頭像 發(fā)表于 01-12 11:28 ?457次閱讀
    Bamtone ICT系列:<b class='flag-5'>一種</b>新型<b class='flag-5'>高效</b>的離子污染測(cè)試儀?

    線性搜索與二分搜索介紹

    搜索算法,搜索過(guò)程從數(shù)組的中間元素開(kāi)始,如果中間元素正好是要查找的元素,則搜索過(guò)程結(jié)束;如果某特定元素大于或者小于中間元素,則在數(shù)組大于或小于中間元素的那
    發(fā)表于 12-01 07:36

    京東拍立淘API開(kāi)發(fā)指南:從零開(kāi)始構(gòu)建圖像搜索應(yīng)用

    京東圖片識(shí)別搜索API(拍立淘)是基于深度學(xué)習(xí)的視覺(jué)搜索服務(wù),通過(guò)卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征向量,結(jié)合近似最近鄰搜索算法實(shí)現(xiàn)商品精準(zhǔn)匹配?。該技術(shù)解決了傳統(tǒng)文字
    的頭像 發(fā)表于 11-09 17:40 ?2210次閱讀

    突破“腦機(jī)接口”核心瓶頸!上海交大團(tuán)隊(duì)革新MEMS微電極陣列技術(shù)

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近日,上海交通大學(xué)電子信息與電氣工程學(xué)院劉景全教授團(tuán)隊(duì)在可植入式腦機(jī)接口(BCI)核心器件研發(fā)領(lǐng)域取得重大突破。該團(tuán)隊(duì)成功開(kāi)發(fā)一種基于陽(yáng)極鍵合技術(shù)的
    的頭像 發(fā)表于 11-02 11:58 ?3356次閱讀

    SM4算法實(shí)現(xiàn)分享(算法原理

    SM4分組加密算法采用的是非線性迭代結(jié)構(gòu),以字為單位進(jìn)行加密、解密運(yùn)算,每次迭代稱(chēng)為輪變換,每輪變換包括S盒變換、非線性變換、線性變換、合成變換。加解密算法與密鑰擴(kuò)展都是采用32輪非
    發(fā)表于 10-30 08:10

    SM4算法原理及分享1

    SM4算法一種分組密碼算法。其分組長(zhǎng)度為128bit,密鑰長(zhǎng)度也為128bit。加密算法與密鑰擴(kuò)展算法均采用32輪非線性迭代
    發(fā)表于 10-30 06:54

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的些經(jīng)驗(yàn)

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的些經(jīng)驗(yàn)。我們采用jupyter notebook作為開(kāi)發(fā)IDE,以TensorFlow2為訓(xùn)練框架,目標(biāo)是訓(xùn)練個(gè)手寫(xiě)數(shù)字識(shí)
    發(fā)表于 10-22 07:03

    液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)

    1.算法簡(jiǎn)介液態(tài)神經(jīng)網(wǎng)絡(luò)(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡(luò)架構(gòu),其設(shè)計(jì)理念借鑒自生物神經(jīng)系統(tǒng),特別是秀
    的頭像 發(fā)表于 09-28 10:03 ?1386次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)</b>網(wǎng)絡(luò)(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的<b class='flag-5'>神經(jīng)</b>網(wǎng)絡(luò)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+神經(jīng)形態(tài)計(jì)算、類(lèi)腦芯片

    : 基于JJ的超導(dǎo)神經(jīng)元和突觸: 2、半導(dǎo)體與超導(dǎo)體回合式神經(jīng)形態(tài)網(wǎng)絡(luò) 工作原理: 3、非超導(dǎo)低溫類(lèi)腦芯片 (知識(shí)盲區(qū)了) 4、低溫AI類(lèi)腦芯片的潛力 四、以樹(shù)突為中心的合成大腦 生物神經(jīng)元的樹(shù)突是
    發(fā)表于 09-17 16:43

    產(chǎn)品搜索與過(guò)濾API接口

    這些功能。本文將詳細(xì)介紹其原理、設(shè)計(jì)實(shí)現(xiàn)和實(shí)際應(yīng)用,幫助您逐步構(gòu)建可靠的API系統(tǒng)。 1. 什么是產(chǎn)品搜索與過(guò)濾API接口 產(chǎn)品搜索與過(guò)濾API接口是一種基于HTTP的接口,允許客戶(hù)端發(fā)送請(qǐng)求來(lái)查詢(xún)產(chǎn)品數(shù)據(jù),并根據(jù)特定條件篩選結(jié)
    的頭像 發(fā)表于 07-24 14:35 ?619次閱讀
    產(chǎn)品<b class='flag-5'>搜索</b>與過(guò)濾API接口

    Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    Nordic Semiconductor 于 2025 年收購(gòu)了 Neuton.AI,這是家專(zhuān)注于超小型機(jī)器學(xué)習(xí)(TinyML)解決方案的公司。 Neuton 開(kāi)發(fā)了一種獨(dú)特的神經(jīng)網(wǎng)
    發(fā)表于 06-28 14:18

    NVIDIA借助神經(jīng)渲染技術(shù)為物理AI開(kāi)發(fā)場(chǎng)景注入新活力

    DiffusionRenderer 引入了一種神經(jīng)渲染技術(shù),可用于創(chuàng)意領(lǐng)域的內(nèi)容生成和編輯,也可用于智能汽車(chē)和機(jī)器人開(kāi)發(fā)的合成數(shù)據(jù)生成。
    的頭像 發(fā)表于 06-16 14:41 ?999次閱讀

    設(shè)計(jì)優(yōu)先方法論實(shí)踐:SmartBear API Hub +ReadyAPI組合使用,構(gòu)建高效的API開(kāi)發(fā)

    設(shè)計(jì)優(yōu)先是一種在編寫(xiě)代碼和執(zhí)行測(cè)試之前,優(yōu)先設(shè)計(jì)API接口的開(kāi)發(fā)方式,能夠幫助提升團(tuán)隊(duì)協(xié)作效率、加快開(kāi)發(fā)進(jìn)度、減少Bug和返工,并改善用戶(hù)體驗(yàn)。如何實(shí)現(xiàn)?——將該與SmartBear
    的頭像 發(fā)表于 06-05 16:03 ?612次閱讀
    設(shè)計(jì)優(yōu)先方法論實(shí)踐:SmartBear API Hub +ReadyAPI組合使用,構(gòu)建<b class='flag-5'>高效</b>的API<b class='flag-5'>開(kāi)發(fā)</b>流