91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何提升神經(jīng)網(wǎng)絡(luò)性能

電子工程師 ? 來(lái)源:工程師曾玲 ? 2019-05-02 17:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文簡(jiǎn)要介紹了提升神經(jīng)網(wǎng)絡(luò)性能的方法,如檢查過(guò)擬合、調(diào)參、超參數(shù)調(diào)節(jié)、數(shù)據(jù)增強(qiáng)。

神經(jīng)網(wǎng)絡(luò)是一種在很多用例中能夠提供最優(yōu)準(zhǔn)確率的機(jī)器學(xué)習(xí)算法。但是,很多時(shí)候我們構(gòu)建的神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率可能無(wú)法令人滿意,或者無(wú)法讓我們?cè)跀?shù)據(jù)科學(xué)競(jìng)賽中拿到領(lǐng)先名次。所以,我們總是在尋求更好的方式來(lái)改善模型的性能。有很多技術(shù)可以幫助我們達(dá)到這個(gè)目標(biāo)。本文將介紹這些技術(shù),幫助大家構(gòu)建更準(zhǔn)確的神經(jīng)網(wǎng)絡(luò)。

檢查過(guò)擬合

如何提升神經(jīng)網(wǎng)絡(luò)性能

保證神經(jīng)網(wǎng)絡(luò)在測(cè)試集上運(yùn)行良好的第一步就是驗(yàn)證神經(jīng)網(wǎng)絡(luò)沒(méi)有過(guò)擬合。什么是過(guò)擬合呢?當(dāng)你的模型開(kāi)始記錄訓(xùn)練數(shù)據(jù)而不是從中學(xué)習(xí)的時(shí)候,就發(fā)生了過(guò)擬合。然后,當(dāng)你的模型遇到之前沒(méi)有見(jiàn)過(guò)的數(shù)據(jù)時(shí),它就無(wú)法很好的運(yùn)行。為了更好地理解,我們來(lái)看一個(gè)類比。我們有一個(gè)記性特好的同學(xué),假設(shè)一次數(shù)學(xué)考試馬上就要來(lái)臨了。你和這位擅長(zhǎng)記憶的同學(xué)開(kāi)始學(xué)習(xí)課本。這名同學(xué)記住課本中的每一個(gè)公式、問(wèn)題以及問(wèn)題的答案,然而你要比他來(lái)得聰明一些,所以你決定以直覺(jué)為基礎(chǔ)、解決問(wèn)題、學(xué)習(xí)這些公式是如何發(fā)揮作用的??荚噥?lái)了,如果試卷中的問(wèn)題是直接來(lái)源于課本的,那么可以想像那名記憶力超群的同學(xué)發(fā)揮得更好,但是,如果試題是涉及應(yīng)用直觀知識(shí)的全新問(wèn)題,那么你將會(huì)做得更好,而你的朋友會(huì)慘敗。

如何鑒別模型是否過(guò)擬合呢?你僅僅需要交叉檢查訓(xùn)練準(zhǔn)確率和測(cè)試準(zhǔn)確率。如果訓(xùn)練準(zhǔn)確率遠(yuǎn)遠(yuǎn)高出了測(cè)試準(zhǔn)確率,那么可以斷定你的模型是過(guò)擬合了。你也可以在圖中畫(huà)出預(yù)測(cè)點(diǎn)來(lái)驗(yàn)證。下面是一些避免過(guò)擬合的技術(shù):

數(shù)據(jù)正則化(L1 或 L2);

Dropout:隨機(jī)丟棄一些神經(jīng)元之間的連接,強(qiáng)制神經(jīng)網(wǎng)絡(luò)尋找新的路徑并泛化;

早停(Early Stopping):促使神經(jīng)網(wǎng)絡(luò)訓(xùn)練早點(diǎn)停止,以減少在測(cè)試集中的誤差。

超參數(shù)調(diào)節(jié)

如何提升神經(jīng)網(wǎng)絡(luò)性能

超參數(shù)是你必須給網(wǎng)絡(luò)初始化的值,這些數(shù)值不能在訓(xùn)練的過(guò)程中學(xué)到。在卷積神經(jīng)網(wǎng)絡(luò)中,這些超參數(shù)包括:核大小、神經(jīng)網(wǎng)絡(luò)層數(shù)、激活函數(shù)、損失函數(shù)、所用的優(yōu)化器(梯度下降、RMSprop)、批大小、訓(xùn)練的 epoch 數(shù)量等等。

每個(gè)神經(jīng)網(wǎng)絡(luò)都會(huì)有最佳超參數(shù)組合,這組參數(shù)能夠得到最大的準(zhǔn)確率。你也許會(huì)問(wèn),「有這么多超參數(shù),我如何選擇每個(gè)參數(shù)呢?」不幸的是,對(duì)每個(gè)神經(jīng)網(wǎng)絡(luò)而言,并沒(méi)有確定最佳超參數(shù)組合的直接方法,所以通常都是通過(guò)反復(fù)試驗(yàn)得到的。但是也有一些關(guān)于上述超參數(shù)的最佳實(shí)踐:

學(xué)習(xí)率:選擇最優(yōu)學(xué)習(xí)率是很重要的,因?yàn)樗鼪Q定了神經(jīng)網(wǎng)絡(luò)是否可以收斂到全局最小值。選擇較高的學(xué)習(xí)率幾乎從來(lái)不能到達(dá)全局最小值,因?yàn)槟愫芸赡芴^(guò)它。所以,你總是在全局最小值附近,但是從未收斂到全局最小值。選擇較小的學(xué)習(xí)率有助于神經(jīng)網(wǎng)絡(luò)收斂到全局最小值,但是會(huì)花費(fèi)很多時(shí)間。這樣你必須用更多的時(shí)間來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。較小的學(xué)習(xí)率也更可能使神經(jīng)網(wǎng)絡(luò)困在局部極小值里面,也就是說(shuō),神經(jīng)網(wǎng)絡(luò)會(huì)收斂到一個(gè)局部極小值,而且因?yàn)閷W(xué)習(xí)率比較小,它無(wú)法跳出局部極小值。所以,在設(shè)置學(xué)習(xí)率的時(shí)候你必須非常謹(jǐn)慎。

神經(jīng)網(wǎng)絡(luò)架構(gòu):并不存在能夠在所有的測(cè)試集中帶來(lái)高準(zhǔn)確率的標(biāo)準(zhǔn)網(wǎng)絡(luò)架構(gòu)。你必須實(shí)驗(yàn),嘗試不同的架構(gòu),從實(shí)驗(yàn)結(jié)果進(jìn)行推斷,然后再嘗試。我建議使用已經(jīng)得到驗(yàn)證的架構(gòu),而不是構(gòu)建自己的網(wǎng)絡(luò)架構(gòu)。例如:對(duì)于圖像識(shí)別任務(wù),有 VGG net、Resnet、谷歌的 Inception 網(wǎng)絡(luò)等。這些都是開(kāi)源的,而且已經(jīng)被證明具有較高的準(zhǔn)確率。所以你可以把這些架構(gòu)復(fù)制過(guò)來(lái),然后根據(jù)自己的目的做一些調(diào)整。

優(yōu)化器和損失函數(shù):這方面有很多可供選擇。事實(shí)上,如果有必要,你可以自定義損失函數(shù)。常用的優(yōu)化器有 RMSprop、隨機(jī)梯度下降和 Adam。這些優(yōu)化器貌似在很多用例中都可以起作用。如果你的任務(wù)是分類任務(wù),那么常用的損失函數(shù)是類別交叉熵。如果你在執(zhí)行回歸任務(wù),那么均方差是最常用的損失函數(shù)。你可以自由地使用這些優(yōu)化器超參數(shù)進(jìn)行試驗(yàn),也可以使用不同的優(yōu)化器和損失函數(shù)。

批大小和 epoch 次數(shù):同樣,沒(méi)有適用于所有用例的批大小和 epoch 次數(shù)的標(biāo)準(zhǔn)值。你必須進(jìn)行試驗(yàn),嘗試不同的選擇。在通常的實(shí)踐中,批大小被設(shè)置為 8、16、32……epoch 次數(shù)則取決于開(kāi)發(fā)者的偏好以及他/她所擁有的計(jì)算資源。

激活函數(shù):激活函數(shù)映射非線性函數(shù)輸入和輸出。激活函數(shù)是特別重要的,選擇合適的激活函數(shù)有助于模型學(xué)習(xí)得更好。現(xiàn)在,整流線性單元(ReLU)是最廣泛使用的激活函數(shù),因?yàn)樗鉀Q了梯度消失的問(wèn)題。更早時(shí)候,Sigmoid 和 Tanh 函數(shù)都是最常用的激活函數(shù)。但是它們都會(huì)遇到梯度消失的問(wèn)題,即在反向傳播中,梯度在到達(dá)初始層的過(guò)程中,值在變小,趨向于 0。這不利于神經(jīng)網(wǎng)絡(luò)向具有更深層的結(jié)構(gòu)擴(kuò)展。ReLU 克服了這個(gè)問(wèn)題,因此也就可以允許神經(jīng)網(wǎng)絡(luò)擴(kuò)展到更深的層。

ReLU 激活函數(shù)

算法集成

如果單個(gè)神經(jīng)網(wǎng)絡(luò)不像你期待的那樣準(zhǔn)確,那么你可以創(chuàng)建一個(gè)神經(jīng)網(wǎng)絡(luò)集成,結(jié)合多個(gè)網(wǎng)絡(luò)的預(yù)測(cè)能力。你可以選擇不同的神經(jīng)網(wǎng)絡(luò)架構(gòu),在不同部分的數(shù)據(jù)集上訓(xùn)練它們,然后使用它們的集合預(yù)測(cè)能力在測(cè)試集上達(dá)到較高的準(zhǔn)確率。假設(shè)你在構(gòu)建一個(gè)貓狗分類器,0 代表貓,1 代表狗。當(dāng)組合不同的貓狗分類器時(shí),基于單個(gè)分類器之間的皮爾遜相關(guān)系數(shù),集成算法的準(zhǔn)確率有了提升。讓我們看一個(gè)例子,拿 3 個(gè)模型來(lái)衡量它們各自的準(zhǔn)確率:

Ground Truth: 1111111111 Classifier 1: 1111111100 = 80% accuracy Classifier 2: 1111111100 = 80% accuracy Classifier 3: 1011111100 = 70% accuracy

3 個(gè)模型的皮爾遜相關(guān)系數(shù)很高。所以,集成它們并不會(huì)提升準(zhǔn)確率。如果我們使用多數(shù)投票的方式來(lái)組合這三個(gè)模型,會(huì)得到下面的結(jié)果:

Ensemble Result: 1111111100 = 80% accuracy

現(xiàn)在,讓我們來(lái)看一組輸出具備較低皮爾遜相關(guān)系數(shù)的模型:

Ground Truth: 1111111111 Classifier 1: 1111111100 = 80% accuracy Classifier 2: 0111011101 = 70% accuracy Classifier 3: 1000101111 = 60% accuracy

當(dāng)我們組合這三個(gè)弱學(xué)習(xí)器的時(shí)候,會(huì)得到以下結(jié)果:

Ensemble Result: 1111111101 = 90% accuracy

正如你在上面所看到的,具有低皮爾遜相關(guān)系數(shù)的弱學(xué)習(xí)器的組合優(yōu)于具有較高皮爾遜相關(guān)系數(shù)的學(xué)習(xí)器的組合。

缺乏數(shù)據(jù)

在使用了上述所有的技術(shù)以后,如果你的模型仍然沒(méi)有在測(cè)試集上表現(xiàn)得更好一些,這可能是因?yàn)槿狈?shù)據(jù)。在很多用例中訓(xùn)練數(shù)據(jù)的數(shù)量是有限的。如果你無(wú)法收集更多的數(shù)據(jù),那么你可以采取數(shù)據(jù)增強(qiáng)方法。

數(shù)據(jù)增強(qiáng)技術(shù)

如果你正在使用的是圖像數(shù)據(jù)集,你可以通過(guò)剪切、翻轉(zhuǎn)、隨機(jī)裁剪等方法來(lái)增加新的圖像。這可以為你正在訓(xùn)練的神經(jīng)網(wǎng)絡(luò)提供不同的樣本。

結(jié)論

這些技術(shù)被認(rèn)為是最佳實(shí)踐經(jīng)驗(yàn),在提升模型學(xué)習(xí)特征的能力方面通常是有效的。希望對(duì)大家有所幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NMSIS神經(jīng)網(wǎng)絡(luò)庫(kù)使用介紹

    NMSIS NN 軟件庫(kù)是一組高效的神經(jīng)網(wǎng)絡(luò)內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡(luò)性能并最??大限度地減少其內(nèi)存占用。 該庫(kù)分為多個(gè)功能,每個(gè)功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    神經(jīng)網(wǎng)絡(luò)教程(李亞非)

      第1章 概述  1.1 人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展  1.2 生物神經(jīng)元  1.3 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成  第2章人工神經(jīng)網(wǎng)絡(luò)基本模型  2.1 MP模型  2.2 感知器模型  2.3
    發(fā)表于 03-20 11:32

    神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介

    神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
    發(fā)表于 08-05 21:01

    神經(jīng)網(wǎng)絡(luò)基本介紹

    神經(jīng)網(wǎng)絡(luò)基本介紹
    發(fā)表于 01-04 13:41

    全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)有什么區(qū)別

    全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別
    發(fā)表于 06-06 14:21

    卷積神經(jīng)網(wǎng)絡(luò)如何使用

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)究竟是什么,鑒于神經(jīng)網(wǎng)絡(luò)在工程上經(jīng)歷了曲折的歷史,您為什么還會(huì)在意它呢? 對(duì)于這些非常中肯的問(wèn)題,我們似乎可以給出相對(duì)簡(jiǎn)明的答案。
    發(fā)表于 07-17 07:21

    【案例分享】ART神經(jīng)網(wǎng)絡(luò)與SOM神經(jīng)網(wǎng)絡(luò)

    今天學(xué)習(xí)了兩個(gè)神經(jīng)網(wǎng)絡(luò),分別是自適應(yīng)諧振(ART)神經(jīng)網(wǎng)絡(luò)與自組織映射(SOM)神經(jīng)網(wǎng)絡(luò)。整體感覺(jué)不是很難,只不過(guò)一些最基礎(chǔ)的概念容易理解不清。首先ART神經(jīng)網(wǎng)絡(luò)是競(jìng)爭(zhēng)學(xué)習(xí)的一個(gè)代表,
    發(fā)表于 07-21 04:30

    CMSIS-NN神經(jīng)網(wǎng)絡(luò)內(nèi)核助力微控制器效率提升

    自然會(huì)想到Arm Cortex-M系列處理器內(nèi)核,那么如果您想要強(qiáng)化它的性能并且減少內(nèi)存消耗,CMSIS-NN就是您最好的選擇?;贑MSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡(luò)推理運(yùn)算,對(duì)于運(yùn)行時(shí)間/吞吐量將會(huì)有4.6X的提升,而對(duì)于能效將有
    發(fā)表于 07-23 08:08

    如何設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法?

    神經(jīng)網(wǎng)絡(luò)的并行特點(diǎn),而且它還可以根據(jù)設(shè)計(jì)要求配置硬件結(jié)構(gòu),例如根據(jù)實(shí)際需要,可靈活設(shè)計(jì)數(shù)據(jù)的位寬等。隨著數(shù)字集成電路技術(shù)的飛速發(fā)展,F(xiàn)PGA芯片的處理能力得到了極大的提升,已經(jīng)完全可以承擔(dān)神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)壓縮
    發(fā)表于 08-08 06:11

    基于FPGA的神經(jīng)網(wǎng)絡(luò)性能評(píng)估及局限性

    FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)關(guān)鍵問(wèn)題分析基于FPGA的ANN實(shí)現(xiàn)方法基于FPGA的神經(jīng)網(wǎng)絡(luò)性能評(píng)估及局限性
    發(fā)表于 04-30 06:58

    如何構(gòu)建神經(jīng)網(wǎng)絡(luò)

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡(luò)是一種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預(yù)測(cè)的計(jì)算系統(tǒng)。如何構(gòu)建神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反向傳播優(yōu)化輸入變量權(quán)重的層,以提高模型的預(yù)測(cè)
    發(fā)表于 07-12 08:02

    基于BP神經(jīng)網(wǎng)絡(luò)的PID控制

    最近在學(xué)習(xí)電機(jī)的智能控制,上周學(xué)習(xí)了基于單神經(jīng)元的PID控制,這周研究基于BP神經(jīng)網(wǎng)絡(luò)的PID控制。神經(jīng)網(wǎng)絡(luò)具有任意非線性表達(dá)能力,可以通過(guò)對(duì)系統(tǒng)性能的學(xué)習(xí)來(lái)實(shí)現(xiàn)具有最佳組合的PID控
    發(fā)表于 09-07 07:43

    圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡(jiǎn)要介紹

    提升識(shí)別準(zhǔn)確率,采用改進(jìn)神經(jīng)網(wǎng)絡(luò),通過(guò)Mnist數(shù)據(jù)集進(jìn)行訓(xùn)練。整體處理過(guò)程分為兩步:圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理。圖像預(yù)處理主要根據(jù)圖像的特征,將數(shù)據(jù)處理成規(guī)范的格式,而改進(jìn)神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 12-23 08:07

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    神經(jīng)網(wǎng)絡(luò)已經(jīng)廣泛應(yīng)用于圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割以及自然語(yǔ)言處理等領(lǐng)域。首先分析了典型卷積神經(jīng)網(wǎng)絡(luò)模型為提高其性能增加網(wǎng)絡(luò)深度以及寬度的模型結(jié)構(gòu),分析了采用注意力機(jī)制進(jìn)一步
    發(fā)表于 08-02 10:39

    神經(jīng)網(wǎng)絡(luò)的并行計(jì)算與加速技術(shù)

    問(wèn)題。因此,并行計(jì)算與加速技術(shù)在神經(jīng)網(wǎng)絡(luò)研究和應(yīng)用中變得至關(guān)重要,它們能夠顯著提升神經(jīng)網(wǎng)絡(luò)性能和效率,滿足實(shí)際應(yīng)用中對(duì)快速響應(yīng)和大規(guī)模數(shù)據(jù)處理的需求。
    的頭像 發(fā)表于 09-17 13:31 ?1122次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的并行計(jì)算與加速技術(shù)