91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程8.5之批量歸一化

PyTorch教程8.5之批量歸一化

2023-06-05 | pdf | 0.40 MB | 次下載 | 免費(fèi)

資料介紹

訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)很困難。讓它們?cè)诤侠淼臅r(shí)間內(nèi)收斂可能很棘手。在本節(jié)中,我們將介紹 批量歸一化,這是一種流行且有效的技術(shù),可以持續(xù)加速深度網(wǎng)絡(luò)的收斂 Ioffe 和 Szegedy,2015 年連同殘差塊(稍后將在第 8.6 節(jié)中介紹),批量歸一化使從業(yè)者可以例行地訓(xùn)練超過(guò) 100 層的網(wǎng)絡(luò)。批量歸一化的第二個(gè)(偶然的)好處在于其固有的正則化。

import torch
from torch import nn
from d2l import torch as d2l
from mxnet import autograd, init, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()
from functools import partial
import jax
import optax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l
import tensorflow as tf
from d2l import tensorflow as d2l

8.5.1. 訓(xùn)練深度網(wǎng)絡(luò)

在處理數(shù)據(jù)時(shí),我們經(jīng)常在訓(xùn)練前進(jìn)行預(yù)處理。關(guān)于數(shù)據(jù)預(yù)處理的選擇通常會(huì)對(duì)最終結(jié)果產(chǎn)生巨大影響。回想一下我們將 MLP 應(yīng)用于預(yù)測(cè)房?jī)r(jià)(第 5.7 節(jié))。我們處理真實(shí)數(shù)據(jù)的第一步是將我們的輸入特征標(biāo)準(zhǔn)化為零均值 μ=0和單位方差 Σ=1across multiple observations ( Friedman, 1987 )。至少,人們經(jīng)常重新縮放它,使對(duì)角線是統(tǒng)一的,即 Σii=1. 另一種策略是將向量重新調(diào)整為單位長(zhǎng)度,每次觀察的均值可能為零。這可以很好地工作,例如,對(duì)于空間傳感器數(shù)據(jù)。這些預(yù)處理技術(shù)以及更多技術(shù)有助于很好地控制估計(jì)問(wèn)題。參見例如Guyon等人的文章。( 2008 )審查特征選擇和提取技術(shù)。標(biāo)準(zhǔn)化向量還有一個(gè)很好的副作用,即限制作用于它的函數(shù)的函數(shù)復(fù)雜性。例如,支持向量機(jī)中著名的半徑邊界( Vapnik, 1995 )和感知器收斂定理( Novikoff, 1962 )依賴有界范數(shù)的輸入。

直覺上,這種標(biāo)準(zhǔn)化與我們的優(yōu)化器配合得很好,因?yàn)樗闰?yàn)地將參數(shù)放在相似的范圍內(nèi)。因此,很自然地會(huì)問(wèn) 深度網(wǎng)絡(luò)中相應(yīng)的規(guī)范化步驟是否可能沒(méi)有好處。雖然這并不是導(dǎo)致批量歸一化發(fā)明的原因 Ioffe 和 Szegedy,2015 年 ,但它是在統(tǒng)一框架內(nèi)理解它及其堂兄層歸一化Ba等人,2016 年的有用方法。

其次,對(duì)于典型的 MLP 或 CNN,在我們訓(xùn)練時(shí),中間層中的變量(例如,MLP 中的仿射變換輸出)可能采用幅度變化很大的值:沿著從輸入到輸出的層,跨同一層中的單元,隨著時(shí)間的推移,由于我們對(duì)模型參數(shù)的更新。批量歸一化的發(fā)明者非正式地假設(shè),這種變量分布的漂移可能會(huì)阻礙網(wǎng)絡(luò)的收斂。憑直覺,我們可能會(huì)推測(cè),如果一層的可變激活是另一層的 100 倍,這可能需要對(duì)學(xué)習(xí)率進(jìn)行補(bǔ)償性調(diào)整。自適應(yīng)求解器,例如 AdaGrad Duchi等人,2011 年、Adam Kingma 和 Ba,2014 年))、Yogi ( Zaheer et al. , 2018 )或 Distributed Shampoo ( Anil et al. , 2020 )旨在從優(yōu)化的角度解決這個(gè)問(wèn)題,例如,通過(guò)添加二階方法的方面。另一種方法是通過(guò)自適應(yīng)規(guī)范化來(lái)防止問(wèn)題發(fā)生。

第三,更深層次的網(wǎng)絡(luò)很復(fù)雜,而且往往更容易過(guò)度擬合。這意味著正則化變得更加關(guān)鍵。一種常用的正則化技術(shù)是噪聲注入。這已經(jīng)為人所知很長(zhǎng)時(shí)間了,例如,關(guān)于輸入的噪聲注入( Bishop, 1995 )。它還構(gòu)成了第 5.6 節(jié)中 dropout 的基礎(chǔ) 事實(shí)證明,批歸一化帶來(lái)了所有三個(gè)好處:預(yù)處理、數(shù)值穩(wěn)定性和正則化。

批歸一化應(yīng)用于單個(gè)層,或者可選地應(yīng)用于所有層:在每次訓(xùn)練迭代中,我們首先通過(guò)減去它們的均值并除以它們的標(biāo)準(zhǔn)差來(lái)歸一化(批歸一化的)輸入,其中兩者都是基于統(tǒng)計(jì)數(shù)據(jù)估計(jì)的當(dāng)前的小批量。接下來(lái),我們應(yīng)用比例系數(shù)和偏移量來(lái)恢復(fù)丟失的自由度。批歸一化正是由于這種 基于統(tǒng)計(jì)的歸一化 而得名。

請(qǐng)注意,如果我們嘗試對(duì)大小為 1 的小批量應(yīng)用批量歸一化,我們將無(wú)法學(xué)習(xí)任何東西。這是因?yàn)樵跍p去均值后,每個(gè)隱藏單元的值為 0。正如您可能猜到的那樣,由于我們將整個(gè)部分用于批量歸一化,并且具有足夠大的小批量,因此該方法被證明是有效且穩(wěn)定的。這里的一個(gè)要點(diǎn)是,當(dāng)應(yīng)用批量歸一化時(shí),批量大小的選擇甚至比沒(méi)有批量歸一化更重要,或者至少需要適當(dāng)?shù)男?zhǔn),因?yàn)槲覀兛赡軙?huì)調(diào)整它。

表示為B一個(gè)小批量并讓 x∈B作為批量歸一化的輸入(BN). 在這種情況下,批量歸一化定義如下:

(8.5.1)BN(x)=γ⊙x?μ^Bσ^B+β.

在(8.5.1),μ^B 是樣本均值和σ^B是 minibatch 的樣本標(biāo)準(zhǔn)差B. 應(yīng)用標(biāo)準(zhǔn)化后,生成的小批量具有零均值和單位方差。單位方差的選擇(相對(duì)于其他一些幻數(shù))是一個(gè)任意選擇。我們通過(guò)包含元素尺度參數(shù)來(lái)恢復(fù)這種自由度 γ轉(zhuǎn)移參數(shù) β具有相同的形狀x. 兩者都是需要在模型訓(xùn)練中學(xué)習(xí)的參數(shù)。

中間層的可變幅度在訓(xùn)練期間不能發(fā)散,因?yàn)榕繗w一化主動(dòng)將它們居中并將它們重新縮放回給定的均值和大?。ㄍㄟ^(guò) μ^Bσ^B). 實(shí)踐經(jīng)驗(yàn)證實(shí),正如在討論特征重新縮放時(shí)所提到的,批量歸一化似乎允許更積極的學(xué)習(xí)率。我們計(jì)算μ^Bσ^B(8.5.1)如下:

?

神經(jīng)網(wǎng)絡(luò) 數(shù)據(jù)預(yù)處理 pytorch
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1耗盡型MOS FET產(chǎn)品目錄選型表
  2. 0.14 MB   |  3次下載  |  免費(fèi)
  3. 2斯丹電子 | 用于芯片測(cè)試系統(tǒng)的射頻干簧繼電器
  4. 5.11 MB  |  次下載  |  免費(fèi)
  5. 3WAYON維安手機(jī)快充保護(hù)方案由原廠代理分銷經(jīng)銷一級(jí)代理分銷經(jīng)銷
  6. 719.04 KB  |  次下載  |  免費(fèi)
  7. 4WAYON維安手機(jī)EOS防護(hù)器件選型指南
  8. 293.78 KB  |  次下載  |  免費(fèi)
  9. 5PC5012氮化鎵 PIIP 單片集成電路數(shù)據(jù)手冊(cè)
  10. 1.66 MB   |  次下載  |  免費(fèi)
  11. 6合眾恒躍復(fù)旦微FMQL20SM BTB板簡(jiǎn)介
  12. 908.98 KB  |  次下載  |  免費(fèi)
  13. 7HERO8Black說(shuō)明書
  14. 4.96 MB   |  次下載  |  免費(fèi)
  15. 8三菱E540說(shuō)明書
  16. 3.93 MB   |  次下載  |  免費(fèi)

本月

  1. 1美的電磁爐電路原理圖資料
  2. 4.39 MB   |  19次下載  |  10 積分
  3. 2反激式開關(guān)電源設(shè)計(jì)解析
  4. 0.89 MB   |  11次下載  |  5 積分
  5. 3耗盡型MOS FET產(chǎn)品目錄選型表
  6. 0.14 MB   |  3次下載  |  免費(fèi)
  7. 4簡(jiǎn)易光伏控制器原理圖資料
  8. 0.07 MB   |  1次下載  |  5 積分
  9. 5FP7135V060-G1/FP7125替代物料pin to pin
  10. 495.40 KB  |  1次下載  |  免費(fèi)
  11. 62EDL05x06xx系列 600V半橋門驅(qū)動(dòng)器帶集成自舉二極管(BSD)手冊(cè)
  12. 0.69 MB   |  1次下載  |  免費(fèi)
  13. 7壓力容器焊接手冊(cè)
  14. 6.47 MB   |  次下載  |  2 積分
  15. 8SFI立昌SFI-Company原廠代理分銷經(jīng)銷一級(jí)代理分銷經(jīng)銷
  16. 1.58 MB  |  次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233095次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191456次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  10. 158M  |  183360次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81605次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73831次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分