91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

13個PyTorch使用的小竅門

深度學(xué)習(xí)自然語言處理 ? 來源:知乎 ? 作者:z.defying@知乎 ? 2021-03-12 09:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】本文整理了13則PyTorch使用的小竅門,包括了指定GPU編號、梯度裁剪、擴展單張圖片維度等實用技巧,能夠幫助工作者更高效地完成任務(wù)。

目錄

1、指定GPU編號

2、查看模型每層輸出詳情3、梯度裁剪4、擴展單張圖片維度5、one hot編碼6、防止驗證模型時爆顯存7、學(xué)習(xí)率衰減8、凍結(jié)某些層的參數(shù)9、對不同層使用不同學(xué)習(xí)率10、模型相關(guān)操作11、Pytorch內(nèi)置one hot函數(shù)12、網(wǎng)絡(luò)參數(shù)初始化13、加載內(nèi)置預(yù)訓(xùn)練模型

1、指定GPU編號

設(shè)置當(dāng)前使用的GPU設(shè)備僅為0號設(shè)備,設(shè)備名稱為 /gpu:0:os.environ[“CUDA_VISIBLE_DEVICES”] = “0”

設(shè)置當(dāng)前使用的GPU設(shè)備為0,1號兩個設(shè)備,名稱依次為 /gpu:0、/gpu:1:os.environ[“CUDA_VISIBLE_DEVICES”] = “0,1” ,根據(jù)順序表示優(yōu)先使用0號設(shè)備,然后使用1號設(shè)備。

指定GPU的命令需要放在和神經(jīng)網(wǎng)絡(luò)相關(guān)的一系列操作的前面。

2、查看模型每層輸出詳情

Keras有一個簡潔的API來查看模型的每一層輸出尺寸,這在調(diào)試網(wǎng)絡(luò)時非常有用。現(xiàn)在在PyTorch中也可以實現(xiàn)這個功能。

使用很簡單,如下用法:

from torchsummary import summarysummary(your_model, input_size=(channels, H, W))

input_size 是根據(jù)你自己的網(wǎng)絡(luò)模型的輸入尺寸進(jìn)行設(shè)置。

3、梯度裁剪(Gradient Clipping)

import torch.nn as nn

outputs = model(data)loss= loss_fn(outputs, target)optimizer.zero_grad()loss.backward()nn.utils.clip_grad_norm_(model.parameters(), max_norm=20, norm_type=2)optimizer.step()

nn.utils.clip_grad_norm_ 的參數(shù):

parameters – 一個基于變量的迭代器,會進(jìn)行梯度歸一化

max_norm – 梯度的最大范數(shù)

norm_type – 規(guī)定范數(shù)的類型,默認(rèn)為L2

@不橢的橢圓 提出:梯度裁剪在某些任務(wù)上會額外消耗大量的計算時間,可移步評論區(qū)查看詳情。

4、擴展單張圖片維度

因為在訓(xùn)練時的數(shù)據(jù)維度一般都是 (batch_size, c, h, w),而在測試時只輸入一張圖片,所以需要擴展維度,擴展維度有多個方法:

import cv2import torch

image = cv2.imread(img_path)image = torch.tensor(image)print(image.size())

img = image.view(1, *image.size())print(img.size())

# output:# torch.Size([h, w, c])# torch.Size([1, h, w, c])

或import cv2import numpy as np

image = cv2.imread(img_path)print(image.shape)img = image[np.newaxis, :, :, :]print(img.shape)

# output:# (h, w, c)# (1, h, w, c)

或(感謝 @coldleaf 的補充)

import cv2import torch

image = cv2.imread(img_path)image = torch.tensor(image)print(image.size())

img = image.unsqueeze(dim=0) print(img.size())

img = img.squeeze(dim=0)print(img.size())

# output:# torch.Size([(h, w, c)])# torch.Size([1, h, w, c])# torch.Size([h, w, c])

tensor.unsqueeze(dim):擴展維度,dim指定擴展哪個維度。

tensor.squeeze(dim):去除dim指定的且size為1的維度,維度大于1時,squeeze()不起作用,不指定dim時,去除所有size為1的維度。

5、獨熱編碼

在PyTorch中使用交叉熵?fù)p失函數(shù)的時候會自動把label轉(zhuǎn)化成onehot,所以不用手動轉(zhuǎn)化,而使用MSE需要手動轉(zhuǎn)化成onehot編碼。

import torchclass_num = 8batch_size = 4

def one_hot(label): “”“ 將一維列表轉(zhuǎn)換為獨熱編碼 ”“” label = label.resize_(batch_size, 1) m_zeros = torch.zeros(batch_size, class_num) # 從 value 中取值,然后根據(jù) dim 和 index 給相應(yīng)位置賦值 onehot = m_zeros.scatter_(1, label, 1) # (dim,index,value)

return onehot.numpy() # Tensor -》 Numpy

label = torch.LongTensor(batch_size).random_() % class_num # 對隨機數(shù)取余print(one_hot(label))

# output:[[0. 0. 0. 1. 0. 0. 0. 0.] [0. 0. 0. 0. 1. 0. 0. 0.] [0. 0. 1. 0. 0. 0. 0. 0.] [0. 1. 0. 0. 0. 0. 0. 0.]]

注:第11條有更簡單的方法。

6、防止驗證模型時爆顯存

驗證模型時不需要求導(dǎo),即不需要梯度計算,關(guān)閉autograd,可以提高速度,節(jié)約內(nèi)存。如果不關(guān)閉可能會爆顯存。

with torch.no_grad(): # 使用model進(jìn)行預(yù)測的代碼 pass

感謝@zhaz 的提醒,我把 torch.cuda.empty_cache() 的使用原因更新一下。

這是原回答:

Pytorch 訓(xùn)練時無用的臨時變量可能會越來越多,導(dǎo)致 out of memory ,可以使用下面語句來清理這些不需要的變量。

官網(wǎng) 上的解釋為:

Releases all unoccupied cached memory currently held by the caching allocator so that those can be used in other GPU application and visible innvidia-smi. torch.cuda.empty_cache()

意思就是PyTorch的緩存分配器會事先分配一些固定的顯存,即使實際上tensors并沒有使用完這些顯存,這些顯存也不能被其他應(yīng)用使用。這個分配過程由第一次CUDA內(nèi)存訪問觸發(fā)的。而 torch.cuda.empty_cache() 的作用就是釋放緩存分配器當(dāng)前持有的且未占用的緩存顯存,以便這些顯存可以被其他GPU應(yīng)用程序中使用,并且通過 nvidia-smi命令可見。注意使用此命令不會釋放tensors占用的顯存。對于不用的數(shù)據(jù)變量,Pytorch 可以自動進(jìn)行回收從而釋放相應(yīng)的顯存。更詳細(xì)的優(yōu)化可以查看 優(yōu)化顯存使用 和 顯存利用問題。

7、學(xué)習(xí)率衰減

import torch.optim as optimfrom torch.optim import lr_scheduler

# 訓(xùn)練前的初始化optimizer = optim.Adam(net.parameters(), lr=0.001)scheduler = lr_scheduler.StepLR(optimizer, 10, 0.1) # # 每過10個epoch,學(xué)習(xí)率乘以0.1

# 訓(xùn)練過程中for n in n_epoch: scheduler.step() 。..

可以隨時查看學(xué)習(xí)率的值:optimizer.param_groups[0][‘lr’]。還有其他學(xué)習(xí)率更新的方式:1、自定義更新公式:scheduler = lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda epoch:1/(epoch+1))2、不依賴epoch更新學(xué)習(xí)率:lr_scheduler.ReduceLROnPlateau()提供了基于訓(xùn)練中某些測量值使學(xué)習(xí)率動態(tài)下降的方法,它的參數(shù)說明到處都可以查到。

提醒一點就是參數(shù) mode=‘min’ 還是‘max’,取決于優(yōu)化的的損失還是準(zhǔn)確率,即使用 scheduler.step(loss)還是scheduler.step(acc) 。

8、凍結(jié)某些層的參數(shù)

參考:https://www.zhihu.com/question/311095447/answer/589307812在加載預(yù)訓(xùn)練模型的時候,我們有時想凍結(jié)前面幾層,使其參數(shù)在訓(xùn)練過程中不發(fā)生變化。我們需要先知道每一層的名字,通過如下代碼打?。?/p>

net = Network() # 獲取自定義網(wǎng)絡(luò)結(jié)構(gòu)for name, value in net.named_parameters(): print(‘name: {0}, grad: {1}’.format(name, value.requires_grad))

假設(shè)前幾層信息如下:

name: cnn.VGG_16.convolution1_1.weight, grad: Truename: cnn.VGG_16.convolution1_1.bias, grad: Truename: cnn.VGG_16.convolution1_2.weight, grad: Truename: cnn.VGG_16.convolution1_2.bias, grad: Truename: cnn.VGG_16.convolution2_1.weight, grad: Truename: cnn.VGG_16.convolution2_1.bias, grad: Truename: cnn.VGG_16.convolution2_2.weight, grad: Truename: cnn.VGG_16.convolution2_2.bias, grad: True

后面的True表示該層的參數(shù)可訓(xùn)練,然后我們定義一個要凍結(jié)的層的列表:

no_grad = [ ‘cnn.VGG_16.convolution1_1.weight’, ‘cnn.VGG_16.convolution1_1.bias’, ‘cnn.VGG_16.convolution1_2.weight’, ‘cnn.VGG_16.convolution1_2.bias’]

凍結(jié)方法如下:

net = Net.CTPN() # 獲取網(wǎng)絡(luò)結(jié)構(gòu)for name, value in net.named_parameters(): if name in no_grad: value.requires_grad = False else: value.requires_grad = True

凍結(jié)后我們再打印每層的信息:

name: cnn.VGG_16.convolution1_1.weight, grad: Falsename: cnn.VGG_16.convolution1_1.bias, grad: Falsename: cnn.VGG_16.convolution1_2.weight, grad: Falsename: cnn.VGG_16.convolution1_2.bias, grad: Falsename: cnn.VGG_16.convolution2_1.weight, grad: Truename: cnn.VGG_16.convolution2_1.bias, grad: Truename: cnn.VGG_16.convolution2_2.weight, grad: Truename: cnn.VGG_16.convolution2_2.bias, grad: True

可以看到前兩層的weight和bias的requires_grad都為False,表示它們不可訓(xùn)練。

最后在定義優(yōu)化器時,只對requires_grad為True的層的參數(shù)進(jìn)行更新。

optimizer = optim.Adam(filter(lambda p: p.requires_grad, net.parameters()), lr=0.01)

9、對不同層使用不同學(xué)習(xí)率

我們對模型的不同層使用不同的學(xué)習(xí)率。還是使用這個模型作為例子:

net = Network() # 獲取自定義網(wǎng)絡(luò)結(jié)構(gòu)for name, value in net.named_parameters(): print(‘name: {}’.format(name))

# 輸出:# name: cnn.VGG_16.convolution1_1.weight# name: cnn.VGG_16.convolution1_1.bias# name: cnn.VGG_16.convolution1_2.weight# name: cnn.VGG_16.convolution1_2.bias# name: cnn.VGG_16.convolution2_1.weight# name: cnn.VGG_16.convolution2_1.bias# name: cnn.VGG_16.convolution2_2.weight# name: cnn.VGG_16.convolution2_2.bias

對 convolution1 和 convolution2 設(shè)置不同的學(xué)習(xí)率,首先將它們分開,即放到不同的列表里:

conv1_params = []conv2_params = []

for name, parms in net.named_parameters(): if “convolution1” in name: conv1_params += [parms] else: conv2_params += [parms]

# 然后在優(yōu)化器中進(jìn)行如下操作:optimizer = optim.Adam( [ {“params”: conv1_params, ‘lr’: 0.01}, {“params”: conv2_params, ‘lr’: 0.001}, ], weight_decay=1e-3,)

我們將模型劃分為兩部分,存放到一個列表里,每部分就對應(yīng)上面的一個字典,在字典里設(shè)置不同的學(xué)習(xí)率。當(dāng)這兩部分有相同的其他參數(shù)時,就將該參數(shù)放到列表外面作為全局參數(shù),如上面的`weight_decay`。

也可以在列表外設(shè)置一個全局學(xué)習(xí)率,當(dāng)各部分字典里設(shè)置了局部學(xué)習(xí)率時,就使用該學(xué)習(xí)率,否則就使用列表外的全局學(xué)習(xí)率。

10、模型相關(guān)操作

這個內(nèi)容比較多,我寫成了一篇文章:https://zhuanlan.zhihu.com/p/73893187

11、Pytorch內(nèi)置one_hot函數(shù)

感謝@yangyangyang 補充:Pytorch 1.1后,one_hot可以直接用torch.nn.functional.one_hot。然后我將Pytorch升級到1.2版本,試用了下 one_hot 函數(shù),確實很方便。具體用法如下:

import torch.nn.functional as Fimport torch

tensor = torch.arange(0, 5) % 3 # tensor([0, 1, 2, 0, 1])one_hot = F.one_hot(tensor)

# 輸出:# tensor([[1, 0, 0],# [0, 1, 0],# [0, 0, 1],# [1, 0, 0],# [0, 1, 0]])

F.one_hot會自己檢測不同類別個數(shù),生成對應(yīng)獨熱編碼。我們也可以自己指定類別數(shù):

tensor = torch.arange(0, 5) % 3 # tensor([0, 1, 2, 0, 1])one_hot = F.one_hot(tensor, num_classes=5)

# 輸出:# tensor([[1, 0, 0, 0, 0],# [0, 1, 0, 0, 0],# [0, 0, 1, 0, 0],# [1, 0, 0, 0, 0],# [0, 1, 0, 0, 0]])

升級 Pytorch (cpu版本)的命令:conda install pytorch torchvision -c pytorch(希望Pytorch升級不會影響項目代碼)

12、網(wǎng)絡(luò)參數(shù)初始化

神經(jīng)網(wǎng)絡(luò)的初始化是訓(xùn)練流程的重要基礎(chǔ)環(huán)節(jié),會對模型的性能、收斂性、收斂速度等產(chǎn)生重要的影響。

以下介紹兩種常用的初始化操作。

(1) 使用pytorch內(nèi)置的torch.nn.init方法。

常用的初始化操作,例如正態(tài)分布、均勻分布、xavier初始化、kaiming初始化等都已經(jīng)實現(xiàn),可以直接使用。具體詳見PyTorch 中 torch.nn.init 中文文檔。

init.xavier_uniform(net1[0].weight)

(2) 對于一些更加靈活的初始化方法,可以借助numpy。

對于自定義的初始化方法,有時tensor的功能不如numpy強大靈活,故可以借助numpy實現(xiàn)初始化方法,再轉(zhuǎn)換到tensor上使用。

for layer in net1.modules(): if isinstance(layer, nn.Linear): # 判斷是否是線性層 param_shape = layer.weight.shape layer.weight.data = torch.from_numpy(np.random.normal(0, 0.5, size=param_shape)) # 定義為均值為 0,方差為 0.5 的正態(tài)分布

13、加載內(nèi)置預(yù)訓(xùn)練模型

torchvision.models模塊的子模塊中包含以下模型:

AlexNet

VGG

ResNet

SqueezeNet

DenseNet

導(dǎo)入這些模型的方法為:

import torchvision.models as modelsresnet18 = models.resnet18()alexnet = models.alexnet()vgg16 = models.vgg16()

有一個很重要的參數(shù)為pretrained,默認(rèn)為False,表示只導(dǎo)入模型的結(jié)構(gòu),其中的權(quán)重是隨機初始化的。

如果pretrained 為 True,表示導(dǎo)入的是在ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練的模型。

import torchvision.models as modelsresnet18 = models.resnet18(pretrained=True)alexnet = models.alexnet(pretrained=True)vgg16 = models.vgg16(pretrained=True)

更多的模型可以查看:https://pytorch-cn.readthedocs.io/zh/latest/torchvision/torchvision-models/
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135507
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    813

    瀏覽量

    14856

原文標(biāo)題:【PyTorch】Trick集錦

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    PyTorch 中RuntimeError分析

    原生實現(xiàn)。這是一已知的 PyTorch 限制,常見于 Stable Diffusion、ComfyUI 等使用 interpolate(..., mode=\'nearest\') 的模型中
    發(fā)表于 03-06 06:02

    ATtiny13/ATtiny13V:低功耗8位微控制器的強大之選

    ATtiny13/ATtiny13V:低功耗8位微控制器的強大之選 在電子設(shè)計領(lǐng)域,一款性能卓越且低功耗的微控制器往往是工程師們的“心頭好”。今天,我們就來深入了解一下 Atmel 公司推出
    的頭像 發(fā)表于 02-28 15:15 ?170次閱讀

    其利天下:13 萬轉(zhuǎn)暴力風(fēng)扇,驅(qū)動方案需要滿足哪些核心技術(shù)要求?

    在暴力風(fēng)扇行業(yè),13萬轉(zhuǎn)超高轉(zhuǎn)速產(chǎn)品,是區(qū)分入門款與高端旗艦款的核心門檻。而一款13萬轉(zhuǎn)暴力風(fēng)扇能不能穩(wěn)定落地、實現(xiàn)大規(guī)模量產(chǎn),核心就取決于13萬轉(zhuǎn)暴力風(fēng)扇驅(qū)動方案的底層設(shè)計。
    的頭像 發(fā)表于 02-27 15:30 ?69次閱讀
    其利天下:<b class='flag-5'>13</b> 萬轉(zhuǎn)暴力風(fēng)扇,驅(qū)動方案需要滿足哪些核心技術(shù)要求?

    Pytorch 與 Visionfive2 兼容嗎?

    Pytorch 與 Visionfive2 兼容嗎? $ pip3 install torch torchvision torchaudio --index-url https
    發(fā)表于 02-06 08:28

    探索PWD13F60:高集成度功率驅(qū)動的卓越之選

    深入探討一款高集成度的功率驅(qū)動芯片——PWD13F60,看看它能為我們的設(shè)計帶來哪些驚喜。 文件下載: pwd13f60.pdf 產(chǎn)品概述 PWD13F60是一款高密度功率驅(qū)動芯片,它將柵極驅(qū)動器和四
    的頭像 發(fā)表于 01-28 09:25 ?162次閱讀

    汽車級多路復(fù)用器TMUX13xxA - Q1:特性、應(yīng)用與設(shè)計要點

    汽車級多路復(fù)用器TMUX13xxA - Q1:特性、應(yīng)用與設(shè)計要點 在汽車電子和工業(yè)自動化等領(lǐng)域,對于高性能、高可靠性的信號切換和復(fù)用解決方案的需求日益增長。德州儀器(TI)的TMUX13
    的頭像 發(fā)表于 01-12 15:55 ?237次閱讀

    Linux中13基本Cat命令示例

    文件中的多個文件 這將創(chuàng)建一名為test3并且所有輸出都將重定向到新創(chuàng)建的文件中。 # cat test test1 test2 > test3 13、在單個文件中對多個文件的內(nèi)容
    發(fā)表于 12-26 06:09

    探索 Kunlun Pi | 基于匠芯創(chuàng)D13x系列開發(fā)板分享(二)

    探索 Kunlun Pi | 基于匠芯創(chuàng)D13x系列開發(fā)板分享(二)
    的頭像 發(fā)表于 11-18 18:11 ?1802次閱讀
    探索 Kunlun Pi | 基于匠芯創(chuàng)D<b class='flag-5'>13</b>x系列開發(fā)板分享(二)

    Arm方案 基于Arm架構(gòu)的邊緣側(cè)設(shè)備(樹莓派或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文將為你展示如何在樹莓派或 NVIDIA Jetson Nano 等基于 Arm 架構(gòu)的邊緣側(cè)設(shè)備上部署 PyTorch 模型。
    的頭像 發(fā)表于 07-28 11:50 ?2879次閱讀

    OPPO K13 Turbo搭載天璣8450移動芯片

    OPPO K13 Turbo 搭載天璣 8450 移動芯片,該芯片采用創(chuàng)新的全大核 CPU 架構(gòu)設(shè)計,集成八 Cortex-A725 大核,無論是游戲開黑還是多任務(wù)并行處理都能輕松應(yīng)對;內(nèi)置 7
    的頭像 發(fā)表于 07-26 14:15 ?2325次閱讀

    鴻蒙應(yīng)用px,vp,fp概念詳解

    傳統(tǒng)移動端開發(fā)方向,轉(zhuǎn)到鴻蒙應(yīng)用開發(fā)方向。 前端開發(fā)同學(xué)對于開發(fā)范式很熟悉,但是對于工作流程和開發(fā)方式是會有不適感,其實移動應(yīng)用開發(fā)與前端開發(fā),最大的區(qū)別就在于UI適配和性能優(yōu)化上了。 今天我們就來分析下鴻蒙中UI適配的規(guī)范與小竅門。 二、 鴻蒙中vp、px、fp 是什么? 剛接觸鴻
    的頭像 發(fā)表于 07-07 11:48 ?1408次閱讀
    鴻蒙應(yīng)用px,vp,fp概念詳解

    摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    近日,摩爾線程正式發(fā)布Torch-MUSA v2.0.0版本,這是其面向PyTorch深度學(xué)習(xí)框架的MUSA擴展庫的重要升級。新版本基于MUSA Compute Capability 3.1計算架構(gòu)
    的頭像 發(fā)表于 05-11 16:41 ?1734次閱讀

    PCB設(shè)計:降低噪聲與電磁干擾的24竅門

    (1) 能用低速芯片就不用高速的,高速芯片用在關(guān)鍵地方?! 。?) 可用串一電阻的辦法,降低控制電路上下沿跳變速率?! 。?) 盡量為繼電器等提供某種形式的阻尼?! 。?) 使用滿足系統(tǒng)要求
    發(fā)表于 04-11 11:21

    如何在i.mx8mq的android13上啟用Widevine DRM?

    SOC:i.mx8mq 代碼: android-13.0.0_2.0.0 1. 我們還有另一 Android 11 代碼庫,它支持 Widevine。 Android 11 中有一 vendor
    發(fā)表于 04-11 06:44

    別再犯這些錯!使用樹莓派13常見雷區(qū)!

    不足、設(shè)備過熱或軟件故障——將幫助您規(guī)避許多麻煩,節(jié)省時間并減少不必要的困擾。13.初次設(shè)置過于復(fù)雜試圖一次性完成太多操作可能會導(dǎo)致挫敗感。RaspberryPi是
    的頭像 發(fā)表于 03-25 09:23 ?2006次閱讀
    別再犯這些錯!使用樹莓派<b class='flag-5'>13</b><b class='flag-5'>個</b>常見雷區(qū)!