91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

卷積神經(jīng)網(wǎng)絡是怎樣實現(xiàn)不變性特征提取的?

新機器視覺 ? 來源:OpenCV學堂 ? 作者:OpenCV學堂 ? 2021-04-30 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

圖像特征

傳統(tǒng)的圖像特征提取(特征工程)主要是基于各種先驗模型,通過提取圖像關鍵點、生成描述子特征數(shù)據(jù)、進行數(shù)據(jù)匹配或者機器學習方法對特征數(shù)據(jù)二分類/多分類實現(xiàn)圖像的對象檢測與識別。卷積神經(jīng)網(wǎng)絡通過計算機自動提取特征(表示工程)實現(xiàn)圖像特征的提取與抽象,通過MLP實現(xiàn)數(shù)據(jù)的回歸與分類。二者提取的特征數(shù)據(jù)都具不變性特征。

f71e58ea-a929-11eb-9728-12bb97331649.jpg

卷積神經(jīng)網(wǎng)絡為什么能提取到圖像特征,其關鍵在于卷積神經(jīng)網(wǎng)絡有兩種不同類型的層

-卷積層(convolution layers/detection layers)

-池化層(pooling layers)

卷積層

卷積層是一系列濾波器集合(filters set)、它的輸出結(jié)果被稱為特征映射(feature maps),每個feature map都一個filter在圖像上卷積得到的輸出。一般情況下都會輸出結(jié)果加線性修正,對卷積層常用就是ReLU

f72949da-a929-11eb-9728-12bb97331649.png

這樣做的好處是:

卷積是一個線性操作,我們需要一個非線性組合,否則兩個卷積卷積層還不如一個卷積層

兩個相反方向的邊緣不應該被取消

使圖像梯度值更加的稀疏、有助于提高反向傳播的效果

假設灰度輸入圖像,有兩個filter,卷積層生成過程如下所示:

假設灰度輸入圖像,有兩個filter,卷積層生成過程如下所示:

f7332e50-a929-11eb-9728-12bb97331649.jpg

膨脹卷積

通常我們常見的卷積層操作使用的filter都是基于連續(xù)鄰近像素的,除了這種卷積filter之后另外還有一張卷積filter被稱為膨脹卷積,其算子的分布更加的稀疏,圖示如下:

f73ee704-a929-11eb-9728-12bb97331649.jpg

膨脹卷積在不增加網(wǎng)絡總參數(shù)的情況下,提升每個感受野的尺度大小。

1x1卷積

1x1的卷積首次使用是在Network In Network網(wǎng)絡模型中,后來受到越來越多的關注,在一般情況下我們的卷積是2D的,1x1的卷積操作是毫無意義的,但是對卷積神經(jīng)網(wǎng)絡來說,它的卷積層是三維的,所以1x1的卷積操作是有意義的。

f77ec374-a929-11eb-9728-12bb97331649.jpg

卷積層大小計算

對于一個輸入大小WxW的feature map,假設Filter的大小位FxF,卷積時填充邊緣P個像素、卷積步長(stride)為S則輸出的大小為:

f7a9c042-a929-11eb-9728-12bb97331649.png

在多數(shù)深度學習框架中支持兩種輸出大小計算:

padding = “same”

意味著使用填充邊緣的方式,輸出大小與輸入的feature map大小保持不變

padding = “valid”

意味著不使用邊緣填充,即P=0此時輸出大小為:

f7b36d4a-a929-11eb-9728-12bb97331649.png

池化層

在卷積層提取到的特征數(shù)據(jù)不具備空間不變性(尺度與遷移不變性特征),只有通過了池化層之后才會具備空間不變性特征。池化層是針對每個feature map進行池化操作,池化操作的窗口大小可以指定為任意尺寸,主要有兩種類型的池化操作

-下采樣池化(均值池化)

-最大值池化

下采樣池化

f7cb92e4-a929-11eb-9728-12bb97331649.png

對每個窗口大小取均值,然后乘以標量beta加上我們增益偏置b的輸出

最大值池化

f7d574e4-a929-11eb-9728-12bb97331649.png

無論是選擇哪種池化方式都會輸出一個新低分辨率feature map,多數(shù)時候這個過程中會包含一定的信息損失,所以卷積神經(jīng)網(wǎng)絡一般通過擴展深度(增加feature map的數(shù)量)來補償。

重疊窗口與稀疏窗口

在進行池化的時候我們?nèi)绻x擇步長=1進行池化,通過這樣的池化方式輸出的結(jié)果我們稱為重疊池化輸出,它不利于特征的稀疏生成,重疊窗口池化與均值池化都有這樣的缺點,所以經(jīng)常采樣的是最大值池化,同時不會進行窗口重疊,有實驗結(jié)果表明,在卷積層保持相同feature map與參數(shù)的情況下,最大值池化的結(jié)果明顯優(yōu)于重疊池化與均值池化,而且網(wǎng)絡的深度越深,兩者之間的準確度差異越大。

總結(jié)

最終卷積神經(jīng)網(wǎng)絡經(jīng)過池化層操作對單位像素遷移和亮度影響進行了校正,做到了圖像的遷移與亮度不變性的特征提取、而且在池化過程中通過不斷的降低圖像分辨率,構(gòu)建了圖像的多尺度特征,所以還具備尺度空間不變性,完成了圖像不變性特征提取工作。

f7e0128c-a929-11eb-9728-12bb97331649.jpg

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 濾波器
    +關注

    關注

    162

    文章

    8412

    瀏覽量

    185749
  • 圖像
    +關注

    關注

    2

    文章

    1096

    瀏覽量

    42336
  • 卷積神經(jīng)網(wǎng)絡

    關注

    4

    文章

    372

    瀏覽量

    12878

原文標題:卷積神經(jīng)網(wǎng)絡是如何實現(xiàn)不變性特征提取的

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    神經(jīng)網(wǎng)絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經(jīng)網(wǎng)絡實現(xiàn)。什么是神經(jīng)網(wǎng)絡?神經(jīng)網(wǎng)絡的核心思想是模仿生物神經(jīng)系統(tǒng)的結(jié)構(gòu),特別是大
    的頭像 發(fā)表于 12-17 15:05 ?336次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡</b>的初步認識

    自動駕駛中常提的卷積神經(jīng)網(wǎng)絡是個啥?

    在自動駕駛領域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡技術。卷積神經(jīng)網(wǎng)絡,簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像
    的頭像 發(fā)表于 11-19 18:15 ?2082次閱讀
    自動駕駛中常提的<b class='flag-5'>卷積</b><b class='flag-5'>神經(jīng)網(wǎng)絡</b>是個啥?

    CNN卷積神經(jīng)網(wǎng)絡設計原理及在MCU200T上仿真測試

    CNN算法簡介 我們硬件加速器的模型為Lenet-5的變型,網(wǎng)絡粗略分共有7層,細分共有13層。包括卷積,最大池化層,激活層,扁平層,全連接層。下面是各層作用介紹: 卷積層:提取
    發(fā)表于 10-29 07:49

    NMSIS神經(jīng)網(wǎng)絡庫使用介紹

    :   神經(jīng)網(wǎng)絡卷積函數(shù)   神經(jīng)網(wǎng)絡激活函數(shù)   全連接層函數(shù)   神經(jīng)網(wǎng)絡池化函數(shù)   Softmax 函數(shù)   神經(jīng)網(wǎng)絡支持功能
    發(fā)表于 10-29 06:08

    構(gòu)建CNN網(wǎng)絡模型并優(yōu)化的一般化建議

    整個模型非常巨大。所以要想實現(xiàn)輕量級的CNN神經(jīng)網(wǎng)絡模型,首先應該避免嘗試單層神經(jīng)網(wǎng)絡。 2)減少卷積核的大?。篊NN神經(jīng)網(wǎng)絡是通過權(quán)值共
    發(fā)表于 10-28 08:02

    卷積運算分析

    的數(shù)據(jù),故設計了ConvUnit模塊實現(xiàn)單個感受域規(guī)模的卷積運算. 卷積運算:不同于數(shù)學當中提及到的卷積概念,CNN神經(jīng)網(wǎng)絡中的
    發(fā)表于 10-28 07:31

    NMSIS庫的使用

    nmsis core、nmsis dsp和nmsis nn三個組件,分別提供了對處理器核心和外設、數(shù)字信號處理庫和神經(jīng)網(wǎng)絡內(nèi)核的支持。 卷積、激活、池化是卷積神經(jīng)網(wǎng)絡中常用的三種操作,
    發(fā)表于 10-24 09:58

    如何通過地址生成器實現(xiàn)神經(jīng)網(wǎng)絡特征圖的padding?

    對于SiamFC網(wǎng)絡結(jié)構(gòu),我們設計的卷積核寬度為3*3,卷積步長為1,則經(jīng)卷積過后,特征圖寬度會減少2,為了滿足我們所設計的pe陣列的計算要
    發(fā)表于 10-22 08:15

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗

    , batch_size=512, epochs=20)總結(jié) 這個核心算法中的卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)和訓練過程,是用來對MNIST手寫數(shù)字圖像進行分類的。模型將圖像作為輸入,通過卷積和池化層提取
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡部署相關操作

    讀取。接下來需要使用擴展指令,完成神經(jīng)網(wǎng)絡的部署,此處僅對第一層卷積+池化的部署進行說明,其余層與之類似。 1.使用 Custom_Dtrans 指令,將權(quán)重數(shù)據(jù)、輸入數(shù)據(jù)導入硬件加速器內(nèi)。對于權(quán)重
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(LNN):時間連續(xù)性與動態(tài)適應性的神經(jīng)網(wǎng)絡

    1.算法簡介液態(tài)神經(jīng)網(wǎng)絡(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡架構(gòu),其設計理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線蟲的神經(jīng)結(jié)構(gòu),盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1234次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡</b>(LNN):時間連續(xù)性與動態(tài)適應性的<b class='flag-5'>神經(jīng)網(wǎng)絡</b>

    卷積神經(jīng)網(wǎng)絡如何監(jiān)測皮帶堵料情況 #人工智能

    卷積神經(jīng)網(wǎng)絡
    jf_60804796
    發(fā)布于 :2025年07月01日 17:08:42

    無刷電機小波神經(jīng)網(wǎng)絡轉(zhuǎn)子位置檢測方法的研究

    摘要:論文通過對無刷電機數(shù)學模型的推導,得出轉(zhuǎn)角:與三相相電壓之間存在映射關系,因此構(gòu)建了一個以三相相電壓為輸人,轉(zhuǎn)角為輸出的小波神經(jīng)網(wǎng)絡實現(xiàn)轉(zhuǎn)角預測,并采用改進遺傳算法來訓練網(wǎng)絡結(jié)構(gòu)與參數(shù),借助
    發(fā)表于 06-25 13:06

    基于FPGA搭建神經(jīng)網(wǎng)絡的步驟解析

    本文的目的是在一個神經(jīng)網(wǎng)絡已經(jīng)通過python或者MATLAB訓練好的神經(jīng)網(wǎng)絡模型,將訓練好的模型的權(quán)重和偏置文件以TXT文件格式導出,然后通過python程序?qū)xt文件轉(zhuǎn)化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1230次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的步驟解析

    在友晶LabCloud平臺上使用PipeCNN實現(xiàn)ImageNet圖像分類

    利用深度卷積神經(jīng)網(wǎng)絡(CNN)進行圖像分類是通過使用多個卷積層來從輸入數(shù)據(jù)中提取特征,最后通過分類層做決策來識別出目標物體。
    的頭像 發(fā)表于 04-23 09:42 ?1092次閱讀
    在友晶LabCloud平臺上使用PipeCNN<b class='flag-5'>實現(xiàn)</b>ImageNet圖像分類