91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

二值神經網絡的介紹說明

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2021-01-31 09:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

每年都會開發(fā)出更深的模型來執(zhí)行各種任務,例如對象檢測,圖像分割等,這些任務始終能夠擊敗最新模型。但是,人們越來越關注使模型更輕便,更高效,以便它們可以在邊緣設備和移動設備上運行。這對于彌合機器學習的研究和生產價值之間的差距非常重要。

減少深度神經網絡的內存和計算成本的一種方法是二值神經網絡的概念。二值神經網絡的概念非常簡單,其中權重和激活張量的每個值都使用+1和-1表示,以便它們可以以1字節(jié)而不是全精度存儲(在1-中表示為0 位整數(shù))。使用以下所示的符號函數(shù)將浮點值轉換為二進制值-

現(xiàn)在,使用閾值函數(shù)作為上述函數(shù)的一個主要問題是該函數(shù)的梯度趨于為零。一種解決方案是使用直通估算器。直通估算器是一種在梯度傳遞過程中完全照原樣通過漸變而不會發(fā)生任何變化的估計器。這簡化了二值神經網絡中閾值函數(shù)的反向傳播機制,并顯示出很好的效果。

在梯度累積階段,將使用二進制權重和激活來累積每一層的梯度。但是權重更新是對實值原始權重進行的。為什么會這樣呢?讓我舉例說明。

我們在神經網絡中有一個值為0.05的節(jié)點(原始參數(shù))。

通過閾值函數(shù)傳遞此值后,我們獲得的值為1(二進制參數(shù))。

讓我們假設在二進制參數(shù)處累積的梯度為3。我們使用直通估計器的概念將其照原樣傳遞給原始參數(shù)。

現(xiàn)在,一旦累積了漸變,我們就可以更新值。

如果我們使用二進制值獲得新的參數(shù)值,則參數(shù)的新值將為10.1 * 3(其中0.1是學習率),即0.7。

如果我們使用原始參數(shù)值來獲取新參數(shù),則新值將為0.050.1 * 3,即-0.25。

這是可以注意到差異的地方。當我們執(zhí)行下一個迭代時,我們將再次通過二進制閾值函數(shù)傳遞新的參數(shù)值,它們將給出不同的結果。如果我們繼續(xù)使用參數(shù)的二進制值,則可能永遠無法更改該位,因為始終會根據(jù)1或-1計算損耗。

當更新參數(shù)值時,這些值將被裁剪為介于-1和1之間。主要原因是這些值只會增加/減少,否則對網絡沒有任何影響。需要注意的一件事是,最后一個激活層中的值未進行二值化,而是按原樣用于分類/回歸。這些是二值神經網絡的基本概念。

可以添加到權重和激活層二值化的另一個改進是使用縮放因子來表示權重和激活。在這里,比例因子只是權重向量中所有值的平均值的絕對值。如果我們有一個2 * 2矩陣,其值[[0.2,0.2],[-0.6,-0.6]],則比例因子α將為0.2,二進制矩陣表示為[[1,1],[-1,- 1]]。

因此,一旦權重和激活連同它們各自的縮放因子一起以二進制形式表示,就可以使用以下公式表示。在此,I和W分別表示激活層和權重層,而激活和權重的縮放因子分別使用κ和α表示。

現(xiàn)在,作為卷積運算基礎的乘積(MAC)函數(shù)是非常昂貴的運算?,F(xiàn)在,可以將其替換為XNOR + 彈出計數(shù)操作。 幾乎每個CPU都固有地執(zhí)行按位運算,并且這些運算的執(zhí)行速度明顯更快且成本更低。彈出計數(shù)操作只不過是檢查設置的位。下面的示例顯示了MAC操作可以由XNOR + 彈出計數(shù)操作代替。

但是二值神經網絡的主要缺點在于,它們無法實現(xiàn)與完全精度的深層網絡一樣高的精度。但這一直在緩慢地變化,并且每年(與每月發(fā)表論文的數(shù)量越來越相似),隨著差距的縮小,已經有了很多進步。由于人們越來越關注在具有有限計算資源的設備上實施機器學習模型,因此在未來幾年中,將會在該領域進行更多的研究。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4839

    瀏覽量

    108055
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    為什么 VisionFive V1 板上的 JH7100 中并存 NVDLA 引擎和神經網絡引擎?

    我想知道為什么 VisionFive V1 板上的 JH7100 中并存 NVDLA 引擎和神經網絡引擎,請問?您能否舉一些關于他們的用例的例子?
    發(fā)表于 03-25 06:01

    神經網絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經網絡的實現(xiàn)。什么是神經網絡?神經網絡的核心思想是模仿生物神經系統(tǒng)的結構,特別是大腦中神經
    的頭像 發(fā)表于 12-17 15:05 ?423次閱讀
    <b class='flag-5'>神經網絡</b>的初步認識

    自動駕駛中常提的卷積神經網絡是個啥?

    在自動駕駛領域,經常會聽到卷積神經網絡技術。卷積神經網絡,簡稱為CNN,是一種專門用來處理網格狀數(shù)據(jù)(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像素排列成的維網格。
    的頭像 發(fā)表于 11-19 18:15 ?2177次閱讀
    自動駕駛中常提的卷積<b class='flag-5'>神經網絡</b>是個啥?

    CNN卷積神經網絡設計原理及在MCU200T上仿真測試

    數(shù)的提出很大程度的解決了BP算法在優(yōu)化深層神經網絡時的梯度耗散問題。當x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當x&lt;0 時,該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSIS神經網絡庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經網絡內核,旨在最大限度地提高 Nuclei N 處理器內核上的神經網絡的性能并最??大限度地減少其內存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    構建CNN網絡模型并優(yōu)化的一般化建議

    整個模型非常巨大。所以要想實現(xiàn)輕量級的CNN神經網絡模型,首先應該避免嘗試單層神經網絡。 2)減少卷積核的大小:CNN神經網絡是通過權共享的方式,利用卷積運算從圖像中提取線性紋理。
    發(fā)表于 10-28 08:02

    在Ubuntu20.04系統(tǒng)中訓練神經網絡模型的一些經驗

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓練神經網絡模型的一些經驗。我們采用jupyter notebook作為開發(fā)IDE,以TensorFlow2為訓練框架,目標是訓練一個手寫數(shù)字識別的神經網絡
    發(fā)表于 10-22 07:03

    CICC2033神經網絡部署相關操作

    讀取。接下來需要使用擴展指令,完成神經網絡的部署,此處僅對第一層卷積+池化的部署進行說明,其余層與之類似。 1.使用 Custom_Dtrans 指令,將權重數(shù)據(jù)、輸入數(shù)據(jù)導入硬件加速器內。對于權重
    發(fā)表于 10-20 08:00

    液態(tài)神經網絡(LNN):時間連續(xù)性與動態(tài)適應性的神經網絡

    1.算法簡介液態(tài)神經網絡(LiquidNeuralNetworks,LNN)是一種新型的神經網絡架構,其設計理念借鑒自生物神經系統(tǒng),特別是秀麗隱桿線蟲的神經結構,盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1461次閱讀
    液態(tài)<b class='flag-5'>神經網絡</b>(LNN):時間連續(xù)性與動態(tài)適應性的<b class='flag-5'>神經網絡</b>

    神經網絡的并行計算與加速技術

    隨著人工智能技術的飛速發(fā)展,神經網絡在眾多領域展現(xiàn)出了巨大的潛力和廣泛的應用前景。然而,神經網絡模型的復雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計算方式面臨著巨大的挑戰(zhàn),如計算速度慢、訓練時間長等
    的頭像 發(fā)表于 09-17 13:31 ?1247次閱讀
    <b class='flag-5'>神經網絡</b>的并行計算與加速技術

    基于神經網絡的數(shù)字預失真模型解決方案

    在基于神經網絡的數(shù)字預失真(DPD)模型中,使用不同的激活函數(shù)對整個系統(tǒng)性能和能效有何影響?
    的頭像 發(fā)表于 08-29 14:01 ?3605次閱讀

    無刷電機小波神經網絡轉子位置檢測方法的研究

    摘要:論文通過對無刷電機數(shù)學模型的推導,得出轉角:與三相相電壓之間存在映射關系,因此構建了一個以三相相電壓為輸人,轉角為輸出的小波神經網絡來實現(xiàn)轉角預測,并采用改進遺傳算法來訓練網絡結構與參數(shù),借助
    發(fā)表于 06-25 13:06

    神經網絡專家系統(tǒng)在電機故障診斷中的應用

    摘要:針對傳統(tǒng)專家系統(tǒng)不能進行自學習、自適應的問題,本文提出了基于種經網絡專家系統(tǒng)的并步電機故障診斷方法。本文將小波神經網絡和專家系統(tǒng)相結合,充分發(fā)揮了者故障診斷的優(yōu)點,很大程度上降低了對電機
    發(fā)表于 06-16 22:09

    神經網絡RAS在異步電機轉速估計中的仿真研究

    眾多方法中,由于其結構簡單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產品開發(fā)。但是MRAS仍存在在低速區(qū)速度估計精度下降和對電動機參數(shù)變化非常敏感的問題。本文利用神經網絡的特點,使估計更為簡單、快速
    發(fā)表于 06-16 21:54

    基于FPGA搭建神經網絡的步驟解析

    本文的目的是在一個神經網絡已經通過python或者MATLAB訓練好的神經網絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1430次閱讀
    基于FPGA搭建<b class='flag-5'>神經網絡</b>的步驟解析