91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣AI的模型壓縮技術(shù)

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Rakesh R. Nakod ? 2022-10-19 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)在模型及其數(shù)據(jù)集方面正在以驚人的速度增長(zhǎng)。在應(yīng)用方面,深度學(xué)習(xí)市場(chǎng)以圖像識(shí)別為主,其次是光學(xué)字符識(shí)別,以及面部和物體識(shí)別。根據(jù) Allied 的市場(chǎng)調(diào)查,2020 年全球深度學(xué)習(xí)市場(chǎng)規(guī)模為 68.5 億美元,預(yù)計(jì)到 2030 年將達(dá)到 1799.6 億美元,從 2021 年到 2030 年的復(fù)合年增長(zhǎng)率為 39.2%。

在某個(gè)時(shí)間點(diǎn),人們認(rèn)為大型和復(fù)雜的模型表現(xiàn)更好,但現(xiàn)在它幾乎是一個(gè)神話。隨著邊緣AI的發(fā)展,越來(lái)越多的技術(shù)將大型復(fù)雜模型轉(zhuǎn)換為可以在邊緣上運(yùn)行的簡(jiǎn)單模型,所有這些技術(shù)結(jié)合在一起執(zhí)行模型壓縮。

什么是模型壓縮?

模型壓縮是在具有低計(jì)算能力和內(nèi)存的邊緣設(shè)備上部署SOTA(最先進(jìn)的)深度學(xué)習(xí)模型的過(guò)程,而不會(huì)影響模型在準(zhǔn)確性,精度,召回性等方面的性能。模型壓縮廣泛地減少了模型中的兩件事,即大小和延遲。大小減小側(cè)重于通過(guò)減少模型參數(shù)使模型更簡(jiǎn)單,從而減少執(zhí)行中的 RAM 要求和內(nèi)存中的存儲(chǔ)要求。減少延遲是指減少模型進(jìn)行預(yù)測(cè)或推斷結(jié)果所花費(fèi)的時(shí)間。模型大小和延遲通常是一起的,大多數(shù)技術(shù)都會(huì)減少兩者。

流行的模型壓縮技術(shù)

修剪:

修剪是模型壓縮的最流行的技術(shù),它通過(guò)刪除冗余和無(wú)關(guān)緊要的參數(shù)來(lái)工作。神經(jīng)網(wǎng)絡(luò)中的這些參數(shù)可以是連接器、神經(jīng)元、通道,甚至是層。它很受歡迎,因?yàn)樗瑫r(shí)減小了模型的大小并改善了延遲。

pYYBAGNPl6-AZ2uZAAGw_oTIvEs500.png

修剪

修剪可以在訓(xùn)練模型時(shí)或在訓(xùn)練后完成。有不同類型的修剪技術(shù),包括重量/連接修剪,神經(jīng)元修剪,過(guò)濾器修剪和層修剪。

量化:

當(dāng)我們?cè)谛藜糁幸瞥窠?jīng)元,連接,過(guò)濾器,層等以減少加權(quán)參數(shù)的數(shù)量時(shí),權(quán)重的大小在量化過(guò)程中減小。在此過(guò)程中,較大集中的值將映射到較小集中的值。與輸入網(wǎng)絡(luò)相比,輸出網(wǎng)絡(luò)的值范圍較窄,但保留了大部分信息。

知識(shí)提煉:

在知識(shí)提煉過(guò)程中,一個(gè)復(fù)雜而大型的模型在一個(gè)非常大的數(shù)據(jù)集上被訓(xùn)練。微調(diào)大型模型后,它可以很好地處理看不見(jiàn)的數(shù)據(jù)。一旦實(shí)現(xiàn),這些知識(shí)就會(huì)轉(zhuǎn)移到較小的神經(jīng)網(wǎng)絡(luò)或模型中。同時(shí)使用教師網(wǎng)絡(luò)(較大模型)和學(xué)生網(wǎng)絡(luò)(較小模型)。這里存在兩個(gè)方面,知識(shí)提煉,其中我們不調(diào)整教師模型,而在遷移學(xué)習(xí)中,我們使用確切的模型和權(quán)重,在一定程度上改變模型,并針對(duì)相關(guān)任務(wù)進(jìn)行調(diào)整。

poYBAGNPl7aAcED2AAB8DjxHRCw852.png

知識(shí)蒸餾系統(tǒng)

知識(shí)、蒸餾算法和師生架構(gòu)模型是典型知識(shí)蒸餾系統(tǒng)的三個(gè)主要部分,如上圖所示。

低矩陣分解:

矩陣構(gòu)成了大多數(shù)深度神經(jīng)架構(gòu)的大部分。該技術(shù)旨在通過(guò)應(yīng)用矩陣或張量分解并將它們變成更小的矩陣來(lái)識(shí)別冗余參數(shù)。當(dāng)應(yīng)用于密集 DNN(深度神經(jīng)網(wǎng)絡(luò))時(shí),此技術(shù)可降低 CNN(卷積神經(jīng)網(wǎng)絡(luò))層的存儲(chǔ)要求和因式分解,并縮短推理時(shí)間。具有二維且具有秩 r 的權(quán)重矩陣 A 可以分解為更小的矩陣,如下所示。

poYBAGNPl72AUTPYAABK48-5WA8433.png

低矩陣因式分解

模型準(zhǔn)確性和性能在很大程度上取決于正確的因式分解和秩選擇。低秩因式分解過(guò)程中的主要挑戰(zhàn)是更難實(shí)現(xiàn),并且計(jì)算密集型??傮w而言,與全秩矩陣表示相比,密集層矩陣的因式分解可導(dǎo)致更小的模型和更快的性能。

由于邊緣AI,模型壓縮策略變得非常重要。這些方法相互補(bǔ)充,可以在整個(gè)AI管道的各個(gè)階段使用。像張量流和Pytorch這樣的流行框架現(xiàn)在包括修剪和量化等技術(shù)。最終,該領(lǐng)域使用的技術(shù)數(shù)量將會(huì)增加。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 連接器
    +關(guān)注

    關(guān)注

    104

    文章

    16139

    瀏覽量

    147038
  • RAM
    RAM
    +關(guān)注

    關(guān)注

    8

    文章

    1399

    瀏覽量

    120563
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124398
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    意法半導(dǎo)體STM32 AI模型庫(kù)助力邊緣AI落地應(yīng)用

    在開(kāi)發(fā)邊緣AI(Edge AI)時(shí),可以說(shuō)“理解問(wèn)題本身”就已成功了一半。然而,隨著AI模型持續(xù)演進(jìn),即便是經(jīng)驗(yàn)豐富的工程師,也會(huì)發(fā)現(xiàn)優(yōu)化變
    的頭像 發(fā)表于 01-14 11:07 ?619次閱讀

    直播有禮 | 瑞薩邊緣AI線上技術(shù)月——AI MCU/MPU產(chǎn)品及邊緣AI案例集

    RA生態(tài)工作室關(guān)注我們隨著人工智能技術(shù)不斷迭代,使用遠(yuǎn)端算力平臺(tái)進(jìn)行模型部署和AI計(jì)算并在端側(cè)決策成為可能,邊緣AI
    的頭像 發(fā)表于 01-13 18:05 ?520次閱讀
    直播有禮 | 瑞薩<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>線上<b class='flag-5'>技術(shù)</b>月——<b class='flag-5'>AI</b> MCU/MPU產(chǎn)品及<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>案例集

    影像儀AI自動(dòng)尋邊技術(shù)精準(zhǔn)捕捉邊界測(cè)量,檢測(cè)效率翻倍!

    【智能制造測(cè)量】影像測(cè)量?jī)x的AI自動(dòng)尋邊技術(shù)是通過(guò)深度學(xué)習(xí)模型,實(shí)現(xiàn)對(duì)工件特征的自主識(shí)別與邊緣精準(zhǔn)提取。能解決質(zhì)檢環(huán)節(jié)中多重邊界提偏、刀紋干擾、對(duì)比度低等測(cè)量痛點(diǎn)。
    發(fā)表于 11-18 10:16

    如何利用NPU與模型壓縮技術(shù)優(yōu)化邊緣AI

    ,AI 模型體積龐大,部署在 NPU上常常面臨困難,這凸顯了模型壓縮技術(shù)的重要性。要實(shí)現(xiàn)高效的實(shí)時(shí)邊緣
    的頭像 發(fā)表于 11-07 15:26 ?1261次閱讀
    如何利用NPU與<b class='flag-5'>模型</b><b class='flag-5'>壓縮</b><b class='flag-5'>技術(shù)</b>優(yōu)化<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    如果你關(guān)注最新進(jìn)展,可能已經(jīng)知道 Nordic Semiconductor 收購(gòu)了 Neuton.AI。 Neuton 是一家邊緣 AI 公司,致力于使機(jī)器學(xué)習(xí)模型更易于訪問(wèn)。它創(chuàng)建的
    發(fā)表于 08-31 20:54

    AI 邊緣計(jì)算網(wǎng)關(guān):開(kāi)啟智能新時(shí)代的鑰匙?—龍興物聯(lián)

    順暢地通向云端,實(shí)現(xiàn)設(shè)備與云端之間高效的數(shù)據(jù)傳輸與交互。通過(guò)融合先進(jìn)的邊緣計(jì)算和人工智能技術(shù)AI 邊緣計(jì)算網(wǎng)關(guān)能夠在靠近數(shù)據(jù)源的網(wǎng)絡(luò)邊緣
    發(fā)表于 08-09 16:40

    邊緣智能網(wǎng)關(guān)在水務(wù)行業(yè)中的應(yīng)用—龍興物聯(lián)

    /管網(wǎng)的“數(shù)字鏡像”載體,實(shí)時(shí)映射狀態(tài)并運(yùn)行本地仿真模型,支持快速預(yù)測(cè)和決策。 隨著邊緣計(jì)算、AI技術(shù)的持續(xù)突破,邊緣智能網(wǎng)關(guān)在水務(wù)領(lǐng)域的
    發(fā)表于 08-02 18:28

    Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    與 Nordic 的 nRF54 系列超低功耗無(wú)線 SoC 結(jié)合,使得即使是資源極為有限的設(shè)備也能高效運(yùn)行邊緣 AI。Nordic 目前正在將 Neuton 深度集成到自身開(kāi)發(fā)生態(tài)中,未來(lái)會(huì)提供更多工具、固件
    發(fā)表于 06-28 14:18

    邊緣AI實(shí)現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署

    邊緣AI的實(shí)現(xiàn)原理是將人工智能算法和模型部署到靠近數(shù)據(jù)源的邊緣設(shè)備上,使這些設(shè)備能夠在本地進(jìn)行數(shù)據(jù)處理、分析和決策,而無(wú)需將數(shù)據(jù)傳輸?shù)竭h(yuǎn)程的云端服務(wù)器。
    的頭像 發(fā)表于 06-19 12:19 ?1383次閱讀
    <b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>實(shí)現(xiàn)的核心環(huán)節(jié):硬件選擇和<b class='flag-5'>模型</b>部署

    邊緣AI的優(yōu)勢(shì)和技術(shù)基石

    在萬(wàn)物皆可AI(人工智能)的今天,市場(chǎng)上幾乎每家企業(yè)都在宣稱自己的業(yè)務(wù)中有了AI成分。因此,將AI接入極靠近終端客戶的網(wǎng)絡(luò)邊緣也就沒(méi)什么懸念了。這里的
    的頭像 發(fā)表于 06-12 10:14 ?1468次閱讀
    <b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>的優(yōu)勢(shì)和<b class='flag-5'>技術(shù)</b>基石

    邊緣AI實(shí)現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署

    電子發(fā)燒友網(wǎng)綜合報(bào)道 邊緣AI的實(shí)現(xiàn)原理是將人工智能算法和模型部署到靠近數(shù)據(jù)源的邊緣設(shè)備上,使這些設(shè)備能夠在本地進(jìn)行數(shù)據(jù)處理、分析和決策,而無(wú)需將數(shù)據(jù)傳輸?shù)竭h(yuǎn)程的云端服務(wù)器。
    發(fā)表于 05-26 07:09 ?1469次閱讀

    Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計(jì)算AI框架,提供了一套開(kāi)放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對(duì)差異化AI 應(yīng)用場(chǎng)景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05

    意法半導(dǎo)體邊緣AI套件中提供的全部工具

    意法半導(dǎo)體邊緣AI套件(ST Edge AI Suite)是一套專為邊緣AI開(kāi)發(fā)設(shè)計(jì)的集成化工具集合,覆蓋從數(shù)據(jù)采集、
    的頭像 發(fā)表于 04-21 17:46 ?1618次閱讀

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功怎么處理?

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功咋辦,試了好幾個(gè)模型壓縮了也不行,ram占用過(guò)大,有無(wú)解決方案?
    發(fā)表于 03-11 07:18