91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓ResNet50圖像識別模型在光計算硬件上飛快運行

曦智科技 ? 來源:曦智科技 ? 2026-03-09 14:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你可能每天都在用圖像識別:手機(jī)相冊自動歸類、刷臉支付、甚至智能相機(jī)的寵物模式。但你有沒有想過,這些“一眼認(rèn)出”的本領(lǐng),是怎么教出來的?

今天我們就來聊聊一個經(jīng)典的圖像識別模型——ResNet50,以及如何讓它在光計算硬件上飛快運行。

01ResNet50:50層深度的“視覺專家”

ResNet50的大名,來自一個超級圖庫——ImageNet。

2007年,斯坦福教授李飛飛為了讓機(jī)器學(xué)會認(rèn)東西,牽頭建了這座“看圖識字界的維基百科”:120萬張訓(xùn)練圖、1000個類別,從貓狗汽車到吉他鸚鵡,應(yīng)有盡有。2010年起每年一屆的ILSVRC比賽,讓AlexNet、VGG、GoogLeNet、ResNet等一眾高手從這里走向世界。ResNet50正是2015年的冠軍,直到今天,“ImageNet預(yù)訓(xùn)練模型”依然是圖像識別任務(wù)的黃金起點。

ResNet50名字里的“50”不是瞎起的,它真的有50層神經(jīng)網(wǎng)絡(luò)。

你可以把它想象成一個多層篩選漏斗:

第0層:先粗粗看一遍,提取邊緣、顏色等基本特征(輸入224×224的彩色圖,經(jīng)過卷積、標(biāo)準(zhǔn)化、激活、池化,變成64×56×56的特征圖);

1~4 stage(每個stage對應(yīng)多層):層層遞進(jìn),從紋理、局部形狀,一直組合到完整的貓臉、車輪等高級語義;

最后一層:輸出一個1000維的向量,告訴你是貓(第283類)的概率是0.85,是狗的概率是0.02……

整個過程就像把一張照片不斷放大、再提煉,最終濃縮成一句話:“我覺得這是XXX”。

02怎么教它認(rèn)東西?像教小孩一樣

訓(xùn)練ResNet50,和教小朋友認(rèn)動物卡片差不多:

第一步:準(zhǔn)備練習(xí)題

把圖片統(tǒng)一裁成224×224,再隨機(jī)剪掉一小塊、左右翻一翻——這能增加難度,讓它學(xué)會“缺了塊耳朵也認(rèn)得出來”。

第二步:做題、對答案、糾錯

把圖片扔進(jìn)網(wǎng)絡(luò),得到預(yù)測結(jié)果,和真實標(biāo)簽比對(交叉熵?fù)p失函數(shù)算算差多遠(yuǎn)),然后用優(yōu)化器(SGD) 把參數(shù)往正確方向微調(diào)一點點。

第三步:重復(fù)、重復(fù)、再重復(fù)

學(xué)的時候還得“降溫”:一開始學(xué)習(xí)率設(shè)0.01,慢慢在10、20、30輪后降低到原來的1/10,這樣參數(shù)才震蕩得小,收斂得穩(wěn)。

03給模型“瘦身”:量化,讓它在光引擎上飛馳

今天,光計算加速卡已經(jīng)可以完美運行這個經(jīng)典圖像分類模型。

我們知道,ResNet50全精度模型(32位浮點數(shù))雖然跑得準(zhǔn),但它個頭大、耗電。如果想讓它在光計算芯片上實時跑圖像分類,就必須進(jìn)行“瘦身”。

怎么“瘦身”?量化——把32位小數(shù)縮成2位、3位、4位整數(shù)。

好比一張高清照片(32位色)壓縮成GIF(256色),肉眼幾乎看不出差別,文件卻小了幾十倍。

這里有兩種“瘦身”方法:

MOCA工具——PTQ算法

專門為光計算硬件定制的量化工具,可以把模型量化為8/4/3/2bit,并轉(zhuǎn)換成光計算芯片能識別的ONNX格式。訓(xùn)練時先加載預(yù)訓(xùn)練好的全精度模型,再用少量數(shù)據(jù)“微調(diào)”一下,恢復(fù)因壓縮損失的精度。

APOT算法

神經(jīng)網(wǎng)絡(luò)里的權(quán)重往往呈鐘形分布,集中在0附近。傳統(tǒng)方法把數(shù)值硬切成幾段,很浪費。APOT的做法是:用幾個2的冪相加來表示一個數(shù)值。

比如4bit量化,可以表示出0.0625、0.125、0.25、0.5、0.75……這些數(shù)值分布更符合真實權(quán)重,3bit量化ResNet-34,Top-1準(zhǔn)確率只掉0.3%,幾乎無損!

此外,APOT還做了權(quán)重歸一化:先讓權(quán)重變成均值為0、方差為1的標(biāo)準(zhǔn)分布,再裁剪和投影,量化效果更穩(wěn)定。

通過量化“瘦身”將ResNet50部署到光計算硬件上,意味著我們給這位“視覺專家”裝上了一個“光引擎”。這是經(jīng)典算法與新硬件的“握手”,更是光計算與人工智能深度融合的一次重要探索。

我們離“光速AI”的愿景又近了一步。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像識別
    +關(guān)注

    關(guān)注

    9

    文章

    534

    瀏覽量

    40069
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3755

    瀏覽量

    52121

原文標(biāo)題:當(dāng)光計算遇上ResNet50:給圖像識別模型裝上“光引擎”

文章出處:【微信號:曦智科技,微信公眾號:曦智科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ??低暤\花圖像識別智能系統(tǒng)推動水質(zhì)處理精細(xì)化管控

    為了解決這個痛點,海康威視推出礬花圖像識別智能系統(tǒng)——為水處理提質(zhì)增效,告別單一“肉眼判斷”時代。
    的頭像 發(fā)表于 01-10 16:08 ?2445次閱讀

    如何精準(zhǔn)驅(qū)動菜品識別模型--基于米爾瑞芯微RK3576邊緣計算

    ? 人工智能與邊緣計算深度融合的今天,將AI模型高效部署于終端設(shè)備已成為產(chǎn)業(yè)智能化的關(guān)鍵。本文將分享基于米爾MYD-LR3576邊緣計算盒子部署菜品
    發(fā)表于 10-31 21:19

    基于瑞芯微RK3576的resnet50訓(xùn)練部署教程

    Resnet50簡介ResNet50網(wǎng)絡(luò)是2015年由微軟實驗室的何愷明提出,獲得ILSVRC2015圖像分類競賽第一名。ResNet網(wǎng)絡(luò)
    的頭像 發(fā)表于 09-10 11:19 ?1330次閱讀
    基于瑞芯微RK3576的<b class='flag-5'>resnet50</b>訓(xùn)練部署教程

    基于米爾MYC-YM90X安路飛龍DR1開發(fā)板儀表圖像識別系統(tǒng)開發(fā)

    Linux 等操作系統(tǒng),為系統(tǒng)提供穩(wěn)定的軟件運行環(huán)境,負(fù)責(zé)復(fù)雜的系統(tǒng)管理、任務(wù)調(diào)度、用戶交互以及與外部設(shè)備的通信控制等工作。儀表圖像識別系統(tǒng)中,ARM 處理器可完成圖像識別算法的高
    發(fā)表于 08-17 21:29

    華怡豐推出ISC-B/C系列圖像識別傳感器

    工業(yè)自動化領(lǐng)域,精準(zhǔn)、高效的視覺檢測是提升生產(chǎn)效率的關(guān)鍵。華怡豐全新推出的ISC-B/C系列圖像識別傳感器集高精度定位、測量算法與先進(jìn)圖像處理技術(shù)于一體,為各類工業(yè)場景提供穩(wěn)定、可靠的解決方案!
    的頭像 發(fā)表于 08-15 11:36 ?1723次閱讀
    華怡豐推出ISC-B/C系列<b class='flag-5'>圖像識別</b>傳感器

    火車車號圖像識別系統(tǒng)如何應(yīng)對不同光照條件下的識別問題?

    鐵路運輸管理中,準(zhǔn)確識別火車車號是實現(xiàn)自動化車輛管理的關(guān)鍵環(huán)節(jié)。然而,實際應(yīng)用場景中復(fù)雜多變的光照條件給車號識別帶來了巨大挑戰(zhàn)?,F(xiàn)代火車車號圖像識別系統(tǒng)通過多項技術(shù)創(chuàng)新,有效解決了這
    的頭像 發(fā)表于 07-15 11:37 ?760次閱讀
    火車車號<b class='flag-5'>圖像識別</b>系統(tǒng)如何應(yīng)對不同光照條件下的<b class='flag-5'>識別</b>問題?

    模型時代的深度學(xué)習(xí)框架

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 CNN時代 ,AI模型的參數(shù)規(guī)模都在百萬級別,僅需單張消費類顯卡即可完成訓(xùn)練。例如,以業(yè)界知名的CNN
    的頭像 發(fā)表于 04-25 11:43 ?852次閱讀
    大<b class='flag-5'>模型</b>時代的深度學(xué)習(xí)框架

    基于RV1126開發(fā)板的resnet50訓(xùn)練部署教程

    本教程基于圖像分類算法ResNet50的訓(xùn)練和部署到EASY-EAI-Nano(RV1126)進(jìn)行說明
    的頭像 發(fā)表于 04-18 15:07 ?1146次閱讀
    基于RV1126開發(fā)板的<b class='flag-5'>resnet50</b>訓(xùn)練部署教程

    RK3588核心板邊緣AI計算中的顛覆性優(yōu)勢與場景落地

    、ResNet50模型,推理速度較純CPU方案(如i.MX8)快5-10倍,無需外接加速卡。 全接口覆蓋: 原生支持PCIe 3.0、雙千兆網(wǎng)口、USB 3.1 Gen2、SATA 3.0等接口,可擴(kuò)展5G模組
    發(fā)表于 04-15 10:48

    手持終端集裝箱識別系統(tǒng)的圖像識別技術(shù)

    行業(yè)提供了更靈活、精準(zhǔn)的管理工具。 一、技術(shù)核心:OCR+AI深度融合 現(xiàn)代手持終端系統(tǒng)采用多模態(tài)圖像識別技術(shù),結(jié)合深度學(xué)習(xí)算法,可快速捕捉并解析集裝箱號碼。其技術(shù)優(yōu)勢體現(xiàn)在: 1. 復(fù)雜環(huán)境適應(yīng)性:通過動態(tài)曝光補償和圖像增強(qiáng)算
    的頭像 發(fā)表于 04-03 10:49 ?735次閱讀

    岸橋箱號識別系統(tǒng)如何工作?揭秘AI圖像識別技術(shù)!

    港口自動化升級的浪潮中,AI岸橋識別系統(tǒng)憑借前沿的圖像識別技術(shù),成為提升碼頭作業(yè)效率的“智慧之眼”。那么,這套系統(tǒng)如何實現(xiàn)集裝箱信息的精準(zhǔn)捕捉?又是如何通過AI技術(shù)替代傳統(tǒng)人工理貨?讓我們一探
    的頭像 發(fā)表于 04-02 09:45 ?756次閱讀

    【幸狐Omni3576邊緣計算套件試用體驗】人臉識別

    標(biāo)定位置準(zhǔn)確。 多張人臉同時識別 單張人臉識別的基礎(chǔ),嘗試多張人臉同時識別的情況。 將目標(biāo)圖片上傳至板端并
    發(fā)表于 04-01 21:46

    驚了!這個“神器”樹莓派秒變智能管家,圖像識別+無線投屏,太秀了!

    和BalenaCloud,樹莓派實現(xiàn)從圖像識別到智能生活的華麗轉(zhuǎn)身!圖像分類項目:用樹莓派和BalenaOS實現(xiàn)智能識別1.項目背景:
    的頭像 發(fā)表于 03-25 09:23 ?1799次閱讀
    驚了!這個“神器”<b class='flag-5'>讓</b>樹莓派秒變智能管家,<b class='flag-5'>圖像識別</b>+無線投屏,太秀了!

    【幸狐Omni3576邊緣計算套件試用體驗】RKNN 推理測試與圖像識別

    的測試流程,包括 RKNN 介紹、環(huán)境搭建、推理測試、板端運行等,并對一些日常場景進(jìn)行推理識別,得益于板端強(qiáng)大的硬件支持,識別速度極快,取得了令人滿意的
    發(fā)表于 03-20 16:14