91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

卷積神經(jīng)網(wǎng)絡(luò) 物體檢測 YOLOv2

倩倩 ? 來源:三姐的哥 ? 2020-04-17 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

繼2015的YOLO后,2016年作者對YOLO升級到Y(jié)OLO2,另外一個版本YOLO9000是基于wordtree跨數(shù)據(jù)集達(dá)到檢測9000個分類,卷積層模型稱為darknet-19,達(dá)到速度和效果的雙提升,文章里充滿了作者的自豪,也值得自豪;

作者正視了YOLO的兩個大問題:回歸框不精準(zhǔn)和召回不夠;一般的解決思路都是把網(wǎng)絡(luò)加深加寬,不過本文不屑,作者反而要通過優(yōu)化網(wǎng)絡(luò)學(xué)習(xí)在準(zhǔn)確率不降的情況下提升精度和召回!

升級點(diǎn)

Batch Normalization:每個卷積層加了BN,正則都不要了,droupout也省了,過擬合也沒了,效果還好了,+2%mAP;

High Resolution Classifier - 高分辨率分類:模型訓(xùn)練時經(jīng)典做法都是先在ImageNet上pre-train,然而ImageNet上的圖片是低分辨率小于256*256的,而要檢測的圖片是高分辨率448*448的,這樣模型需要同時在高分辨的圖片上做fine-tune和檢測,所以作者提出了三步驟 1) 在ImageNet低分辨率上pre-train;2) 在高分辨率數(shù)據(jù)集上fine-tune;3) 在高分辨率數(shù)據(jù)集上檢測;使得模型更容易學(xué)習(xí),+4%mAP

Convolution with Anchor Boxer - 加Anchor機(jī)制:YOLO是通過最后的全連接層直接預(yù)估絕對坐標(biāo),而FasterRCNN是通過卷積層預(yù)估相對坐標(biāo),作者認(rèn)為這樣更容易學(xué)習(xí),因此YOLOv2去掉了全連接層,在最后一層卷積層下采樣后用Anchor,yolo有7*7*2 = 98個框,而YOLOv2有超過1k的anchor,最終效果上雖然mAP略有下降3個千分點(diǎn),但是召回提升7個百分點(diǎn),值了!

Dimension Clusters - 維度聚類: Anchor的尺寸faster rcnn里人工選定的,YOLOv2通過k-mean聚類的方法,將訓(xùn)練數(shù)據(jù)里gt的框進(jìn)行聚類,注意這里不能直接用歐式距離,大框會比小框影響大,我們的目標(biāo)是IOU,因此距離為: d(box, centroid) = 1 IOU(box, centroid);下圖是結(jié)果,左圖是k和IOU的trand-off,右圖是5個中心的框尺寸,明顯看出和人工指定的差異很大;

Direct location prediction - 直接預(yù)測位置:直接預(yù)測x,y會導(dǎo)致模型訓(xùn)練不穩(wěn)定,本文預(yù)測如下tx,ty,tw,th,to,通過sigmolid歸一化到(0,1),結(jié)合dimension clusters,+5%mAP

Fine-Grained Freture - 細(xì)粒度特征:引入passthrough layer,將低維度特征傳遞給高維度,類似于resnet的shortcut,+1%mAP;

Multi-Scale Training - 多尺度訓(xùn)練:這里的多尺度是圖片的尺寸,多了迫使模型適應(yīng)更大范圍的尺寸,每隔一定的epoch就強(qiáng)制改變輸入圖片的尺寸;

效果

如下是在VOC數(shù)據(jù)集上效率(每秒處理幀數(shù))和效果(mAP)空間里不同算法的變現(xiàn),其中YOLOv2為藍(lán)色,有不同的trade-off,效率和效果都超過已有的方法;

如下是更多的實(shí)驗(yàn)結(jié)果:

如下是COCO上的效果,看得出COCO數(shù)據(jù)集還是很難的,小物體上YOLO2依然是差一些;

YOLO9000: Better, Faster, Stronger

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98074
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26201
  • voc
    voc
    +關(guān)注

    關(guān)注

    0

    文章

    110

    瀏覽量

    16191
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識

    日常生活中的智能應(yīng)用都離不開深度學(xué)習(xí),而深度學(xué)習(xí)則依賴于神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)。什么是神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)的核心思想是模仿生物神經(jīng)系統(tǒng)的結(jié)構(gòu),特別是大腦中神經(jīng)
    的頭像 發(fā)表于 12-17 15:05 ?335次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的初步認(rèn)識

    自動駕駛中常提的卷積神經(jīng)網(wǎng)絡(luò)是個啥?

    在自動駕駛領(lǐng)域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡(luò)技術(shù)。卷積神經(jīng)網(wǎng)絡(luò),簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學(xué)習(xí)模型。CNN在圖像處理中尤其常見,因?yàn)閳D像本身就可以看作是由像
    的頭像 發(fā)表于 11-19 18:15 ?2078次閱讀
    自動駕駛中常提的<b class='flag-5'>卷積</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>是個啥?

    CNN卷積神經(jīng)網(wǎng)絡(luò)設(shè)計原理及在MCU200T上仿真測試

    數(shù)的提出很大程度的解決了BP算法在優(yōu)化深層神經(jīng)網(wǎng)絡(luò)時的梯度耗散問題。當(dāng)x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當(dāng)x&lt;0 時,該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSIS神經(jīng)網(wǎng)絡(luò)庫使用介紹

    :   神經(jīng)網(wǎng)絡(luò)卷積函數(shù)   神經(jīng)網(wǎng)絡(luò)激活函數(shù)   全連接層函數(shù)   神經(jīng)網(wǎng)絡(luò)池化函數(shù)   Softmax 函數(shù)   神經(jīng)網(wǎng)絡(luò)支持功能
    發(fā)表于 10-29 06:08

    構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議

    整個模型非常巨大。所以要想實(shí)現(xiàn)輕量級的CNN神經(jīng)網(wǎng)絡(luò)模型,首先應(yīng)該避免嘗試單層神經(jīng)網(wǎng)絡(luò)。 2)減少卷積核的大?。篊NN神經(jīng)網(wǎng)絡(luò)是通過權(quán)值共
    發(fā)表于 10-28 08:02

    卷積運(yùn)算分析

    的數(shù)據(jù),故設(shè)計了ConvUnit模塊實(shí)現(xiàn)單個感受域規(guī)模的卷積運(yùn)算. 卷積運(yùn)算:不同于數(shù)學(xué)當(dāng)中提及到的卷積概念,CNN神經(jīng)網(wǎng)絡(luò)中的卷積嚴(yán)格意義
    發(fā)表于 10-28 07:31

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)

    構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型 model = models.Sequential()model.add(layers.Conv2D(input_shape=(28, 28, 1), filters=4
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作

    讀取。接下來需要使用擴(kuò)展指令,完成神經(jīng)網(wǎng)絡(luò)的部署,此處僅對第一層卷積+池化的部署進(jìn)行說明,其余層與之類似。 1.使用 Custom_Dtrans 指令,將權(quán)重數(shù)據(jù)、輸入數(shù)據(jù)導(dǎo)入硬件加速器內(nèi)。對于權(quán)重
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時間連續(xù)性與動態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)

    1.算法簡介液態(tài)神經(jīng)網(wǎng)絡(luò)(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡(luò)架構(gòu),其設(shè)計理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線蟲的神經(jīng)結(jié)構(gòu),盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1226次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>(LNN):時間連續(xù)性與動態(tài)適應(yīng)性的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    神經(jīng)網(wǎng)絡(luò)的并行計算與加速技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和廣泛的應(yīng)用前景。然而,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計算方式面臨著巨大的挑戰(zhàn),如計算速度慢、訓(xùn)練時間長等
    的頭像 發(fā)表于 09-17 13:31 ?1130次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的并行計算與加速技術(shù)

    【嘉楠堪智K230開發(fā)板試用體驗(yàn)】01 Studio K230開發(fā)板Test2——手掌,手勢檢測,字符檢測

    這篇發(fā)完就繼續(xù)去整比賽了,后續(xù)看電賽上k230的發(fā)揮吧 之前的顏色識別和二維碼識別功能,類似于使用基礎(chǔ)工具進(jìn)行圖像分析,適用于簡單任務(wù),但在復(fù)雜場景下能力有限。 KPU(神經(jīng)網(wǎng)絡(luò)處理器)則是
    發(fā)表于 07-10 09:45

    卷積神經(jīng)網(wǎng)絡(luò)如何監(jiān)測皮帶堵料情況 #人工智能

    卷積神經(jīng)網(wǎng)絡(luò)
    jf_60804796
    發(fā)布于 :2025年07月01日 17:08:42

    無刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測方法的研究

    MATLAB/SIMULINK工具對該方法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該方法在全程速度下效果良好。 純分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資料~~~ *附件:無刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測方法的研究.pdf
    發(fā)表于 06-25 13:06

    RV1126 yolov8訓(xùn)練部署教程

    YOLOv8 是 ultralytics 公司在 2023 年 1月 10 號開源的基于YOLOV5進(jìn)行更新的 下一個重大更新版本,目前支持圖像分類、物體檢測和實(shí)例分割任務(wù),鑒于Yolov
    的頭像 發(fā)表于 04-16 14:53 ?1459次閱讀
    RV1126 <b class='flag-5'>yolov</b>8訓(xùn)練部署教程

    自動駕駛感知系統(tǒng)中卷積神經(jīng)網(wǎng)絡(luò)原理的疑點(diǎn)分析

    背景 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)的核心技術(shù)主要包括以下幾個方面:局部連接、權(quán)值共享、多卷積核以及池化。這些技術(shù)共同作用,使得CNN在圖像
    的頭像 發(fā)表于 04-07 09:15 ?851次閱讀
    自動駕駛感知系統(tǒng)中<b class='flag-5'>卷積</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>原理的疑點(diǎn)分析