91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

關于MATLAB 圖像處理與深度學習的作用分析和介紹

MATLAB ? 來源:djl ? 2019-09-11 14:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文將展示如何通過圖像處理和深度學習來自動解算數(shù)獨謎題:

圖中的紅色數(shù)字均由算法生成。接下來我們將介紹如何創(chuàng)建該算法,并說明為何深度學習和圖像處理對于對象檢測和圖像分類同樣十分有用。

圖像處理與深度學習

我們重點介紹兩種技術:

圖像處理

按像素級別變換或者修改圖像。比如,過濾、模糊、去模糊和邊緣檢測等;

深度學習

通過學習樣本圖像自動識別圖像特點。近幾年,深度學習已經(jīng)徹底改變了圖像處理領域。

我們來探討下這兩種技術之間的關聯(lián)性。這里有兩種常見的觀點:

“深度學習已經(jīng)淘汰了‘傳統(tǒng)’的圖像處理方式?!?/p>

“深度學習需要數(shù)以百萬的學習樣本,而且只能用于貓咪圖片識別這類任務。”

但事實是:

深度學習和圖像處理都是非常有效的工具,可以解決各種難題,這些任務通常非常復雜,只有使用正確的工具才能解決問題。

數(shù)獨解謎

解算數(shù)獨(如下圖所示)的規(guī)則是:需確保每一行、每一列,以及所有 3x3 宮格都只包含 1 到 9 這九個數(shù)字,并且不能有任何重復,只有這樣才算完成。

關于MATLAB 圖像處理與深度學習的作用分析和介紹

數(shù)獨在開始時會提供一些數(shù)字。填入數(shù)字的大小和數(shù)量將決定解謎的難度。

我們希望算法能夠識別出宮格,并填入答案。但如果只是這樣,未免太簡單了點。我們還希望無論數(shù)獨位于圖片中的哪個位置,算法都能給出答案。這里有張照片,形象地展示了算法在解謎時可能需識別何種圖像:

為此,我們需要設計相應的步驟來處理任務。這就意味著我們可以把解謎分成若干步驟:

關于MATLAB 圖像處理與深度學習的作用分析和介紹

找到數(shù)獨——在圖像中定位數(shù)獨

找到宮格——在 9x9 的盤面中確定所有宮格

識別數(shù)字——必須能夠識別手寫或打印數(shù)字

解算數(shù)獨

以上所有步驟均可用深度學習或圖像處理中的一種方法來實現(xiàn)。那么,哪些步驟應該用深度學習實現(xiàn),哪些步驟應該用圖像處理來實現(xiàn)呢?

步驟1. 找到數(shù)獨

我們無法預計圖像、圖像背景和對象大小的情況。不同圖像的拍攝角度也可能大不相同。更不用說光照、相機拍攝條件等其它因素??勺円蛩貙嵲谑翘嗔?。

適用方法:深度學習

讓我們試試能否用語義分割為數(shù)獨圖片中的像素分類。為此,我們需要標記訓練數(shù)據(jù)。在 MATLAB 中使用 Image Labeler 標記需要的數(shù)據(jù)。這是標記完成后的最終輸入數(shù)據(jù):

https://www.mathworks.cn/help/vision/examples/semantic-segmentation-using-deep-learning.html

有一點值得注意,那就是數(shù)據(jù)集非常小——只有一百幅左右的圖像。讓我們試著訓練語義分割網(wǎng)絡,看看數(shù)據(jù)是否充分。

設置圖像數(shù)據(jù)倉庫,以便儲存用于語義分割網(wǎng)絡的像素信息。

關于MATLAB 圖像處理與深度學習的作用分析和介紹

然后我們要設置網(wǎng)絡層。這里要注意,我們創(chuàng)建了一個能夠借助分類權重使各個分類抵消的函數(shù)。

設置網(wǎng)絡:

關于MATLAB 圖像處理與深度學習的作用分析和介紹

這是訓練選項:

關于MATLAB 圖像處理與深度學習的作用分析和介紹

最后訓練網(wǎng)絡:

net = trainNetwork(train, layers, opts);

在這個階段中,大約需要 20 分鐘才能跑完 40 次樣本訓練。具體耗時可能因電腦硬件/GPU 性能不同而有所差異。網(wǎng)絡經(jīng)過訓練后,我們又換了一幅測試圖像,得出下述的結果:

結果很不錯!盡管圖片中的其它格狀圖形對算法產(chǎn)生了干擾,但影響十分有限。可在下個步驟去除這些小范圍噪點。

步驟2. 找到宮格

現(xiàn)在,我們需要在數(shù)獨盤面中識別出所有小宮格。這些宮格有著很明確的界定:筆直的邊線、總是深色的墨跡,以及大小一致的方形網(wǎng)格。在此提醒,我們在步驟 1 中已經(jīng)確定了數(shù)獨盤面的大致區(qū)域。我們可以將該區(qū)域以外的圖像全部涂黑,確保算法集中處理該區(qū)域。

適用方法:圖像處理

我們曾多次探討圖像處理,如果你不是圖像處理領域的專家,你只要記住——這并不會妨礙你!MATLAB提供了各種應用,能讓處理過程十分輕松。試試 Image Segmenter (https://www.mathworks.cn/help/images/ref/imagesegmenter-app.html),嘗試用它來檢測圖像中的宮格。下面這段代碼由該應用自動生成,可用于檢測圖像中的所有宮格。

首先需清理圖像,確保消除所有噪點。

BW_out = bwpropfilt(networkMask, 'Area', [100000 + eps(100000), Inf]);

然后要縮放遮罩,確保它覆蓋住整個盤面。

maskDilated = imdilate(BW_out, strel('disk', 120));

由于只需注意盤面所在區(qū)域,所以將其它區(qū)域全部涂黑。

grayIm = rgb2gray(im); grayIm(~maskDilated) = 0;

關于MATLAB 圖像處理與深度學習的作用分析和介紹

然后在圖像中精準摳取盤面。

關于MATLAB 圖像處理與深度學習的作用分析和介紹

可以看到執(zhí)行的結果非常準確,而且能夠經(jīng)受住各種干擾!

步驟3. 識別數(shù)字

有很多種方法可以識別手寫數(shù)字和打印數(shù)字。這個問題的難點在于,我們必須考慮到各種字號和字體。好在辦法也不少:

光學字符識別(OCR)是一種常見方法

結合了機器學習分類器的方向梯度直方圖(HOG)是另一種方法點擊此處查看MATLAB示例

好在手寫識別同樣是一個被廣泛研究的機器學習分類問題(請查看本示例,了解如何使用常見的MINST數(shù)據(jù)集來解決該問題;我寫過一篇類似文章,請點擊此處閱讀)。

適用方法:深度學習

該環(huán)節(jié)旨在識別打印數(shù)字或手寫數(shù)字,然后通過深度學習將其數(shù)字化(如下圖所示)。

關于MATLAB 圖像處理與深度學習的作用分析和介紹

為此,我們需要海量訓練數(shù)據(jù)來幫助算法理解字符之間的差異。考慮到訓練數(shù)據(jù)的海量程度,我們不可能手寫出所有訓練樣本,這太費時間了。

這時即可借助 MATLAB 生成合成數(shù)據(jù)。就手寫數(shù)字而言,這一步很簡單——只需從MNIST數(shù)據(jù)集中提取現(xiàn)成數(shù)據(jù),然后與下圖中的背景圖像合成。在合成各類打印數(shù)字時,我們希望數(shù)字看上去盡可能不同,以便確保它們無論采用何種字體(新羅馬、維丹娜等),都能被算法識別。

關于MATLAB 圖像處理與深度學習的作用分析和介紹

在合成以上兩類數(shù)字時,我們會盡可能確保數(shù)字的大小和位置每次都不盡相同。因為這樣我們就能盡可能多地生成數(shù)據(jù)!

合成圖像:手寫類型/打印類型

注:宮格的方框厚度同樣會隨機變厚或變薄,從而確保宮格各不相同。限于篇幅限制,本文對于合成數(shù)據(jù)的介紹十分有限。今后我會推出更多有關該主題的文章,請持續(xù)關注!

現(xiàn)在我們可以訓練網(wǎng)絡了。設置訓練選項,創(chuàng)建層,然后像之前那樣訓練網(wǎng)絡。

關于MATLAB 圖像處理與深度學習的作用分析和介紹

結果顯示,該網(wǎng)絡的準確度約為97.8%。就數(shù)獨解算而言,這個結果已經(jīng)足夠精確了。

步驟4. 解算數(shù)獨

我們已經(jīng)識別了宮格和數(shù)字?,F(xiàn)在輪到填寫答案了。

適用方法:都不需要!這是一個優(yōu)化問題

整合各個步驟

現(xiàn)在我們已經(jīng)完成了所有四個步驟,借助深度學習和圖像處理創(chuàng)建了一個能夠尋找最優(yōu)解的數(shù)獨解算器。

關于MATLAB 圖像處理與深度學習的作用分析和介紹

關于MATLAB 圖像處理與深度學習的作用分析和介紹

當您在處理和圖像或視頻有關的任務時,請務必牢記以下兩點重要提示:

深度學習適合解決某些問題,但并非所有問題都適合用深度學習解決。

圖像處理和深度學習都是十分有用的工具,可以將它們組合使用以便尋求最優(yōu)方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像處理
    +關注

    關注

    29

    文章

    1342

    瀏覽量

    59578
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124436
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何深度學習機器視覺的應用場景

    深度學習視覺應用場景大全 工業(yè)制造領域 復雜缺陷檢測:處理傳統(tǒng)算法難以描述的非標準化缺陷模式 非標產(chǎn)品分類:對形狀、顏色、紋理多變的產(chǎn)品進行智能分類 外觀質量評估:基于學習的外觀質量標
    的頭像 發(fā)表于 11-27 10:19 ?235次閱讀

    【新啟航】深度學習在玻璃晶圓 TTV 厚度數(shù)據(jù)智能分析中的應用

    。隨著深度學習在數(shù)據(jù)處理領域展現(xiàn)出強大能力,將其應用于玻璃晶圓 TTV 厚度數(shù)據(jù)智能分析,有助于實現(xiàn)高精度、高效率的質量檢測與工藝優(yōu)化,為行業(yè)發(fā)展提供新動能。
    的頭像 發(fā)表于 10-11 13:32 ?663次閱讀
    【新啟航】<b class='flag-5'>深度</b><b class='flag-5'>學習</b>在玻璃晶圓 TTV 厚度數(shù)據(jù)智能<b class='flag-5'>分析</b>中的應用

    MATLAB 助力香港中文大學解決生物醫(yī)學圖像處理挑戰(zhàn)

    Processing Toolbox? 加速了生物醫(yī)學圖像處理工作流程。借助 MathWorks 的軟件,研究人員高效地對萬億體素級別的圖像進行了分割和分析,以往這些任務需要高端計算
    的頭像 發(fā)表于 08-28 15:07 ?618次閱讀

    深度學習對工業(yè)物聯(lián)網(wǎng)有哪些幫助

    、實施路徑三個維度展開分析: 一、深度學習如何突破工業(yè)物聯(lián)網(wǎng)的技術瓶頸? 1. 非結構化數(shù)據(jù)處理:解鎖“沉睡數(shù)據(jù)”價值 傳統(tǒng)困境 :工業(yè)物聯(lián)網(wǎng)中70%以上的數(shù)據(jù)為非結構化數(shù)據(jù)(如設備振
    的頭像 發(fā)表于 08-20 14:56 ?1054次閱讀

    深度學習遇上嵌入式資源困境,特征空間如何破局?

    近年來,隨著人工智能(AI)技術的迅猛發(fā)展,深度學習(Deep Learning)成為最熱門的研究領域之一。在語音識別、圖像識別、自然語言處理等領域,
    發(fā)表于 07-14 14:50 ?1256次閱讀
    當<b class='flag-5'>深度</b><b class='flag-5'>學習</b>遇上嵌入式資源困境,特征空間如何破局?

    圖像信號分析處理卡設計原理圖:536-基于FMC接口的XCZU7EV 通用PCIe卡 視覺處理卡 工業(yè)控制卡

    XCZU7EV 通用PCIe卡 , 圖像信號分析處理卡 , 視覺處理卡 , 工業(yè)控制卡 , 存儲擴展卡
    的頭像 發(fā)表于 07-08 10:47 ?1284次閱讀
    <b class='flag-5'>圖像</b>信號<b class='flag-5'>分析</b><b class='flag-5'>處理</b>卡設計原理圖:536-基于FMC接口的XCZU7EV 通用PCIe卡 視覺<b class='flag-5'>處理</b>卡 工業(yè)控制卡

    普源示波器如何連接MATLAB實現(xiàn)數(shù)據(jù)采集與分析

    普源示波器(Rigol)作為國內(nèi)知名的測試測量儀器品牌,廣泛應用于電子工程、科研實驗、教學等領域。為了進一步擴展其功能,用戶常需將示波器與MATLAB等數(shù)據(jù)分析平臺連接,實現(xiàn)自動化測試、實時信號處理
    的頭像 發(fā)表于 05-29 09:34 ?1179次閱讀

    存儲示波器的存儲深度對信號分析有什么影響?

    存儲深度(Memory Depth)是數(shù)字示波器的核心參數(shù)之一,它直接決定了示波器在單次采集過程中能夠記錄的采樣點數(shù)量。存儲深度對信號分析的影響貫穿時域細節(jié)捕捉、頻域分析精度、觸發(fā)穩(wěn)定
    發(fā)表于 05-27 14:39

    工業(yè)相機的作用及未來發(fā)展

    工業(yè)相機核心作用是通過圖像處理分析,為工業(yè)自動化提供關鍵數(shù)據(jù)支持。
    的頭像 發(fā)表于 05-21 16:15 ?1102次閱讀
    工業(yè)相機的<b class='flag-5'>作用</b>及未來發(fā)展

    使用MATLAB進行無監(jiān)督學習

    無監(jiān)督學習是一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學習方法。無監(jiān)督學習旨在識別數(shù)據(jù)中隱藏的模式和關系,無需任何監(jiān)督或關于結果的先驗知識。
    的頭像 發(fā)表于 05-16 14:48 ?1470次閱讀
    使用<b class='flag-5'>MATLAB</b>進行無監(jiān)督<b class='flag-5'>學習</b>

    一文讀懂!圖像采集卡是什么?它在工業(yè)/醫(yī)療/監(jiān)控等多領域中的作用

    你有沒有想過,在工業(yè)檢測、醫(yī)院手術室、安防監(jiān)控這些高精度影像場景中,圖像是怎么被“抓”進電腦里進行分析處理的?單靠攝像頭就能搞定嗎?其實并沒那么簡單,真正起到關鍵作用的,是一種常被忽視
    的頭像 發(fā)表于 05-13 13:35 ?2209次閱讀
    一文讀懂!<b class='flag-5'>圖像</b>采集卡是什么?它在工業(yè)/醫(yī)療/監(jiān)控等多領域中的<b class='flag-5'>作用</b>

    進群免費領FPGA學習資料!數(shù)字信號處理、傅里葉變換與FPGA開發(fā)等

    的基礎知識,講述了確定性數(shù)字信號處理的知識,包括離散時間信號及系統(tǒng)的介紹、z變換、傅里葉變換、頻率分析以及濾波器設計等。介紹了隨機數(shù)字信號處理
    發(fā)表于 04-07 16:41

    龍門吊箱號識別系統(tǒng)的圖像處理技術解析

    識別系統(tǒng)應運而生,成為提升龍門吊作業(yè)自動化水平的重要解決方案。 核心技術:圖像處理深度學習的融合 1. 高精度圖像采集 系統(tǒng)采用工業(yè)級高清
    的頭像 發(fā)表于 03-25 10:25 ?739次閱讀

    【AIBOX 應用案例】單目深度估計

    了關鍵作用。深度估計技術可以分為多目深度估計和單目深度估計。其中單目攝像頭具有成本低、設備普及、圖像獲取方便等優(yōu)勢,使得單目
    的頭像 發(fā)表于 03-19 16:33 ?1135次閱讀
    【AIBOX 應用案例】單目<b class='flag-5'>深度</b>估計