91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OCR識(shí)別技術(shù)

新機(jī)器視覺 ? 來源:企通查 ? 作者:企通查 ? 2021-03-12 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在爬蟲對(duì)驗(yàn)證碼進(jìn)行破解時(shí),經(jīng)常需要對(duì)圖片中的文字內(nèi)容進(jìn)行識(shí)別,這時(shí)就需要用到OCR技術(shù)了,那么 OCR識(shí)別技術(shù)是如何實(shí)現(xiàn)對(duì)文字內(nèi)容“即拍即得”的呢?

OCR(Optical Character Recognition)即光學(xué)字符識(shí)別技術(shù),實(shí)質(zhì)屬于計(jì)算機(jī)輸入技術(shù)。OCR通過利用光學(xué)技術(shù)與計(jì)算機(jī)技術(shù)對(duì)圖片、紙張、物體等處的文本內(nèi)容進(jìn)行分析識(shí)別,并讀取轉(zhuǎn)換成計(jì)算機(jī)和人類都能理解接受的格式。

OCR主要可以分為手寫體識(shí)別和印刷體識(shí)別。

由于印刷體都是計(jì)算機(jī)自助生成再進(jìn)行輸出,通常較為規(guī)律,因此較手寫體識(shí)別來說要更簡(jiǎn)單。而手寫體由于往往會(huì)帶有個(gè)人特色,每個(gè)人的風(fēng)格不盡相同,由于其千人千面的特性,手寫體識(shí)別也成了OCR界一直想攻克的難關(guān)。當(dāng)然,除了手寫體與印刷體外,OCR也可以根據(jù)識(shí)別內(nèi)容來分類。例如按語言分類,要識(shí)別的內(nèi)容將可能包括漢語、英語、日語、法語等,而如果僅滿足國(guó)人需求,要識(shí)別的內(nèi)容就可能會(huì)包括漢字、英文字母、阿拉伯?dāng)?shù)字、標(biāo)點(diǎn)符號(hào)等。

通常根據(jù)要識(shí)別的內(nèi)容不同,識(shí)別的難度也不同。比如僅識(shí)別阿拉伯?dāng)?shù)字,只需能識(shí)別出0-9,而英文字母則需要識(shí)別52個(gè)字符(僅考慮大小寫),而中文識(shí)別則會(huì)高達(dá)數(shù)千個(gè),且由于漢字的結(jié)構(gòu)偏旁較為復(fù)雜,要將這些字符都準(zhǔn)確識(shí)別出來會(huì)使難度系數(shù)直線上升。一個(gè)典型的OCR技術(shù)處理流程如下圖所示:

圖:來源于網(wǎng)絡(luò)

其中,圖像預(yù)處理通常為能使圖像中的文字更明顯便于識(shí)別,會(huì)對(duì)圖像的成像問題進(jìn)行修正,通常是基于數(shù)字圖像處理和傳統(tǒng)機(jī)器學(xué)習(xí)等方法對(duì)圖像進(jìn)行操作。

常見的圖像預(yù)處理包括幾何變換(透視、翻轉(zhuǎn)、旋轉(zhuǎn)、扭曲、拉直等)、畸變矯正、去模糊、銳化、圖像增強(qiáng)、光線矯正、灰度化、二值化等。其中,在對(duì)付驗(yàn)證碼時(shí)常用的灰度化、二值化處理對(duì)于內(nèi)容較為簡(jiǎn)單的文本信息有增強(qiáng)作用,但對(duì)復(fù)雜背景的內(nèi)容處理效果就會(huì)收效甚微。

文字檢測(cè),顧名思義是對(duì)圖片中存在的文字內(nèi)容進(jìn)行檢測(cè),檢測(cè)內(nèi)容包括文本所在的位置、范圍、布局、數(shù)量等,通常也包括整體版面分析和文字行檢測(cè)等。部分OCR軟件為了保證檢測(cè)范圍的準(zhǔn)確性,還會(huì)套用圖像檢測(cè)的方法,對(duì)圖像中的文本區(qū)域進(jìn)行框選,并像下圖所示將框選與待識(shí)別區(qū)域交由令用戶進(jìn)行校驗(yàn)確認(rèn)。

圖:某OCR軟件識(shí)別界面

文本檢測(cè)完成后,建立在其基礎(chǔ)之上的文本識(shí)別將會(huì)對(duì)選定的文本內(nèi)容進(jìn)行識(shí)別,并將圖像中的字符轉(zhuǎn)化為可供人類和計(jì)算機(jī)識(shí)別的文本信息。文本信息主要需要解決的問題是每個(gè)字符是什么。

對(duì)于識(shí)別后輸出的文本通常需要再次核對(duì)驗(yàn)證以確保其準(zhǔn)確率,即文本校正,通常也被認(rèn)為屬于文字檢測(cè)的環(huán)節(jié)。當(dāng)識(shí)別的內(nèi)容是由詞庫中的詞匯構(gòu)成時(shí)就稱之為有詞典識(shí)別,反之則稱為無詞典識(shí)別。在整個(gè)處理流程過程中,對(duì)識(shí)別準(zhǔn)確率影響最大的步驟就是文本檢測(cè)與文本識(shí)別。相比一般文本,通常對(duì)OCR技術(shù)的評(píng)測(cè)會(huì)從最終識(shí)別率、識(shí)別速度、版面理解正確率、版面還原滿意度4方面來作為依據(jù)。

OCR識(shí)別技術(shù)對(duì)于手寫體識(shí)別目前尚在發(fā)展階段,而對(duì)于印刷體識(shí)別的技術(shù)已經(jīng)發(fā)展的較為純熟。而且,對(duì)于印刷體識(shí)別的應(yīng)用劃分可能遠(yuǎn)比你我想象的更為細(xì)致。例如用于對(duì)人身份進(jìn)行核查驗(yàn)證的證件OCR識(shí)別、用于移動(dòng)支付綁卡的銀行卡OCR識(shí)別、用于存儲(chǔ)管理名片的名片OCR識(shí)別、用于大量文字資料、檔案卷宗的錄入和處理的文檔OCR識(shí)別、用于銀行、金融、電信機(jī)構(gòu)的票據(jù)OCR識(shí)別、用于交通安全的車輛OCR識(shí)別等。

OCR技術(shù)的出現(xiàn)無疑提升了工作效率,也改變了我們的生活。

參考文獻(xiàn):

https://www.sohu.com/a/233167039_205239

https://zhuanlan.zhihu.com/p/45376274

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    175

    瀏覽量

    17206

原文標(biāo)題:文字識(shí)別界的“拍立得”——OCR識(shí)別技術(shù)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工業(yè)級(jí)OCR手持終端怎么選?國(guó)產(chǎn)OCR智能識(shí)別pda實(shí)測(cè)

    工業(yè)環(huán)境專用OCR智能PDA怎么選?鳥鳥科技N70Socr具備IP67防塵防水+1.5米抗跌落,5000mAh可拆卸電池支持24小時(shí)輪班作業(yè)。專業(yè)OCR掃描頭+斑馬/霍尼二維碼引擎雙模組,285g人體工學(xué)設(shè)計(jì),讓高強(qiáng)度數(shù)據(jù)采集更輕松。點(diǎn)擊查看詳細(xì)防護(hù)測(cè)試與續(xù)航實(shí)測(cè)數(shù)據(jù)!
    的頭像 發(fā)表于 02-07 17:45 ?228次閱讀
    工業(yè)級(jí)<b class='flag-5'>OCR</b>手持終端怎么選?國(guó)產(chǎn)<b class='flag-5'>OCR</b>智能<b class='flag-5'>識(shí)別</b>pda實(shí)測(cè)

    DeepX OCR:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺(tái)交付可規(guī)?;母咝阅?OCR 能力

    一、行業(yè)背景與核心挑戰(zhàn):OCR 規(guī)模化應(yīng)用的關(guān)鍵瓶頸 **隨著文檔識(shí)別技術(shù)的不斷成熟,OCR 技術(shù)已從實(shí)驗(yàn)性階段逐步走向?qū)嶋H業(yè)務(wù)場(chǎng)景,在政務(wù)
    的頭像 發(fā)表于 01-22 21:02 ?163次閱讀
    DeepX <b class='flag-5'>OCR</b>:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺(tái)交付可規(guī)?;母咝阅?<b class='flag-5'>OCR</b> 能力

    瑞芯微(EASY EAI)RV1126B OCR文字識(shí)別

    1.OCR文字識(shí)別簡(jiǎn)介文字識(shí)別也是圖像領(lǐng)域一個(gè)常見問題。然而,對(duì)于自然場(chǎng)景圖像,首先要定位圖像中的文字位置,然后才能進(jìn)行文字的識(shí)別。所以一般包含兩個(gè)步驟:文字檢測(cè):解決的問題是哪里有文
    的頭像 發(fā)表于 01-12 10:19 ?5815次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>OCR</b>文字<b class='flag-5'>識(shí)別</b>

    識(shí)別身份證和護(hù)照OCR識(shí)別的手持終端設(shè)備

    鳥鳥科技N70S身份證護(hù)照識(shí)別手持終端設(shè)備,集成身份證、護(hù)照OCR識(shí)別及生物核驗(yàn)功能,工業(yè)級(jí)IP67三防設(shè)計(jì)+高性能配置,支持多場(chǎng)景移動(dòng)辦公,續(xù)航持久、掃碼精準(zhǔn),是執(zhí)法、海關(guān)、醫(yī)療等行業(yè)提升身份核驗(yàn)效率的優(yōu)選神器。
    的頭像 發(fā)表于 01-06 11:57 ?254次閱讀
    能<b class='flag-5'>識(shí)別</b>身份證和護(hù)照<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>的手持終端設(shè)備

    如何利用OCR技術(shù)實(shí)現(xiàn)高效集裝箱箱號(hào)識(shí)別?

    在現(xiàn)代物流和海關(guān)監(jiān)管領(lǐng)域,快速準(zhǔn)確地識(shí)別集裝箱箱號(hào)是提升通關(guān)效率、降低運(yùn)營(yíng)成本的關(guān)鍵。OCR(光學(xué)字符識(shí)別技術(shù)的應(yīng)用,為這一需求提供了智能化解決方案。通過結(jié)合高清成像設(shè)備和先進(jìn)的算法
    的頭像 發(fā)表于 08-12 10:48 ?865次閱讀
    如何利用<b class='flag-5'>OCR</b><b class='flag-5'>技術(shù)</b>實(shí)現(xiàn)高效集裝箱箱號(hào)<b class='flag-5'>識(shí)別</b>?

    ocr識(shí)別時(shí)數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0,為什么?

    ocr識(shí)別時(shí)數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0
    發(fā)表于 07-23 08:11

    端側(cè)OCR文字識(shí)別實(shí)現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    獲取圖片url,把這個(gè)url和token再發(fā)給百度的ocr接口獲取識(shí)別數(shù)據(jù)……或者圖片轉(zhuǎn)base64以后把這個(gè)base64發(fā)給接口,然而鴻蒙這里,目前我也不知道啥原因(可能是發(fā)送請(qǐng)求的數(shù)據(jù)長(zhǎng)度有限
    發(fā)表于 06-30 18:07

    OCR技術(shù)如何實(shí)現(xiàn)鐵路集裝箱號(hào)的自動(dòng)識(shí)別

    在鐵路物流運(yùn)輸中,集裝箱號(hào)的快速準(zhǔn)確識(shí)別是提升效率的關(guān)鍵環(huán)節(jié)。通過先進(jìn)的OCR(光學(xué)字符識(shí)別技術(shù),結(jié)合計(jì)算機(jī)視覺與深度學(xué)習(xí)方法,可以實(shí)現(xiàn)鐵路集裝箱號(hào)的高效、可靠
    的頭像 發(fā)表于 06-13 10:32 ?648次閱讀

    OCR技術(shù)vs傳統(tǒng)識(shí)別:哪種更適合火車集裝箱識(shí)別?

    在鐵路物流領(lǐng)域,集裝箱箱號(hào)識(shí)別是提升運(yùn)輸效率的關(guān)鍵環(huán)節(jié)。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,OCR識(shí)別與傳統(tǒng)識(shí)別
    的頭像 發(fā)表于 06-11 10:54 ?627次閱讀

    明治案例 | 150個(gè)/分鐘!電阻【OCR識(shí)別】+【尺寸測(cè)量】一步到位

    真實(shí)案例——看明治傳感如何用一個(gè)視覺傳感器,同時(shí)搞定電阻的尺寸測(cè)量和OCR識(shí)別,讓質(zhì)檢效率翻倍,成本直降!場(chǎng)景需求希望在同一工位完成尺寸測(cè)量與OCR識(shí)別,減少設(shè)備占
    的頭像 發(fā)表于 06-10 07:33 ?797次閱讀
    明治案例 | 150個(gè)/分鐘!電阻【<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>】+【尺寸測(cè)量】一步到位

    OCR識(shí)別訓(xùn)練完成后給的是空壓縮包,為什么?

    OCR識(shí)別 一共弄了26張圖片,都標(biāo)注好了,點(diǎn)擊開始訓(xùn)練,顯示訓(xùn)練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點(diǎn),參考我們的ocr
    發(fā)表于 05-28 06:46

    rfid技術(shù)是如何應(yīng)用在集裝箱自動(dòng)識(shí)別的呢?

    在現(xiàn)代集裝箱物流管理中,快速、準(zhǔn)確地識(shí)別集裝箱號(hào)碼是提升港口、堆場(chǎng)和海關(guān)運(yùn)作效率的關(guān)鍵。隨著技術(shù)的發(fā)展,RFID(射頻識(shí)別技術(shù)OCR視覺
    的頭像 發(fā)表于 04-18 10:13 ?912次閱讀
    rfid<b class='flag-5'>技術(shù)</b>是如何應(yīng)用在集裝箱自動(dòng)<b class='flag-5'>識(shí)別</b>的呢?

    大模型預(yù)標(biāo)注和自動(dòng)化標(biāo)注在OCR標(biāo)注場(chǎng)景的應(yīng)用

    OCR,即光學(xué)字符識(shí)別,簡(jiǎn)單來說就是利用光學(xué)設(shè)備去捕獲圖像并識(shí)別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時(shí)代,OCR(光學(xué)字符識(shí)
    的頭像 發(fā)表于 04-15 15:18 ?950次閱讀

    阿普奇視覺控制器AK7在OCR識(shí)別場(chǎng)景中的應(yīng)用

    在實(shí)際工業(yè)生產(chǎn)中,OCR(光學(xué)字符識(shí)別技術(shù)的應(yīng)用逐漸普及,在食品包裝、新能源、汽車制造、3C電子等領(lǐng)域幫助企業(yè)完成產(chǎn)品編碼、生產(chǎn)日期、批號(hào)等字符信息自動(dòng)識(shí)別,對(duì)于避免因出現(xiàn)瑕疵、錯(cuò)漏
    的頭像 發(fā)表于 03-20 11:44 ?786次閱讀
    阿普奇視覺控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>場(chǎng)景中的應(yīng)用