91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PaddleOCR歷史表現(xiàn)回顧

新機(jī)器視覺(jué) ? 來(lái)源:CSDN ? 作者:CSDN ? 2021-04-15 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、導(dǎo)讀

OCR方向的工程師,一定需要知道這個(gè)OCR開(kāi)源項(xiàng)目:PaddleOCR

短短半年時(shí)間,累計(jì)Star數(shù)量已超過(guò)11.5K,

頻頻登上Github Trending和Paperswithcode 日榜月榜第一,

在《Github 2020數(shù)字洞察報(bào)告》中被評(píng)為中國(guó)Github Top20活躍項(xiàng)目。

稱它為 OCR方向目前最火的repo絕對(duì)不為過(guò)。

最近,它又帶來(lái)兩項(xiàng)全新發(fā)布:

AAAI 2021 頂會(huì)論文開(kāi)源:PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network 提出了一種簡(jiǎn)單且有效的任意方向端到端文本識(shí)別模型,在精度可比的基礎(chǔ)上,與之前大火的ABCNet相比,預(yù)測(cè)速度快了三倍,達(dá)到SOTA效果。

多語(yǔ)言支持種類提升至80+種:基本覆蓋國(guó)際主流語(yǔ)言種類,在開(kāi)源測(cè)試集MLT2017評(píng)估,中文、韓文、日文、拉丁語(yǔ)系、阿拉伯語(yǔ)系,識(shí)別效果均顯著優(yōu)于EasyOCR,開(kāi)源SOTA效果。

二、PaddleOCR歷史表現(xiàn)回顧

先看下PaddleOCR自去年6月開(kāi)源以來(lái),短短幾個(gè)月在GitHub上的表現(xiàn):

2020年6月,8.6M超輕量模型發(fā)布,GitHub Trending 全球趨勢(shì)榜日榜第一。

2020年8月,開(kāi)源CVPR2020頂會(huì)算法,再上GitHub趨勢(shì)榜單!

2020年10月,發(fā)布PP-OCR算法,開(kāi)源3.5M超超輕量模型,再下Paperswithcode 趨勢(shì)榜第一

2021年1月,發(fā)布Style-Text文本合成算法,PPOCRLabel數(shù)據(jù)標(biāo)注工具,star數(shù)量突破10000+,截至目前已經(jīng)達(dá)到11.5k,在《Github 2020數(shù)字洞察報(bào)告》中被評(píng)為中國(guó)Github Top20活躍項(xiàng)目。

e7b9998a-9cdd-11eb-8b86-12bb97331649.gif


這個(gè)含金量,廣大的GitHub開(kāi)發(fā)者們自然懂

超輕量模型的效果:火車票、表格、金屬銘牌、翻轉(zhuǎn)圖片、外語(yǔ)都是妥妥的,

e7c6ba70-9cdd-11eb-8b86-12bb97331649.gif

動(dòng)靜統(tǒng)一的開(kāi)發(fā)體驗(yàn)

動(dòng)態(tài)圖和靜態(tài)圖是深度學(xué)習(xí)框架常用的兩種模式。在動(dòng)態(tài)圖模式下,代碼編寫(xiě)運(yùn)行方式符合Python程序員的習(xí)慣,易于調(diào)試,但在性能方面, Python執(zhí)行開(kāi)銷較大,與C++有一定差距。

相比動(dòng)態(tài)圖,靜態(tài)圖在部署方面更具有性能的優(yōu)勢(shì)。靜態(tài)圖程序在編譯執(zhí)行時(shí),預(yù)先搭建好的神經(jīng)網(wǎng)絡(luò)可以脫離Python依賴,在C++端被重新解析執(zhí)行,而且擁有整體網(wǎng)絡(luò)結(jié)構(gòu)也能進(jìn)行一些網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化。

飛槳?jiǎng)討B(tài)圖中新增了動(dòng)態(tài)圖轉(zhuǎn)靜態(tài)圖的功能,支持用戶使用動(dòng)態(tài)圖編寫(xiě)組網(wǎng)代碼。預(yù)測(cè)部署時(shí),飛槳會(huì)對(duì)用戶代碼進(jìn)行分析,自動(dòng)轉(zhuǎn)換為靜態(tài)圖網(wǎng)絡(luò)結(jié)構(gòu),兼顧了動(dòng)態(tài)圖易用性和靜態(tài)圖部署性能兩方面優(yōu)勢(shì)。

文本合成工具Style-Text效果:相比于傳統(tǒng)的數(shù)據(jù)合成算法,Style-Text可以實(shí)現(xiàn)特殊背景下的圖片風(fēng)格遷移,只需要少許目標(biāo)場(chǎng)景圖像,就可以合成大量數(shù)據(jù),效果展示如下:

e83d58e2-9cdd-11eb-8b86-12bb97331649.png

半自動(dòng)標(biāo)注工具PPOCRLabel:通過(guò)內(nèi)置高質(zhì)量的PPOCR中英文超輕量預(yù)訓(xùn)練模型,可以實(shí)現(xiàn)OCR數(shù)據(jù)的高效標(biāo)注。CPU機(jī)器運(yùn)行也是完全沒(méi)問(wèn)題的。效果演示如下:

e85051ea-9cdd-11eb-8b86-12bb97331649.gif

用法也是非常的簡(jiǎn)單,標(biāo)注效率提升60%-80%是妥妥的。

傳送門:

Github:https://github.com/PaddlePaddle/PaddleOCR

那么最近的2021年4月份更新,又給大家?guī)?lái)哪些驚喜呢?

三、AAAI 2021 頂會(huì)論文:端到端SOTA算法PGNet開(kāi)源:

直接先看指標(biāo)評(píng)測(cè)表現(xiàn):PGNet算法在ICDAR2015數(shù)據(jù)集上的檢測(cè)及端到端性能表現(xiàn),在精度接近的條件下,速度上與之前大火的ABCNet相比翻了三倍,達(dá)到了SOTA的效果。

e92bad3a-9cdd-11eb-8b86-12bb97331649.png

圖1:PGNet模型的速度與精度性能對(duì)比

詳細(xì)數(shù)據(jù)指標(biāo):

e936e65a-9cdd-11eb-8b86-12bb97331649.png

表1:ICDAR2015數(shù)據(jù)集上的檢測(cè)及端到端性能

PGNet提出的方法框架如下圖所示,輸入的圖象經(jīng)過(guò)Backbone網(wǎng)絡(luò)得到1/4下采樣特征圖,通過(guò)多任務(wù)學(xué)習(xí),同時(shí)回歸四個(gè)任務(wù)的內(nèi)容,包括文本邊緣偏移量預(yù)測(cè)(TBO),文本中心線預(yù)測(cè)(TCL),文本方向偏移量預(yù)測(cè)(TDO)以及文本字符分類圖預(yù)測(cè)(TCC)。其中文本行的檢測(cè)結(jié)果由TBO以及TCL經(jīng)過(guò)后處理得到,文本行的識(shí)別結(jié)果由TCL,TDO以及TCC的輸出得到。

e94c2998-9cdd-11eb-8b86-12bb97331649.png

圖2 網(wǎng)絡(luò)流程框架

在ICDAR2015以及Total-Text數(shù)據(jù)集上可以看一下模型效果:

e9572848-9cdd-11eb-8b86-12bb97331649.png

圖3Total-Text及ICDAR2015數(shù)據(jù)集可視化效果圖

PGNet論文地址:https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf

【基于頂尖算法,開(kāi)放拿來(lái)即用的成熟印章識(shí)別能力】同時(shí),基于PGNet研發(fā)的印章識(shí)別能力已經(jīng)在百度AI開(kāi)放平臺(tái)開(kāi)放,可以有效檢測(cè)并識(shí)別合同文件或常用票據(jù)中的印章,輸出文字內(nèi)容、印章位置信息以及相關(guān)置信度,已支持圓形章、橢圓形章、方形章等常見(jiàn)印章。提供標(biāo)準(zhǔn)化API接口,快速集成,同時(shí)支持私有化部署至本地,保障業(yè)務(wù)數(shù)據(jù)私密性。

ea1bdd82-9cdd-11eb-8b86-12bb97331649.gif

開(kāi)放能力地址:https://ai.baidu.com/tech/ocr/seal

注:此處非模型直接開(kāi)源,但可以申請(qǐng)免費(fèi)試用。

四、豐富的多語(yǔ)言種類支持,目前已經(jīng)支持全球80+ 語(yǔ)言模型

簡(jiǎn)單對(duì)比一下目前主流OCR方向開(kāi)源repo的核心能力:

中英文模型性能及功能對(duì)比

ea4c7a82-9cdd-11eb-8b86-12bb97331649.jpg

其中,部分多語(yǔ)言模型性能及功能(F1-Score)對(duì)比(僅EasyOCR提供)

ea5daa0a-9cdd-11eb-8b86-12bb97331649.png

模型效果

ea671720-9cdd-11eb-8b86-12bb97331649.gif


值得一提的是,目前已經(jīng)有全球開(kāi)發(fā)者通過(guò)PR或者issue的方式為PaddleOCR提供多語(yǔ)言的字典和語(yǔ)料,在PaddleOCR上已經(jīng)完成了全球80+ 主流語(yǔ)言的廣泛覆蓋:包括中文簡(jiǎn)體、中文繁體、英文、法文、德文、韓文、日文、意大利文、西班牙文、葡萄牙文、俄羅斯文、阿拉伯文、印地文、維吾爾文、波斯文、烏爾都文、塞爾維亞文(latin)、歐西坦文、馬拉地文、尼泊爾文、塞爾維亞文、保加利亞文、烏克蘭文、白俄羅斯文、泰盧固文、卡納達(dá)文、泰米爾文,也歡迎更多開(kāi)發(fā)者可以參與共建。

五、良心出品的中英文文檔教程

ea9e056e-9cdd-11eb-8b86-12bb97331649.png


別的不需要多說(shuō)了,大家訪問(wèn)GitHub點(diǎn)過(guò)star之后自己體驗(yàn)吧:https://github.com/PaddlePaddle/PaddleOCR

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    572

    瀏覽量

    11323
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4877

    瀏覽量

    90106
  • 開(kāi)源項(xiàng)目

    關(guān)注

    0

    文章

    38

    瀏覽量

    7613

原文標(biāo)題:Github Star 11.5K項(xiàng)目再發(fā)版:AAAI 2021 頂會(huì)論文開(kāi)源,80+多語(yǔ)言模型全新升級(jí)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    沐曦曦云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,沐曦曦云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力PaddleOC
    的頭像 發(fā)表于 01-30 10:19 ?854次閱讀
    沐曦曦云C500/C550 GPU產(chǎn)品適配<b class='flag-5'>PaddleOCR</b>-VL-1.5模型

    百度正式發(fā)布并開(kāi)源新一代文檔解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式發(fā)布并開(kāi)源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數(shù)的輕量架構(gòu),在全球權(quán)威文檔解析評(píng)測(cè)榜單 OmniDocBench V1.5 中取得
    的頭像 發(fā)表于 01-30 10:03 ?636次閱讀
    百度正式發(fā)布并開(kāi)源新一代文檔解析模型<b class='flag-5'>PaddleOCR</b>-VL-1.5

    常見(jiàn)光纖損傷類型和表現(xiàn)是什么

    光纖損傷類型多樣,根據(jù)損傷機(jī)制和表現(xiàn)形式,可分為物理性損傷、光學(xué)性能劣化、連接相關(guān)損傷及環(huán)境/化學(xué)誘導(dǎo)損傷四大類。以下是具體分類及典型表現(xiàn): 一、物理性損傷 光纖斷裂 成因:過(guò)度拉伸、彎曲半徑過(guò)小
    的頭像 發(fā)表于 01-23 14:26 ?338次閱讀

    北汽集團(tuán)2025年度高光時(shí)刻回顧

    1月9日,北汽集團(tuán)公布2025年成績(jī)單。過(guò)去一年,北汽集團(tuán)實(shí)現(xiàn)整車銷量175.2萬(wàn)輛,同比增長(zhǎng)5.6%,自主品牌銷量達(dá)107萬(wàn)輛,新能源及國(guó)際業(yè)務(wù)表現(xiàn)亮眼,增速均大幅跑贏行業(yè),創(chuàng)歷史新高?!叭贶S升行動(dòng)”開(kāi)局之年,北汽集團(tuán)已初步實(shí)現(xiàn)結(jié)構(gòu)重塑與質(zhì)的跨越,站上了全新的發(fā)展臺(tái)階
    的頭像 發(fā)表于 01-12 16:06 ?338次閱讀

    使用 Docker 一鍵部署 PaddleOCR-VL: 新手保姆級(jí)教程

    作者:飛槳開(kāi)發(fā)者技術(shù)專家 劉力 | 適合人群:剛接觸 PaddleOCR-VL + Docker部署的同學(xué) | 學(xué)習(xí)目標(biāo):從一臺(tái)剛裝好的 Ubuntu 24.04 開(kāi)始,完成 Docker 環(huán)境準(zhǔn)備
    的頭像 發(fā)表于 12-18 18:26 ?6483次閱讀
    使用 Docker 一鍵部署 <b class='flag-5'>PaddleOCR</b>-VL: 新手保姆級(jí)教程

    Shell歷史命令history用法

    1. 顯示歷史命令列表 「介紹」:history 命令用于顯示當(dāng)前會(huì)話中執(zhí)行過(guò)的命令的列表,以及每個(gè)命令對(duì)應(yīng)的編號(hào)?!甘纠a」:history 2. 使用歷史命令重復(fù)執(zhí)行命令 「介紹」:通過(guò)
    發(fā)表于 12-02 06:10

    國(guó)芯微Pegasus芯片榮膺2025“中國(guó)芯”優(yōu)秀市場(chǎng)表現(xiàn)產(chǎn)品獎(jiǎng)

    杭州國(guó)芯微電子股份有限公司(以下簡(jiǎn)稱“國(guó)芯微”)自主研發(fā)的“衛(wèi)星廣播與流媒體智能終端SoC芯片Pegasus”榮膺第二十屆“中國(guó)芯”優(yōu)秀市場(chǎng)表現(xiàn)產(chǎn)品獎(jiǎng)!這是國(guó)芯微歷史上第11次問(wèn)鼎中國(guó)芯片行業(yè)最受矚目的“中國(guó)芯”獎(jiǎng)項(xiàng),標(biāo)志著公司在技術(shù)創(chuàng)新與市場(chǎng)開(kāi)拓上的持續(xù)領(lǐng)先地位。
    的頭像 發(fā)表于 11-19 09:32 ?715次閱讀
    國(guó)芯微Pegasus芯片榮膺2025“中國(guó)芯”優(yōu)秀市場(chǎng)<b class='flag-5'>表現(xiàn)</b>產(chǎn)品獎(jiǎng)

    基于全局預(yù)測(cè)歷史的gshare分支預(yù)測(cè)器的實(shí)現(xiàn)細(xì)節(jié)

    GShare預(yù)測(cè)機(jī)制簡(jiǎn)介 GShare預(yù)測(cè)機(jī)制作為一種常用的分支預(yù)測(cè)機(jī)制,通過(guò)基于分支歷史和分支地址來(lái)預(yù)測(cè)分支指令的執(zhí)行路徑。分支歷史是指處理器在執(zhí)行程序時(shí)遇到的所有分支指令的執(zhí)行情況,包括它們
    發(fā)表于 10-22 06:50

    橫河示波器DLM3000歷史存儲(chǔ)與統(tǒng)計(jì)功能

    工程師除了需要測(cè)量常規(guī)單周期開(kāi)關(guān)損耗,還需要關(guān)注多周期開(kāi)啟損耗和關(guān)閉損耗。這需要用到示波器的歷史存儲(chǔ)與統(tǒng)計(jì)功能。DLM3000可以在高速波形捕獲基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行歷史存儲(chǔ)。
    的頭像 發(fā)表于 09-17 17:28 ?739次閱讀
    橫河示波器DLM3000<b class='flag-5'>歷史</b>存儲(chǔ)與統(tǒng)計(jì)功能

    精準(zhǔn)定位性能瓶頸:深入解析 PaddleOCR v3.2 全新 Benchmark 功能

    飛槳技術(shù)生態(tài)伙伴 算力魔方 | 摘要:在實(shí)際落地OCR和文檔解析項(xiàng)目時(shí),大家常常會(huì)遇到一個(gè)棘手問(wèn)題:模型跑得不夠快,但到底是檢測(cè)太慢、識(shí)別耗時(shí),還是模塊之間的數(shù)據(jù)流轉(zhuǎn)不高效?PaddleOCR
    的頭像 發(fā)表于 09-05 16:02 ?1216次閱讀
    精準(zhǔn)定位性能瓶頸:深入解析 <b class='flag-5'>PaddleOCR</b> v3.2 全新 Benchmark 功能

    長(zhǎng)城汽車2025年8月大事記回顧

    長(zhǎng)城汽車2025年第二季度營(yíng)收523.16億元,同比增長(zhǎng)7.72%,環(huán)比增長(zhǎng)30.73%,為歷史最佳第二季度營(yíng)收表現(xiàn);二季度凈利潤(rùn)45.86億元,同比增長(zhǎng)19.42%,環(huán)比增長(zhǎng)161.87%,為歷史
    的頭像 發(fā)表于 09-01 09:30 ?979次閱讀

    小語(yǔ)種OCR標(biāo)注效率提升10+倍:PaddleOCR+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

    摘要 :小語(yǔ)種OCR研發(fā)的核心瓶頸在于高質(zhì)量標(biāo)注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動(dòng)化標(biāo)注方案,利用 PaddleOCR 進(jìn)行文本檢測(cè)與裁剪,并調(diào)用 ERNIE 4.5 大模型進(jìn)行雙重預(yù)測(cè)
    的頭像 發(fā)表于 08-29 11:26 ?3663次閱讀
    小語(yǔ)種OCR標(biāo)注效率提升10+倍:<b class='flag-5'>PaddleOCR</b>+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

    【EASY EAI Orin Nano開(kāi)發(fā)板試用體驗(yàn)】PP-OCRV5文字識(shí)別實(shí)例搭建與移植

    用PP-OCRV5,首先就是要安裝PaddlePaddle 3.0(飛槳)和PaddleOCR 3.0(飛槳OCR大模型),這兩個(gè)軟件要通過(guò)Python進(jìn)行安裝,這里為了省事,我直接在別的ARM64開(kāi)發(fā)板(野火
    發(fā)表于 08-18 16:57

    C語(yǔ)言的歷史及程序介紹

    電子發(fā)燒友網(wǎng)站提供《C語(yǔ)言的歷史及程序介紹.pdf》資料免費(fèi)下載
    發(fā)表于 04-09 16:10 ?0次下載

    使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,什么是PaddleOCR工具庫(kù)? PaddleOCR 旨在打造一套豐富、領(lǐng)先、且實(shí)用的 OCR 工具庫(kù),助力開(kāi)發(fā)者訓(xùn)練出更好的模型,并應(yīng)用落地。在
    的頭像 發(fā)表于 04-03 18:07 ?2611次閱讀
    使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型