91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型時代的OCR,“CPU” 的味道更重了

英特爾中國 ? 來源:未知 ? 2023-07-08 14:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

金磊 楊凈 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

經(jīng)典技術(shù)OCR光學(xué)字符識別),在大模型時代下要“變味”了。

怎么說?

我們都知道OCR這個技術(shù)在日常生活中已經(jīng)普及開了,像各類文件、身份證、路標等識別,可以說統(tǒng)統(tǒng)都離不開它。

而隨著近幾年大模型的不斷發(fā)展,OCR也迎來了它的“新生機”——

憑借自身可以將文本從圖片、掃描文檔或其他圖像形式提取出來的看家本領(lǐng),成為大語言模型的一個重要入口。

在這個過程中,一個關(guān)鍵問題便是“好用才是硬道理”。

過去人們會普遍認為,像OCR這種涉及圖像預(yù)處理、字符分割、特征提取等步驟的技術(shù),堆GPU肯定是首選嘛。

不過朋友,有沒有想過成本和部署的問題?還有一些場景甚至連GPU資源都沒得可用的問題?

這時又有朋友要說了,那CPU也不見得很好用啊。

不不不。

現(xiàn)在,大模型時代之下,CPU或許還真是OCR落地的一種新解法。

例如在醫(yī)保AI業(yè)務(wù)中,在CPU的加持之下,醫(yī)療票據(jù)識別任務(wù)的響應(yīng)延時指標,在原有基礎(chǔ)上提升達25倍!

799cdaca-1d55-11ee-962d-dac502259ad0.png
數(shù)據(jù)來源:英特爾合作伙伴

為什么會有如此大的轉(zhuǎn)變?

一言蔽之,因為此前做OCR任務(wù)的時候,CPU的計算潛能并沒有完全釋放出來。

OCR,進入CPU時代

那么到底是誰家的CPU,能讓經(jīng)典OCR產(chǎn)生這般變化。

不賣關(guān)子。

它正是來自英特爾第四代至強可擴展處理器。

據(jù)了解,第四代至強可擴展處理器增加了每個時鐘周期的指令,每個插槽多達60個核心,支持8通道DDR5內(nèi)存。

在內(nèi)存寬帶方面實現(xiàn)了50%的性能提升,并通過每PCIe 5.0(80個通道)實現(xiàn)了2 倍的PCIe帶寬提升,整體可實現(xiàn)60%的代際性能提升。

但解鎖如此能力的,可不僅僅是一顆CPU這么簡單,是加成了英特爾軟件層面上的優(yōu)化;換言之,就是“軟硬一體”后的結(jié)果。

而且這種打法也不是停留在PPT階段,而是已經(jīng)實際用起來的那種。

例如國內(nèi)廠商用友便在自家OCR業(yè)務(wù)中采用了這種方案。

79f10032-1d55-11ee-962d-dac502259ad0.png

性能比較上,用友在第三/第四代英特爾至強可擴展處理器上進行了算法對比,推理性能提升達優(yōu)化前的3.42倍

7a0a3d5e-1d55-11ee-962d-dac502259ad0.png

而在INT8量化后的性能更是提升到原來的7.3倍

7a1bef9a-1d55-11ee-962d-dac502259ad0.png

值得一提的是,OCR的響應(yīng)時間直接降低到了3秒以內(nèi),還是切換架構(gòu)不影響業(yè)務(wù),用戶無感知的那種。

除了用友之外,像亞信科技在自家OCR-AIRPA方案中,也是采用了英特爾的這套打法。

與用友類似的,亞信科技實現(xiàn)了從FP32到INT8/BF16的量化,從而在可接受的精度損失下,增加吞吐量并加速推理。

從結(jié)果上來看,相比傳統(tǒng)人工方式,成本降到了1/5到1/9之間,而且效率還提升了5-10倍。

由此可見,釋放了AI加速“洪荒之力”的CPU,在OCR任務(wù)上完全不亞于傳統(tǒng)GPU的方案。

那么問題來了:

英特爾是如何釋放CPU計算潛力的?

實際應(yīng)用過程中,企業(yè)通常選擇自己使用CPU來做OCR處理,但由于缺乏對CPU硬件加速和指令集的了解,就會發(fā)現(xiàn)CPU處理性能與理想峰值相差甚遠,OCR程序也就沒有得到很好的優(yōu)化。

至于以往更常見的GPU解決方案,始終存在著成本和部署的難題。一來成本通常較高,且很多情況下,業(yè)務(wù)現(xiàn)場沒有GPU資源可以使用。

但要知道OCR本身應(yīng)用廣泛、部署場景多樣,比如公有云、私有云,以及邊緣設(shè)備、終端設(shè)備上……而且隨著大模型時代的到來,作為重要入口的OCR,更多潛在場景將被挖掘。

于是,一種性價比高、硬件適配性強的解決方案成為行業(yè)剛需。

既然如此,英特爾又是如何解決這一痛點的呢?

簡單歸結(jié):第四代至強可擴展處理器及其內(nèi)置的AI加速器,以及OpenVINO 推理框架打輔助

當(dāng)前影響AI應(yīng)用性能的要素?zé)o非兩個:算力和數(shù)據(jù)訪問速度。第四代至強可擴展處理器的單顆CPU核數(shù)已經(jīng)增長到最高60核。

而在數(shù)據(jù)訪問速度上,各級緩存大小、內(nèi)存通道數(shù)、內(nèi)存訪問速度等都有一定程度的優(yōu)化,另外部分型號還集成了HBM高帶寬內(nèi)存技術(shù)。

7a936b24-1d55-11ee-962d-dac502259ad0.png

此外,在CPU指令集上也做了優(yōu)化,內(nèi)置了英特爾高級矩陣擴展(英特爾AMX)等硬件加速器,負責(zé)矩陣計算,加速深度學(xué)習(xí)工作負載。

這有點類似于GPU里的張量核心Tensor Core)

AMX由兩部分組成,一部分是1kb大小的2D寄存器文件,另一部分是TMUL模塊,用來執(zhí)行矩陣乘法指令。

7aa88ed2-1d55-11ee-962d-dac502259ad0.png

它可同時支持INT8和BF16數(shù)據(jù)類型,且BF16相較于FP32計算性能更優(yōu)。

有了AMX指令集加持,性能比矢量神經(jīng)網(wǎng)絡(luò)指令集VNNI提升達8倍。

7ace93ca-1d55-11ee-962d-dac502259ad0.png

除了核心硬件平臺外,實際情況中幫助OCR在CPU上落地的,還有推理框架OpenVINO。

市面上大部分AI框架都是同時支持訓(xùn)練和推理,OpenVINO則是刪減了很多訓(xùn)練部分所需的冗余計算,主要支持推理部分。

而且也是專門針對英特爾硬件打造的優(yōu)化框架。框架替換也不復(fù)雜,只需5行代碼就可以完成原有框架的替換。

用戶可以針對不同業(yè)務(wù)場景,來優(yōu)化OpenVINO運行參數(shù)。

比如用友OCR業(yè)務(wù)涉及文字檢測和文字識別兩個AI模型,優(yōu)化方向有所不同。

前者對單次推理要求高,后者需要整個系統(tǒng)吞吐量的優(yōu)化,那么OpenVINO分別采用單路同步模式和多路異步模式。單一模塊優(yōu)化后,再針對整體流程的優(yōu)化。

這樣一套軟硬件組合拳打下來,英特爾充分釋放了CPU計算潛力,在實際場景中也實現(xiàn)了與GPU同等性能。

不再是你以為的CPU

以往談到AI加速、AI算力,大眾經(jīng)常想到的就是GPU,又或者是專用TPU。

至于通用架構(gòu)芯片CPU,受到計算單元和內(nèi)存帶寬的限制,始終無法適應(yīng)于計算數(shù)據(jù)龐大的深度學(xué)習(xí)。

但現(xiàn)在的CPU,已經(jīng)不再是“你以為的你以為”了:

它可以深入到各個行業(yè)當(dāng)中,輕松Hold住各種場景應(yīng)用。

尤其在AMX加速引擎加持下,能將深度學(xué)習(xí)訓(xùn)練和推理性能提升高達10倍。

比如,媒體娛樂場景中,能幫助個性化內(nèi)容推薦速度提升達6.3倍;零售行業(yè)里,能將視頻分析速度提升高達至2.3倍,還有像工業(yè)缺陷檢測、醫(yī)療服務(wù)也都能從容應(yīng)對。

即便是在前沿探索領(lǐng)域,CPU也已經(jīng)成為不容忽視的存在:

像是在生命科學(xué)和醫(yī)藥方向,在某些場景下的表現(xiàn)效果甚至比GPU還要好。

英特爾用CPU速刷AlphaFold2,結(jié)果力壓AI專用加速芯片,去年發(fā)布的第三代至強可擴展處理器經(jīng)過優(yōu)化后就能使其端到端的通量足足提升到了原來的23.11倍。今年基于第四代至可擴展處理器再次把性能提升到了上一代產(chǎn)品的3.02倍。

7ae3a3f0-1d55-11ee-962d-dac502259ad0.png

不過要實現(xiàn)CPU加速,背后也并非簡單的硬件優(yōu)化。

而是軟硬件融合協(xié)同,從底層到應(yīng)用的一整套技術(shù)創(chuàng)新,以及產(chǎn)業(yè)鏈上合作伙伴的支撐。

隨著大模型時代的到來和深入,這種解決思路也正在成為共識。

像一些大模型玩家要實現(xiàn)大模型優(yōu)化和迭代,并不能依靠以往單純?nèi){馬車來解決,而是需要從底層芯片到模型部署端到端的系統(tǒng)優(yōu)化。

在算力加速層面的玩家,一方面擺脫不了摩爾定律的極限,另一方面要在應(yīng)用場景中充分釋放計算潛力,就需要與軟件適配快速部署。

有意思的是,在最近OCR主題的《至強實戰(zhàn)課》中,英特爾人工智能軟件架構(gòu)師桂晟曾這樣形容英特爾的定位:

英特爾不僅僅是一個硬件公司,同時也擁有著龐大的軟件團隊。

在整個人工智能生態(tài)中,不論是從底層的計算庫,到中間的各類組件,框架和中間件,再到上層的應(yīng)用,服務(wù)和解決方案都有英特爾軟件工程師的參與。

7af9aed4-1d55-11ee-962d-dac502259ad0.png

CPU加速,不再是你以為的加速。英特爾,也不再是以往所認知中的硬件公司。

但如果你以為英特爾只有CPU來加速AI,那你又單純了。

針對AI的專用加速芯片HabanaGaudi 2即將迎來首秀;而通用加速芯片,同時兼顧科學(xué)計算和AI加速的英特爾數(shù)據(jù)中心GPU Max系列也剛剛結(jié)束了它在阿貢實驗室Aurora系統(tǒng)中的部署,即將走近更多客戶。

以這些多樣化、異構(gòu)的芯片為基石,英特爾也將形成更全面的硬件產(chǎn)品布局,并配之以跨異構(gòu)平臺、易用的軟件工具組合(oneAPI為整個應(yīng)用鏈上的合作伙伴及客戶提供應(yīng)用創(chuàng)新的支持,為各行各業(yè)AI應(yīng)用的開發(fā)、部署、優(yōu)化和普及提供全方位支持。

了解更多英特爾如何顯著提升OCR性能,可點擊文末【閱讀原文】。

更多《至強實戰(zhàn)課》相關(guān)內(nèi)容,歡迎掃描如下海報中的二維碼注冊觀看:

7b177b3a-1d55-11ee-962d-dac502259ad0.jpg


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10302

    瀏覽量

    180562
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11285

    瀏覽量

    225147

原文標題:大模型時代的OCR,“CPU” 的味道更重了

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    云知聲正式推出Unisound U1-OCR文檔智能基礎(chǔ)大模型

    就在剛剛,云知聲正式推出 Unisound U1-OCR 文檔智能基礎(chǔ)大模型。作為首個工業(yè)級文檔智能基座,該模型憑借 “性能 SOTA、可信可驗、開箱即用、高效部署、強適配” 五大核心優(yōu)勢,打破傳統(tǒng)文檔處理邊界,樹立起行業(yè)新標桿
    的頭像 發(fā)表于 02-26 17:28 ?758次閱讀
    云知聲正式推出Unisound U1-<b class='flag-5'>OCR</b>文檔智能基礎(chǔ)大<b class='flag-5'>模型</b>

    中科曙光聯(lián)合發(fā)布全球首個蛋白質(zhì)結(jié)構(gòu)智能壓縮與生成AI服務(wù)器Protein-OCR

    ,Protein-OCR與DeepSeek-OCR-2實現(xiàn)跨領(lǐng)域的“不謀而合”。這一成果不僅標志著我國在生命科學(xué)計算領(lǐng)域的領(lǐng)先地位,更標志著Science@AGI時代的范式大統(tǒng)一開啟
    的頭像 發(fā)表于 02-25 16:27 ?354次閱讀

    工業(yè)級OCR手持終端怎么選?國產(chǎn)OCR智能識別pda實測

    工業(yè)環(huán)境專用OCR智能PDA怎么選?鳥鳥科技N70Socr具備IP67防塵防水+1.5米抗跌落,5000mAh可拆卸電池支持24小時輪班作業(yè)。專業(yè)OCR掃描頭+斑馬/霍尼二維碼引擎雙模組,285g人體工學(xué)設(shè)計,讓高強度數(shù)據(jù)采集更輕松。點擊查看詳細防護測試與續(xù)航實測數(shù)據(jù)!
    的頭像 發(fā)表于 02-07 17:45 ?236次閱讀
    工業(yè)級<b class='flag-5'>OCR</b>手持終端怎么選?國產(chǎn)<b class='flag-5'>OCR</b>智能識別pda實測

    沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型

    今天,智譜AI正式發(fā)布并開源GLM-OCR,以 “小尺寸、高精度” 實現(xiàn)文檔解析能力新標桿。沐曦股份曦云C500/C550 GPU充分發(fā)揮高生態(tài)兼容性、軟硬協(xié)同能力優(yōu)勢,高效完成與智譜GLM-OCR
    的頭像 發(fā)表于 02-03 11:36 ?687次閱讀
    沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-<b class='flag-5'>OCR</b><b class='flag-5'>模型</b>

    DeepX OCR:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺交付可規(guī)?;母咝阅?OCR 能力

    落地過程中,企業(yè)逐漸意識到:** 制約 OCR 應(yīng)用進一步擴展的核心因素,已不再是模型準確率本身,而是整體推理性能與部署成本。 具體來說,規(guī)?;?OCR 應(yīng)用主要面臨以下幾方面挑戰(zhàn): 吞吐量(FPS)不足 ,難以支撐高并發(fā)或多路
    的頭像 發(fā)表于 01-22 21:02 ?167次閱讀
    DeepX <b class='flag-5'>OCR</b>:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺交付可規(guī)?;母咝阅?<b class='flag-5'>OCR</b> 能力

    小語種OCR標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰(zhàn)解析

    與一致性校驗,實現(xiàn)高精度、低成本的小語種OCR訓(xùn)練數(shù)據(jù)生成。該方案將數(shù)據(jù)準備周期 從數(shù)周縮短至數(shù)小時 ,為小語種模型的快速迭代與冷啟動提供全新范式 一、引言:小語種OCR的“數(shù)據(jù)之困
    的頭像 發(fā)表于 08-29 11:26 ?3662次閱讀
    小語種<b class='flag-5'>OCR</b>標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰(zhàn)解析

    【嘉楠堪智K230開發(fā)板試用體驗】+OCR實現(xiàn)

    =[1920,1080],display_size=[1920,1080],debug_mode=0): # OCR檢測模型路徑 self.ocr_det_kmodel=ocr_det
    發(fā)表于 08-23 18:53

    【EASY EAI Orin Nano開發(fā)板試用體驗】PP-OCRV5文字識別實例搭建與移植

    用PP-OCRV5,首先就是要安裝PaddlePaddle 3.0(飛槳)和PaddleOCR 3.0(飛槳OCR模型),這兩個軟件要通過Python進行安裝,這里為了省事,我直接在別的ARM64開發(fā)板(野火
    發(fā)表于 08-18 16:57

    如何利用OCR技術(shù)實現(xiàn)高效集裝箱箱號識別?

    在現(xiàn)代物流和海關(guān)監(jiān)管領(lǐng)域,快速準確地識別集裝箱箱號是提升通關(guān)效率、降低運營成本的關(guān)鍵。OCR(光學(xué)字符識別)技術(shù)的應(yīng)用,為這一需求提供智能化解決方案。通過結(jié)合高清成像設(shè)備和先進的算法,OCR技術(shù)
    的頭像 發(fā)表于 08-12 10:48 ?872次閱讀
    如何利用<b class='flag-5'>OCR</b>技術(shù)實現(xiàn)高效集裝箱箱號識別?

    端側(cè)OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    制),我發(fā)送出去的base64是不全的。 總之,傳統(tǒng)方法做ocr流程上比較復(fù)雜,而原生鴻蒙開發(fā)提供端側(cè)AI的能力,其中就包括“Core Vision Kit(基礎(chǔ)視覺服務(wù))”,即與圖片識別相關(guān)的AI能力
    發(fā)表于 06-30 18:07

    OCR識別訓(xùn)練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄26張圖片,都標注好了,點擊開始訓(xùn)練,顯示訓(xùn)練成功,也將壓縮包發(fā)到郵箱,下載下來后,壓縮包里面是空的 OCR圖片2
    發(fā)表于 05-28 06:46

    模型時代的深度學(xué)習(xí)框架

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 在 CNN時代 ,AI模型的參數(shù)規(guī)模都在百萬級別,僅需在單張消費類顯卡上即可完成訓(xùn)練。例如,以業(yè)界知名的CNN模型: ResNet50 為例,模型
    的頭像 發(fā)表于 04-25 11:43 ?856次閱讀
    大<b class='flag-5'>模型</b><b class='flag-5'>時代</b>的深度學(xué)習(xí)框架

    模型預(yù)標注和自動化標注在OCR標注場景的應(yīng)用

    OCR,即光學(xué)字符識別,簡單來說就是利用光學(xué)設(shè)備去捕獲圖像并識別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時代,OCR(光學(xué)字符識別)技術(shù)作為處理圖像中文字信息的關(guān)鍵手段,其標注
    的頭像 發(fā)表于 04-15 15:18 ?962次閱讀

    使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,什么是PaddleOCR工具庫? PaddleOCR 旨在打造一套豐富、領(lǐng)先、且實用的 OCR 工具庫,助力開發(fā)者訓(xùn)練出更好的模型,并應(yīng)用落地。在
    的頭像 發(fā)表于 04-03 18:07 ?2605次閱讀
    使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4<b class='flag-5'>模型</b>