91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一款工具,借助深度學習模型可以一鍵摳去漫畫中的文字

m3Fp_almosthuma ? 來源:機器之心 ? 2020-01-27 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

漫畫摳圖是漢化組翻譯中必不可少而又工作量很大的一項工作,主要內(nèi)容是將漫畫中的文字摳去,以便替換成另一種語言。現(xiàn)在,這項工作可以自動化地完成了,一位韓國的開發(fā)者開源了一款工具,借助深度學習模型可以一鍵摳去漫畫中的文字,連背景圖中的文字都可以被摳去,效果十分驚人。

很多人都喜歡看日本漫畫,不少作品已經(jīng)成為很多人心中的童年回憶。但是對于漫畫的翻譯人員來說,他們需要去除原有漫畫的對話框和背景文字,并將其替換為讀者使用的語言。由于一本漫畫可能有數(shù)萬個對話框和對話,因此工作量是很大的。

現(xiàn)在,摳圖的工作人員可以基本上解放他們的雙手了。只要你有 TensorFlow,就可以快速實現(xiàn)一鍵摳圖,將漫畫圖像中的所有文字一鍵去除。

SickZil-Machine,一鍵摳圖

SickZil 是韓文中的作者提供了一個視頻,用于展示這一工具的效果。

作者同時提供了自動工具摳圖的案例。

對話框中的文字可以被完全消除。

有時候會有些文字消除不干凈的情況,但基本不影響畫面(漫畫右上角標題符號)。同時,背景中被去掉文字后,背景畫面可以被自動補全,基本不改變畫面效果(畫面右上角背景文字)。

從視頻中可以看出,這一工具非常的方便。只需要選擇待處理的漫畫,然后運行工具即可。如果有一些畫面被誤去除,或者有一些去除不干凈的情況下,用戶可以手動修改需要被去除的文字。

那么,這一工具背后是什么技術呢?

技術

模型架構

據(jù)項目作者介紹,這一工具背后使用了兩個模型,第一個是 Seg Net,用于檢測漫畫中的問題。另一個則是 Compl Net,用于處理漫畫圖像,去除文字并補全缺失的圖像部分。

Seg Net 使用的是 U-NET。這是一種編碼器-解碼器架構。編碼器逐漸減少池化層的空間維度,解碼器逐步修復物體的細節(jié)和空間維度。

U-Net 的架構,將輸入圖像逐步池化后進行上采樣,從而還原圖像細節(jié)。

而 Compl Net 使用的是 deepfill v2,這是一個用于對任意被 mask 的圖像進行修復的模型,可以適應各種 mask 的方式(塊狀遮蓋或線條遮蓋都可以)。deepfill 是 Adobe 等機構提出一系列圖像修復工具,機器之心也曾用過 deepfill v1,但是效果似乎沒有論文展示的那么好。

目前 deepfill v2 并沒有官方開源,但 GitHub 上有其他開發(fā)者復現(xiàn)。

deepfill v2 的模型架構,可以進行圖像修復。

有了這兩大神器,基本上可以實現(xiàn)漫畫文字的檢測識別和去除文本后的圖像補全。

數(shù)據(jù)集和訓練

有了模型還不夠,很多讀者想知道,整個系統(tǒng)是怎樣訓練的。

在 Seg Net 上,作者使用了原始的漫畫圖像和文本內(nèi)容遮蓋數(shù)據(jù),用于覆蓋原始漫畫中所有的文字部分。在 Compl Net 上,模型的輸入為被移除了文字的漫畫圖像。模型使用了 285 個圖像-遮蓋對和 31500 張漫畫圖像,其中有將近 12000 張漫畫是有文字的,因此訓練的數(shù)據(jù)比較平衡。

安裝和使用

作者沒有透露訓練模型的相關參數(shù),但是提供了開發(fā)者需要準備的硬件配置。 對于開發(fā)者而言,運行代碼需要準備 NVIDIA 驅(qū)動 410.x,CUDA 10.0,CUDNN >= 7.4.1,TensorFlow 需要大于 1.13 版本。

配置代碼步驟如下:

首先克隆相關代碼:git clone https://github.com/KUR-creative/SickZil-Machine.git; cd SickZil-Machine

下載 zip 文件,地址:https://github.com/KUR-creative/SickZil-Machine/releases。

解壓并復制文件:SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/cnet 和 SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/snet 到文件目錄:SickZil-Machine/resource.

進入目錄并安裝:pip install -r requirements.txt

運行主程序:cd src; python main.py

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3773

    瀏覽量

    52174
  • 代碼
    +關注

    關注

    30

    文章

    4973

    瀏覽量

    74144
  • 深度學習
    +關注

    關注

    73

    文章

    5600

    瀏覽量

    124482

原文標題:漫畫漢化組福音:深度學習工具一鍵摳圖

文章出處:【微信號:almosthuman2014,微信公眾號:機器之心】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一鍵直達OpenWrt原生界面!啟明智顯5G CPE開工煥新,體驗升級!原生OpenWrt24.10.5固件同步發(fā)布!

    ,使用更靈活!同時,基于原生OpenWrt24.10.5的全新固件將同步發(fā)布!一鍵直通OpenWrt,告別二次登錄以往用戶如需使用OpenWrt原生界面進行深度配置,往
    的頭像 發(fā)表于 02-25 18:04 ?502次閱讀
    <b class='flag-5'>一鍵</b>直達OpenWrt原生界面!啟明智顯5G CPE開工煥新,體驗升級!原生OpenWrt24.10.5固件同步發(fā)布!

    請問CW32系列MCU的調(diào)試工具是哪一款

    CW32系列MCU的調(diào)試工具是哪一款?
    發(fā)表于 01-07 07:11

    碳足跡算不清?全鏈路能源系統(tǒng),一鍵生成碳排報告

    在 “雙碳” 目標推進下,碳足跡核算已成為企業(yè)高質(zhì)量發(fā)展必經(jīng)之路。全鏈路能源系統(tǒng)憑借 “數(shù)據(jù)自動采集、核算精準智能、報告一鍵生成” 的核心優(yōu)勢,讓碳核算從 “耗時費力的難題” 變?yōu)?“高效便捷的工具”,既為合規(guī)經(jīng)營護航,也為節(jié)能降碳提供數(shù)據(jù)支撐。
    的頭像 發(fā)表于 11-19 09:45 ?390次閱讀
    碳足跡算不清?全鏈路能源系統(tǒng),<b class='flag-5'>一鍵</b>生成碳排報告

    靈動微電子最新最火熱的一款芯片推薦

    希望找一款靈動微電子最新最火熱的一款芯片,我們想做個圖形化的界面配置,供大家以后直接創(chuàng)建工程,用國產(chǎn)工具McuStudio做,McuStudio支持任何內(nèi)核任何廠家的芯片,希望大家有
    發(fā)表于 10-29 17:15

    自動駕駛中Transformer大模型會取代深度學習嗎?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心言等大語言模型在生成文本、對話交互等領域的驚艷表現(xiàn),“Transformer架構是否正在取代傳統(tǒng)深度學習
    的頭像 發(fā)表于 08-13 09:15 ?4253次閱讀
    自動駕駛中Transformer大<b class='flag-5'>模型</b>會取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    借助電商 API,多平臺客戶評價一鍵抓取

    出錯。借助電商平臺的 API(Application Programming Interface),我們可以實現(xiàn)一鍵抓取多平臺客戶評價,高效自動化這過程。本文將
    的頭像 發(fā)表于 08-11 14:49 ?793次閱讀

    告別多設備!揭秘QM系列閃測儀如何一鍵搞定多元檢測

    QM 系列一鍵閃測儀作為方案核心,搭載雙視野雙遠心鏡頭與 2000 萬像素 CMOS 傳感器,測量精度可達 ±1μm。其內(nèi)置的 AI 深度學習系統(tǒng)經(jīng)過海量工業(yè)樣本訓練,能一鍵識別 50
    的頭像 發(fā)表于 08-11 13:43 ?1070次閱讀
    告別多設備!揭秘QM系列閃測儀如何<b class='flag-5'>一鍵</b>搞定多元檢測

    寧暢與與百度文心大模型展開深度技術合作

    與部署。 憑借覆蓋訓練、推理、微調(diào)全流程的AI?服務器產(chǎn)品矩陣,寧暢幫助企業(yè)在大模型時代一鍵打通算力與應用“任督二脈”,顯著縮短模型落地周期。 在已啟動的深度技術合作中,雙方將基于文心
    的頭像 發(fā)表于 07-07 16:26 ?912次閱讀

    二次元測量儀?、?影像測量儀?和?一鍵閃測儀?到底選哪個?

    精密制造領域三大主流測量儀器——二次元測量儀、影像測量儀和一鍵閃測儀,它究竟有什么區(qū)別,又是哪種更適合您的產(chǎn)線?文為您深度解析!
    的頭像 發(fā)表于 07-05 18:16 ?2393次閱讀

    HarmonyOS應用一鍵置灰指南

    一鍵置灰通常應用于如下場景 1. 重大悼念活動: 在國家發(fā)生重大災難、事故或舉行悼念日等特殊時期,為了表達對逝者的尊重和哀悼,許多 APP 會將界面置灰。例如,在些地震、空難等災難事件發(fā)生后,以及
    的頭像 發(fā)表于 06-27 00:08 ?627次閱讀

    一鍵尺寸測量儀在醫(yī)療領域的應用具體是什么?

    一鍵尺寸測量儀作為種先進的測量工具,憑借其高精度、快速批量測量以及自動化與智能化的特點,正逐漸成為五金行業(yè)不可或缺的精密測量新利器。
    的頭像 發(fā)表于 05-27 15:12 ?777次閱讀
    <b class='flag-5'>一鍵</b>尺寸測量儀在醫(yī)療領域的應用具體是什么?

    ESP8266燒錄與機智云一鍵配網(wǎng)教程

    ESP8266模塊因其低成本和高性能,廣泛應用于智能家居和工業(yè)自動化等領域。機智云平臺提供了一鍵配網(wǎng)功能,簡化了設備的聯(lián)網(wǎng)過程。本教程將詳細介紹如何使用ESP8266進行燒錄,并通過機智云實現(xiàn)一鍵
    的頭像 發(fā)表于 05-24 11:04 ?2104次閱讀
    ESP8266燒錄與機智云<b class='flag-5'>一鍵</b>配網(wǎng)教程

    電源一鍵多用:POWER_ON從開機到場景指揮官!

    按鍵,即開關機,在結構設計上可以實現(xiàn) 一鍵多用 ——既可以有效減少結構的按鍵設計,也可以使整機更加簡潔。 本文以Air8000核心板為例,
    的頭像 發(fā)表于 05-15 14:10 ?4205次閱讀
    電源<b class='flag-5'>鍵</b>的<b class='flag-5'>一鍵</b>多用:POWER_ON從開機到場景指揮官!

    U盤一鍵制作

    在電腦維修中啟動盤很重要,靠譜的u盤一鍵啟動制作方法
    發(fā)表于 05-06 16:10 ?44次下載

    Profinet邂逅ModbusRTU:印刷廠有網(wǎng)關“一鍵打通”通信鏈路

    Profinet邂逅ModbusRTU:印刷廠有網(wǎng)關“一鍵打通”通信鏈路
    的頭像 發(fā)表于 04-08 17:11 ?616次閱讀
    Profinet邂逅ModbusRTU:印刷廠有網(wǎng)關“<b class='flag-5'>一鍵</b>打通”通信鏈路