Tesseract OCR Android

無名_四葉草發表於2020-04-05

原文網址 : https://blog.csdn.net/zdyueguanyun/article/details/49927747

本文將介紹android平臺上如何使用tesseract實現OCR。 tesseract出生於HP實驗室，如今由Google負責維護，是最好的開源OCR Engine之一，並且支援中文。tesseract個人覺得有兩個需要考慮的點，一是大，二是慢，特別是中文。如果系統對空間和時間要求非常高，那麼tesseract可能不是最好的選擇。

1. 準備工具tesseract-two

tesseract是用c++實現的，需要封裝Java API用於Android平臺的呼叫。這裡我們使用的是tesseract-two, 網址是https://github.com/rmtheis/tess-two。tesseract-two 是Tesseract Tools for Android的一個git分支，選擇它是由於操作簡單，並且整合了leptonica，一個圖形處理工具。出發之前請先安裝git和android-ndk。接著便是下載和編譯，我是在windows上編譯的。

git下載(Git Bash操作): git clone https://github.com/rmtheis/tess-two.git tess

ndk編譯(cmd命令列): 先cd到剛才Git下載的tess目錄。敲如下命令（編譯的時間會有點久）：

[plain]view
 plaincopy

cd tess-two  

ndk-build  

android update project -t 1 --path .  

ant release  

cd ..  

cd eyes-two  

ndk-build  

android update project -t 1 --path .  

ant release

2. 呼叫tesseract識別圖片

eclipse裡面匯入編譯好的android project，共三個專案，tess-two, tess-two-test 以及eyes-two。其中tess-two和eyes-two為android lib專案，供其它專案引用。tess-two封裝Tesseract的Android API，eyes-two封裝leptonica的Android API。tess-two-test為OCR的測試，先讀一下TessBaseAPITest.java的程式碼，瞭解API的使用方法。

[java]view
 plaincopy

       private static final String TESSBASE_PATH = "/mnt/sdcard/tesseract/";  

private static final String DEFAULT_LANGUAGE = "eng";  

private static final String CHINESE_LANGUAGE = "chi_sim";  

       TessBaseAPI baseApi = new TessBaseAPI();  

       baseApi.init(TESSBASE_PATH, CHINESE_LANGUAGE);  

baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO);  

baseApi.setImage(params[0]);  

// Ensure that the result is correct.  

final String outputText = baseApi.getUTF8Text();  

baseApi.end();

基本的API呼叫步驟非常之簡單。不過模擬器啟動之後，還需要把Tesseract的trained data放到模擬器裡面,下載地址為https://code.google.com/p/tesseract-ocr/downloads/list。

adb shell

cd /mnt/sdcard/

mkdir tesseract

cd tesseract

mkdir tessdata

Ctrl+C退出Shell

adb push chi_sim.traineddata /mnt/sdcard/tesseract/tessdata

adb push eng.traineddata /mnt/sdcard/tesseract/tessdata

嘗試自己寫個Activity，顯示張圖片並識別一下吧。

3. 寫在最後

OCR的識別率取決於兩個方面，圖片質量和OCR engine的能力。通常為了提高識別率，需要對圖片作預處理。比如常見的二值化(黑白)，放大，切割，銳化等。可以直接呼叫leptonica介面實現。至於Tesseract Engine，只能說是非常好的英文OCR engine，處理中文還是有待提高。選擇好一個OCR engine之後，能做的估計也就是在圖片的預處理上下功夫了。

Tesseract-OCR -01-Tesseract 介紹
2018-09-07
Tesseract Ocr文字識別
2018-04-20
Tesseract-OCR-02-Tesseract-OCR 的安裝與環境變數配置
2018-09-07
變數
Tesseract OCR 圖片文字識別
2021-10-24
Tesseract-OCR-05-主要API功能介紹
2018-09-07
API
Tesseract OCR的下載安裝和啟動
2018-11-04
Tesseract-OCR-04-使用 jTessBoxEditor 進行訓練
2018-09-07
Tesseract-OCR如何得到更準確的中文識別
2021-10-25
文字識別OCR開源框架的對比--Tesseract vs EasyOCR
2021-06-27
框架
Python爬蟲教程-29-驗證碼識別-Tesseract-OCR
2018-09-06
Python爬蟲
python3使用Pillow、tesseract-ocr與pytesseract模組的圖片識別的方法
2020-03-13
Python
可識別影像中100種人類語言文字的純Javascript OCR庫包：Tesseract.js
2019-12-21
JavaScriptJS
可識別影象中100種人類語言文字的純Javascript OCR庫包：Tesseract.js
2019-12-21
JavaScriptJS
tesseract安裝說明
2018-07-27
Tesseract 圖片識別
2019-08-05
python利用Tesseract識別驗證碼
2019-01-21
Python
Tesseract引擎的下載和安裝
2023-11-29
使用Tesseract進行圖片文字識別
2024-12-06
RPA之眼：AI-OCR，Fax-OCR概述
2019-11-07
AI
oracle重建ocr
2023-12-25
Oracle
RAC_OCR管理
2018-03-12
利用tesseract解析簡單數字驗證碼圖片
2018-03-14
oracle遷移OCR盤
2023-12-25
Oracle
OCR技術簡介
2019-12-19
OCR識別技術
2019-11-04
OCR活體檢測
2019-12-30
VLM-OCR-Demo：一個使用VLM用於OCR任務的示例
2024-12-09
開源OCR模型對比
2024-04-16
模型
ocr文字識別技術
2019-12-30
中國首份OCR白皮書出爐，基於深度學習的OCR已成主流
2020-10-03
深度學習
OCR 文字檢測（Differentiable Binarization --- DB）
2023-05-10
騰訊優圖 OCR Composer 包
2019-12-07
手機OCR證件識別
2020-01-19
更換ocr和votingdisk磁碟組
2019-11-19
OCR技術-文字影像識別
2019-11-05
OCR身份證識別技術
2020-06-29
mac bookpro m1 安裝tesseract5.x 並訓練新字型
2022-04-12
Mac
OCR檢測與識別技術
2018-06-05

Tesseract OCR Android

1. 準備工具tesseract-two

2. 呼叫tesseract識別圖片

3. 寫在最後

相關文章