Android OCR之tesseract章
Android OCR之tesseract
1. 開源工具簡介
tesseract是非常有名的開源OCR工具,但是要將它配置到Android開發環境中可能要費點功夫,別擔心,github上面有好人幫助我們封裝了Android開發環境的tesseract配置,這就是Android平臺上OCR開源專案tess-two。
2. 環境配置
利用tess-two配置OCR環境非常簡單。
- 首先,設定工程的ndk路徑。
- 其次,在模組中新增依賴:
compile 'com.rmtheis:tess-two:6.0.0'
。
3. 資料準備
要進行OCR還要獲取訓練資料tessdata,下載該訓練資料,到時候將訓練資料弄到自己的Android裝置上就行了。
注意:不要把所有訓練資料都弄到Android裝置上,因為訓練資料比較大,需要用到什麼語言的資料就只把這些語言對應的資料弄到Android裝置上。
比如,我一般識別只用到識別英文與簡體中文,因此只需要將eng.traineddata,chi_sim.traineddata弄到Android裝置上就行了。
4. 開始Android OCR之旅
相關常量設定:
//訓練資料路徑,必須包含tesseract資料夾
static final String TESSBASE_PATH = "/storage/emulated/0/Download/tesseract/";
//識別語言英文
static final String DEFAULT_LANGUAGE = "eng";
//識別語言簡體中文
static final String CHINESE_LANGUAGE = "chi_sim";
英文識別:
public void EnglishOCR(){
//設定圖片可以快取
english.setDrawingCacheEnabled(true);
//獲取快取的bitmap
final Bitmap bmp = english.getDrawingCache();
final TessBaseAPI baseApi = new TessBaseAPI();
//初始化OCR的訓練資料路徑與語言
baseApi.init(TESSBASE_PATH, DEFAULT_LANGUAGE);
//設定識別模式
baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE);
//設定要識別的圖片
baseApi.setImage(bmp);
english.setImageBitmap(bmp);
englishtext.setText(baseApi.getUTF8Text());
baseApi.clear();
baseApi.end();
}
簡體中文識別與英文識別類似。
5. 程式介面
相關文章
- Android OCR之tesseractAndroid
- Tesseract OCR AndroidAndroid
- Tesseract-OCR-02-Tesseract-OCR 的安裝與 環境變數配置變數
- Android中基於Tesseract OCR的文字識別應用Android
- Tesseract-OCR-05-主要API功能介紹API
- Tesseract OCR的下載安裝和啟動
- Tesseract-OCR 字元識別---樣本訓練字元
- Tesseract-OCR-04-使用 jTessBoxEditor 進行訓練
- Python pyocr和Tesseract-OCR的安裝以及使用Python
- PHP OCR實戰:用Tesseract從影像中讀取文字PHP
- 文字識別OCR開源框架的對比--Tesseract vs EasyOCR框架
- Python爬蟲教程-29-驗證碼識別-Tesseract-OCRPython爬蟲
- python3使用Pillow、tesseract-ocr與pytesseract模組的圖片識別的方法Python
- RPA之眼:AI-OCR,Fax-OCR概述AI
- 可識別影象中100種人類語言文字的純Javascript OCR庫包:Tesseract.jsJavaScriptJS
- 可識別影像中100種人類語言文字的純Javascript OCR庫包:Tesseract.jsJavaScriptJS
- tesseract安裝說明
- Tesseract引擎的下載和安裝
- python利用Tesseract識別驗證碼Python
- Android基礎進階之EffectiveJava翻譯系列(第八章:異AndroidJava
- ASM之OCR所在磁碟組損壞後的恢復ASM
- 第五章:Android佈局Android
- oracle重建ocrOracle
- OCR的操作
- 第一章 初識AndroidAndroid
- 第四章:Android架構Android架構
- ios OCR技術iOS
- OCR維護命令
- ORACLE RAC重建OCROracle
- 利用tesseract解析簡單數字驗證碼圖片
- 讀書筆記之《現代軟體工程》第5.5章、第6章、第7章筆記軟體工程
- 第2章Android四大元件Android元件
- Android程式設計基礎 • 【第1章 Android程式入門】Android程式設計
- 《專案管理之美》第1章專案管理
- 《專案管理之美》第10章專案管理
- 架構之美第二章架構
- OCR活體檢測
- OCR技術簡介