Windows 下 Tesseract-OCR 的安裝與 環境變數配置
本篇介紹Windows下Tesseract-OCR的安裝與環境配置,然後做一個圖片的文字識別測試
Windows下 Tesseract-OCR 的安裝
- Tesseract-OCR Windows安裝包下載:https://digi.bib.uni-mannheim.de/tesseract/
- 上面連結看著頭疼就下我的網盤裡的:
- 注意:安裝的最後的時候,會有個最下面的項沒有選中,選中它
- 安裝的話就預設安裝就好,如果選中那個線上安裝包,會很慢,耐心等下
- 路徑記住,配置環境要用
Windows下 Tesseract-OCR 的環境變數配置
- 1.開啟 Tesseract-OCR 的安裝目錄,拷貝路徑
- 2.在【此電腦】右鍵,點選【屬性】,找到【環境變數】
- 3.找到使用者變數和系統變數 兩個【Path】項點開,都新增剛才拷貝的Tesseract 的安裝路徑
- 4.再找到【系統變數】,新建一個變數名稱為:TESSDATA_PREFIX
值為:剛才路徑加上 \tessdata
Tesseract 環境終於配置完成,去測試咯!
Tesseract-OCR 的文字識別測試
- 1.找一個需要識別的圖片,比如這個test.jpg https://xpwi.github.io/Photos/p/test.jpg
放在一個好找的目錄,最好是 D:\photos 這樣的
- 2.開啟 cmd 進入該圖片的資料夾
- 使用 cd 目錄名 進入目錄
- 使用 cd.. 返回上一級目錄
- 3.敲入: tesseract test.jpg output_1
- 4.操作截圖:
執行結果:
這裡圖片中的數字,有一個是識別錯誤的,就需要使用更多的數字去訓練,才可以得到更高的準確率,關於訓練資料,後面再介紹,關注我哦!
更多文章連結:Tesseract 隨筆
- 本筆記不允許任何個人和組織轉載