Tesseract-OCR-02-Tesseract-OCR 的安裝與 環境變數配置

肖朋偉發表於2018-09-07

Windows 下 Tesseract-OCR 的安裝與 環境變數配置

本篇介紹Windows下Tesseract-OCR的安裝與環境配置,然後做一個圖片的文字識別測試

Windows下 Tesseract-OCR 的安裝

Windows下 Tesseract-OCR 的環境變數配置

  • 1.開啟 Tesseract-OCR 的安裝目錄,拷貝路徑
    這裡寫圖片描述
  • 2.在【此電腦】右鍵,點選【屬性】,找到【環境變數】
    這裡寫圖片描述
  • 3.找到使用者變數和系統變數 兩個【Path】項點開,都新增剛才拷貝的Tesseract 的安裝路徑
    這裡寫圖片描述
    這裡寫圖片描述
  • 4.再找到【系統變數】,新建一個變數名稱為:TESSDATA_PREFIX
    值為:剛才路徑加上 \tessdata
    這裡寫圖片描述

Tesseract 環境終於配置完成,去測試咯!

Tesseract-OCR 的文字識別測試

  • 1.找一個需要識別的圖片,比如這個test.jpg https://xpwi.github.io/Photos/p/test.jpg
    放在一個好找的目錄,最好是 D:\photos 這樣的
    這裡寫圖片描述
  • 2.開啟 cmd 進入該圖片的資料夾
    • 使用 cd 目錄名 進入目錄
    • 使用 cd.. 返回上一級目錄
  • 3.敲入: tesseract test.jpg output_1
  • 4.操作截圖:
    Tesseract-OCR-02-Tesseract-OCR 的安裝與 環境變數配置

執行結果:

這裡寫圖片描述

這裡圖片中的數字,有一個是識別錯誤的,就需要使用更多的數字去訓練,才可以得到更高的準確率,關於訓練資料,後面再介紹,關注我哦!

更多文章連結:Tesseract 隨筆


  • 本筆記不允許任何個人和組織轉載

相關文章