Python技巧-只用一行程式碼輕鬆實現圖片文字識別

千鋒武漢發表於2021-08-10

      生活中我們可能會遇到需要從圖片上獲取文字內容的情況,人工去核對的話非常頭疼,今天小千就來教大家使用 Python一行程式碼就能實現文字識別,下面來看看吧。

      Python圖片文字識別

      這裡我們需要用到兩個庫:pytesseract和PIL,同時我們還需要安裝識別引擎tesseract-ocr

      安裝這兩個包可以藉助pip

      pip install PIL

      pip install pytesseract

      然後我們還需要安裝識別引擎tesseract-ocr和中文語言包,預設是不支援中文識別的,所以需要同學們額外安裝一箇中文語言包,網路上下載安裝即可。

      安裝完成tesseract-ocr後,我們還需要做一下配置關聯到Python中:

      在你安裝Python的資料夾中C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py檔案,開啟之後在裡面新增下面的操作。

      CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

      #tesseract_cmd = 'tesseract'

      tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

      可以看到裡面有一個路徑就是你安裝Tesseract-OCR的路徑,注意不要填錯了。

      配置完成之後就可以使用它們了,程式碼如下,其中denggao.jpeg為圖片,同學們替換成自己想要的圖片即可。

Python培訓文字識別

Python培訓文字識別2

      好了同學們趕緊去自己試試吧。最後歡迎大家關注小千,後期分享更多Python技術知識。

       本文來自千鋒教育,轉載請註明出處。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31548651/viewspace-2786188/,如需轉載,請註明出處,否則將追究法律責任。

相關文章