利用tesseract解析簡單數字驗證碼圖片
tesseract 是一個 OCR(Optical Character Recognition,光學字元識別)引擎,能夠識別圖片中字元,利用這個可以用來解析一些簡單的圖片驗證碼。Github 地址:https://github.com/tesseract-ocr/tesseract,Windows 平臺 v3.05.01 版本下載地址:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01.exe
一開始弄這個是因為學校網路要上網每次都要在網頁驗證,就想能不能寫個程式自動驗證免去手動驗證過程。但這需要驗證碼,為了解決這個問題,就上網搜了一下,就看到有用 tesseract 的。有人用 Python 實現了一個工具:https://github.com/madmaze/pytesseract,拿來試了一下,Windows 上使用總是有問題,我就把目光轉向了 tesseract 本身,這是它的使用說明:
最後就決定自己實現一個簡單的介面
使用方法
對引數解釋一下
具體思路
本地圖片的,先判斷該檔案是否存在;網路圖片的,下載到本地,預設的儲存路徑是 r”D:img.jpg” (儲存在哪不重要,只是暫存而已,解析完會自動刪除的)
接下來是一些非必要引數
至於為什麼只是數字,是因為英文的總是不能完全解析出來,修改了 -l 引數也是沒用,使用其自帶的 tessdata 也沒用,中文的話解析出來的內容完全看不懂… (或許是我開啟方式不對?)
效果
測試圖片1
測試圖片2
測試圖片3
溫馨提示:不能保證百分百正確,也不能保證百分百解析得出來。所以專案僅供參考!!!要有保證的話還是找打碼平臺吧
原文釋出時間為:2017-06-08
本文作者:陳鍵冬
本文來自雲棲社群合作伙伴“Python中文社群”,瞭解相關資訊可以關注“Python中文社群”微信公眾號
相關文章
- python利用Tesseract識別驗證碼Python
- 利用PyTorch訓練模型識別數字+英文圖片驗證碼PyTorch模型
- 簡單的數字驗證碼破解
- 短視訊app搭建,利用javaWeb生成一張簡易驗證碼圖片APPJavaWeb
- 圖片驗證碼 CaptchaAPT
- 圖片驗證碼介面
- 登陸介面模組解析——生成圖片驗證碼
- golang 生成圖片驗證碼Golang
- Tesseract 圖片識別
- Vue 前端圖形數字驗證碼外掛Vue前端
- 【日常筆記】生成驗證碼圖片筆記
- 網路驗證碼的進化:從簡單圖文到無感驗證
- 圖形驗證碼圖片樣式設定
- Tesseract OCR 圖片文字識別
- 利用js編寫一個簡單的html表單驗證,驗證通過時提交資料(附原始碼)JSHTML原始碼
- node實現登入圖片驗證碼
- 點選驗證圖片
- 滑塊驗證圖片
- 旋轉圖片驗證
- 短視訊商城系統,通過Java實現圖片驗證碼,點選重新整理圖片驗證碼Java
- 5種PHP生成圖片驗證碼例項PHP
- 【例項】使用GD庫生成圖片驗證碼
- Python圖片驗證碼降噪 — 8鄰域降噪Python
- js驗證數字JS
- 簡單幾步實現滑動驗證碼(後端驗證)後端
- Java隨機生成圖片與HTML表單中的驗證碼實現Java隨機HTML
- 使用Tesseract進行圖片文字識別
- 使用 Ruby 識別英文數字驗證碼
- 使用 Swift 識別英文數字驗證碼Swift
- 使用 OCaml 識別英文數字驗證碼
- Python爬蟲教程-29-驗證碼識別-Tesseract-OCRPython爬蟲
- 分享一個圖片驗證碼功能的實現
- PHP GD庫解析一張簡單圖片並輸出PHP
- Python實現簡單驗證碼的轉文字Python
- 【Node】簡單快捷的圖片壓縮指令碼指令碼
- 使用 C# 識別英文數字驗證碼C#
- Python識別字母數字組合驗證碼Python
- 圖形驗證碼