ios OCR技術

weixin_34194087發表於2017-10-25

最近專案比較輕鬆,就花時間研究一下OCR技術,增加自身技能。為啥花時間研究這個OCR技術?因為我現在做的是一個銀行專案需要讀取客戶銀行卡卡號以及身份證資訊,我們現在在專案上採用方式是通過第三方公司背夾來讀取這些資訊。我個人覺得這種模式有點笨重,尤其對那些上門辦理業務櫃員來說,這是一個很大痛點。所以我通過利用空閒時間研究一下,發現ORC技術可以解決掉這個問題。廢話不多說直接看講解OCR技術:

什麼是OCR技術?

OCR (Optical Character Recognition,光學字元識別)是指電子裝置(例如掃描器或數碼相機)檢查紙上列印的字元,通過檢測暗、亮的模式確定其形狀,然後用字元識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字元,採用光學的方式將紙質文件中的文字轉換成為黑白點陣的影象檔案,並通過識別軟體將影象中的文字轉換成文字格式,供文書處理軟體進一步編輯加工的技術。如何除錯或利用輔助資訊提高識別正確率,是OCR最重要的課題,ICR(Intelligent Character Recognition)的名詞也因此而產生。衡量一個OCR系統效能好壞的主要指標有:拒識率、誤識率、識別速度、使用者介面的友好性,產品的穩定性,易用性及可行性等。

看上去是不是很高大上,有一點懵逼?
其實你去網上一查,關於OCR SDK還是蠻多的,比如漢王、雲脈等;這些是收費的而且費用挺昂貴的。開源的sdk也有比如谷歌Tesserac等。
本文采用的是開源框架bank_io與libexidcard,為啥使用它們?因為我比較了很多開源框架發現只有它們識別正確率保證在90%以上。其原理是通過相機捕獲物體實時影象,然後通過核心方法(用C寫的方法)去實時影象處理,當所需要的資訊獲取完畢之後相機就會拍一張物體照片。核心程式碼如下:

1647646-237482930b0d35e7.png
1.png

1647646-e631ba6818f9959c.png
螢幕快照 2017-10-25 上午9.46.09.png

完整demo
demo裡有完整註釋,不要忘記star!!!

相關文章