OCR技術簡介

OCR_wang發表於2019-12-19

技術簡介:

• OCR技術是光學字元識別的縮寫(OpticalCharacter Recognition),是透過掃描等光學輸入方式將各種票 據、報刊、書籍、文稿及其它印刷品的文字轉化為影像資訊,再利用文字識別技術將影像資訊轉化為可以使用的計算機輸入技術。

• 可應用於銀行票 據、大量文字資料、檔案卷宗、文案的錄入和處理領域。適合於銀行、稅務等行業大量票 據表格的自動掃描識別及長期儲存。相對一般文字,通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度4個方面作為OCR技術的評測依據;而相對於表格及票 據,通常以識別率或整張透過率及識別速度為測定OCR技術的實用標準。

在檔案領域OCR技術使檔案掃描成果達到了全文可識別,將檔案數字化發展提升了到了一個新的階段,是原本掃描出來的圖片變得更容易進行檢索,為數字檔案館的資料查詢提供了技術支援,是檔案數字化發展中必不可少的一環。

技術引數:

1、支援識別TIF、PNG、BMP、JPG格式圖片,PDF檔案;

2、版面分析:橫排文字、豎排文字、影像、表格版面,將識別結果最大程度還原到識別原件的內容;包括表格、影像的格式還原,段落的格式還原;

3、支援中文簡體,中文繁體,英文,日文、韓文,俄文,德文,法文,義大利文;(備註:後續可升級支援:藏文識別、維吾爾文識別、維文識別、哈薩克文識別、阿拉伯文識別、柯爾克孜文識別等);

4、支援對圖片進行,濾紅,去下劃線,傾斜矯正,自動旋正;

5、支援對記憶體中的影像進行識別;OCR演算法中為了保障識別率本身就包括影像輸入、預處理、二值化、噪聲去除、段落處理、字元切割、字元識別等處理;

6、識別300DPI 宋體字掃描文件 99.8%的識別率,700毫秒/A4;(跟頁面複雜程度有關);

7、支援結果匯出為可編輯的:XML、雙層PDF、TXT、RTF格式(WORD文字編輯)、XLS格式(EXCEL表格編輯);

8、提供可靠、方便整合的OCR SDK開發包;

9、整合開發介面最全:C、C++、VB、VC、JAVA、DELPHI;

作業系統:

1、支援Windows作業系統;

2、支援Linux作業系統:(僅支援中文、英文識別、輸出TXT、雙層PDF結果)


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69944138/viewspace-2669533/,如需轉載,請註明出處,否則將追究法律責任。

相關文章