技術簡介：

• OCR技術是光學字元識別的縮寫(OpticalCharacter Recognition)，是透過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其它印刷品的文字轉化為影像資訊，再利用文字識別技術將影像資訊轉化為可以使用的計算機輸入技術。

• 可應用於銀行票據、大量文字資料、檔案卷宗、文案的錄入和處理領域。適合於銀行、稅務等行業大量票據表格的自動掃描識別及長期儲存。相對一般文字，通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度4個方面作為OCR技術的評測依據;而相對於表格及票據，通常以識別率或整張透過率及識別速度為測定OCR技術的實用標準。

在檔案領域OCR技術使檔案掃描成果達到了全文可識別，將檔案數字化發展提升了到了一個新的階段，是原本掃描出來的圖片變得更容易進行檢索，為數字檔案館的資料查詢提供了技術支援，是檔案數字化發展中必不可少的一環。

技術引數：

1、支援識別TIF、PNG、BMP、JPG格式圖片，PDF檔案；

2、版面分析：橫排文字、豎排文字、影像、表格版面，將識別結果最大程度還原到識別原件的內容；包括表格、影像的格式還原，段落的格式還原；

3、支援中文簡體，中文繁體，英文，日文、韓文，俄文，德文，法文，義大利文；（備註：後續可升級支援：藏文識別、維吾爾文識別、維文識別、哈薩克文識別、阿拉伯文識別、柯爾克孜文識別等）；

4、支援對圖片進行，濾紅，去下劃線，傾斜矯正，自動旋正；

5、支援對記憶體中的影像進行識別；OCR演算法中為了保障識別率本身就包括影像輸入、預處理、二值化、噪聲去除、段落處理、字元切割、字元識別等處理；

6、識別300DPI 宋體字掃描文件 99.8%的識別率，700毫秒/A4；（跟頁面複雜程度有關）；

7、支援結果匯出為可編輯的：XML、雙層PDF、TXT、RTF格式（WORD文字編輯）、XLS格式（EXCEL表格編輯）；

8、提供可靠、方便整合的OCR SDK開發包；

9、整合開發介面最全：C、C++、VB、VC、JAVA、DELPHI；

作業系統：

1、支援Windows作業系統；

2、支援Linux作業系統：（僅支援中文、英文識別、輸出TXT、雙層PDF結果）

OCR技術簡介

相關文章