OCR技術簡介
技術簡介:
• OCR技術是光學字元識別的縮寫(OpticalCharacter Recognition),是透過掃描等光學輸入方式將各種票 據、報刊、書籍、文稿及其它印刷品的文字轉化為影像資訊,再利用文字識別技術將影像資訊轉化為可以使用的計算機輸入技術。
• 可應用於銀行票 據、大量文字資料、檔案卷宗、文案的錄入和處理領域。適合於銀行、稅務等行業大量票 據表格的自動掃描識別及長期儲存。相對一般文字,通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度4個方面作為OCR技術的評測依據;而相對於表格及票 據,通常以識別率或整張透過率及識別速度為測定OCR技術的實用標準。
在檔案領域OCR技術使檔案掃描成果達到了全文可識別,將檔案數字化發展提升了到了一個新的階段,是原本掃描出來的圖片變得更容易進行檢索,為數字檔案館的資料查詢提供了技術支援,是檔案數字化發展中必不可少的一環。
技術引數:
1、支援識別TIF、PNG、BMP、JPG格式圖片,PDF檔案;
2、版面分析:橫排文字、豎排文字、影像、表格版面,將識別結果最大程度還原到識別原件的內容;包括表格、影像的格式還原,段落的格式還原;
3、支援中文簡體,中文繁體,英文,日文、韓文,俄文,德文,法文,義大利文;(備註:後續可升級支援:藏文識別、維吾爾文識別、維文識別、哈薩克文識別、阿拉伯文識別、柯爾克孜文識別等);
4、支援對圖片進行,濾紅,去下劃線,傾斜矯正,自動旋正;
5、支援對記憶體中的影像進行識別;OCR演算法中為了保障識別率本身就包括影像輸入、預處理、二值化、噪聲去除、段落處理、字元切割、字元識別等處理;
6、識別300DPI 宋體字掃描文件 99.8%的識別率,700毫秒/A4;(跟頁面複雜程度有關);
7、支援結果匯出為可編輯的:XML、雙層PDF、TXT、RTF格式(WORD文字編輯)、XLS格式(EXCEL表格編輯);
8、提供可靠、方便整合的OCR SDK開發包;
9、整合開發介面最全:C、C++、VB、VC、JAVA、DELPHI;
作業系統:
1、支援Windows作業系統;
2、支援Linux作業系統:(僅支援中文、英文識別、輸出TXT、雙層PDF結果)
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69944138/viewspace-2669533/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- ios OCR技術iOS
- FRAM技術簡介
- OCR識別技術
- Raid 技術簡介AI
- RAID技術簡介AI
- ocr文字識別技術
- 大資料技術簡介大資料
- WebSocket原理及技術簡介Web
- 搜尋排序技術簡介排序
- 區塊鏈-技術簡介區塊鏈
- 區塊鏈技術簡介區塊鏈
- oracle 閃回技術簡介Oracle
- Linux HugePage技術簡介Linux
- 影片壓縮技術簡介
- python技術簡介(三)Python
- 通訊系統之TDM技術和FDM技術簡介
- OCR身份證識別技術
- OCR技術-文字影像識別
- 技術簡介——後端開發後端
- 積體電路技術簡介
- 深入React技術棧(1):簡介React
- React與Redux整合技術簡介ReactRedux
- Redux技術架構簡介(一)Redux架構
- SSD的兩種技術簡介
- 資料探勘技術簡介(轉)
- TH-OCR文字識別技術
- OCR檢測與識別技術
- Mybatis技術內幕(1):Mybatis簡介MyBatis
- 1.01 容器技術和docker簡介Docker
- 《Web滲透測試技術》簡介Web
- 技術分享 | kubernetes pod 簡介
- 跨平臺開發技術簡介!
- LUKS加密卷應用技術簡介加密
- OCR識別的技術流程解析1
- OCR識別的技術流程解析2
- OCR識別技術—活體檢測
- SAP 前端技術的演化史簡介前端
- 十二種特徵工程相關技術簡介特徵工程