OCR技術-文字影像識別

OCR_wang發表於2019-11-05

文件OCR識別技術的概括

我們常說的文件OCR識別技術、文件OCR識別技術是指透過電子裝置等將紙質上的文字識別出來,形成可編輯的文字。

傳統的檔案、文書、文案等文獻資料的數字化錄入,一般都是由專門做數字化加工業務的公司承接完成!這些公司一般都會有幾十個工作人員,分工明確,處理影像、分析識別、結果校對、輸出檔案等工序是一條龍序列工作執行。這就像一個生產加工的工廠,流水作業生產最後的電子檔案。

文件識別OCR技術的識別效果,主要看兩方面:OCR程式是否優秀、圖片檔案是否清晰符合標準,具體表現在以下幾方面:

1、圖片:建議掃描器解析度設定為300DPI規格的引數;手機拍照的話建議攝像頭畫素為500萬畫素以上的攝像頭;

2、顏色:常規的傳統的OCR識別要求為白底黑字或者淺底黑字;如果是彩色背景圖片的文字則需要特殊的OCR識別程式,比如文通影片文字識別系統;

3、字型:目前全世界範圍內的OCR技術都是針對“宋體印刷字”的字形做識別庫的;

4、程式:好的OCR程式遇到好的圖片,識別效果才會優秀;在這裡推薦北京文通科技推出的OCR程式,包括OCR-SDK開發包產品、文件OCR識別技術APP產品等等。

文件OCR識別技術的流程

隨著掃描器的普及與廣泛應用,再加上攝像頭迅速發展的手機等智慧終端裝置的應用,文件OCR識別技術軟體越來越被應用於各種業務系統中。

常規的文件OCR識別技術處理的過程包括:

1、影像輸入、預處理:二值化圖片、噪聲去除、傾斜較正;

2、版面分析:把頁面分為橫排文字、豎排文字、表格、圖片等不同區域,幫助字元切割、識別OCR;

3、設定語種:選擇需要什麼OCR語種的引擎程式;

4、輸出結果:輸出OCR識別結果為原版原樣的優質檔案;

文件OCR識別技術系統,只要把影像作一個轉換,使影像內的字元繼續儲存、有表格則表格內資料及影像內的文字,一律變成計算機文字,方便日後查詢檢索重複利用。

OCR技術-文字影像識別

OCR技術-文字影像識別


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69944138/viewspace-2662774/,如需轉載,請註明出處,否則將追究法律責任。

相關文章