RPA之眼:AI-OCR,Fax-OCR概述

weiyu05發表於2019-11-07

文丨馬磊


OCR是一種與RPA機器人協作的一項重要技術,相當於機器人的眼睛。

OCR是英文“Optical Character Recognition/Reader”的簡稱,光學字元識別。從名字我們不難看出,OCR就是讀取手寫和印刷文字,並把讀取的資訊轉換成可以在電腦的Excel,World等軟體上使用的文字資訊處理技術。

 當前的資訊化社會,大量的檔案被電子化,紙質的檔案越來越少。但事實上依然存在很多不得不使用紙質檔案的情況,比如說街頭調查問卷。OCR技術的誕生可以取代人工讀取紙質檔案的工作,並將紙質檔案的資訊電子化。


RPA之眼:AI-OCR,Fax-OCR概述

RPA和OCR的協作

RPA目前活躍在以金融機關代表的企業中,但是這些企業的紙質媒體和列印資料等非電子化的資料僅僅依靠RPA來進行業務處理的話還是相當困難的。這就為RPA技術與OCR技術的協同合作提供了契機。

在只有RPA的情況下,需要員工手動把紙質檔案的資訊錄入到Excel,Word等電子文件中,然後執行RPA機器人讀取電子文件中的資訊實現業務的自動化處理。

而RPA + OCR的情況下,只需實現掃描好紙質檔案,OCR會自動讀取掃描檔案,將圖片資訊讀取並寫入Excel等文件中,然後RPA機器人執行,進行業務處理。這個過程完全替代了人工手動錄入,極大地節約了人力成本。


RPA之眼:AI-OCR,Fax-OCR概述



近年來, OCR引起了廣泛關注,但目前的OCR軟體存在精度不高和無法應對非固定檔案模板等課題。未來透過在OCR中引入AI的深度機器學習等技術以後,相信一定會解決這個課題。

Fax-OCR是什麼?


RPA之眼:AI-OCR,Fax-OCR概述


Fax-OCR是把傳真機接收的訂單等紙質檔案透過OCR技術自動轉為文字資訊的技術。雖說現在社會尤其是國內公司,很多都是網上接單了,但是用傳真接收客戶訂單這種古老的方式還是在一定程度上存在的。尤其是日本的小型公司依然採用這種老舊的接收訂單的方式。如果把傳真資料自動讀入系統將減少大量人工錄入的費時操作,同時人工失誤也會大幅減少。

OCR的注意點

OCR技術確實可以自動實現資料的文字化,也是一項非常有效的效率改善的技術手段,但是現在的階段OCR並非無所不能。


1、無法對應多份檔案。

一般來說,OCR 需要讀取文字內容以及檔案內容的模板,並定義好抽出的物件資料的位置。但是,由於客戶的檔案模板並不統一,檔案模板和資料座標位置也不盡相同,這種情況應對起來就比較困難了。所以對於一些既有模板以外的檔案要格外注意。


2、文字資料抽出後,必須進行人工確認。

雖然AI-OCR可以透過機器學習技術去識別手寫文字,但是很多不清楚,或者寫法不鮮明的文字還是很難做到完美識別。因此,資料抽出完畢後還是要透過人去確認資料的正確性。


原文地址:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69940722/viewspace-2663120/,如需轉載,請註明出處,否則將追究法律責任。

相關文章