RPA開發教程丨RPA+OCR如何提取電子合同資訊
隨著公司產品UiBot的影響力在國內外不斷增強,與合作伙伴簽訂的合同也變得越來越多,故此導致業務人員對合同關鍵資訊的提取工作,變得日益繁重。
基於此,公司內部關於電子合同資訊提取的流程自動化需求應運而生。
以下是關於RPA+OCR提取電子合同資訊的流程檢視。
基於電子合同資訊的提取,根據檔案型別,分為兩大類:Word和PDF。
1、Word類。Word類的會直接用RPA機器人UiBot從資訊裡面根據字元規則提取出關鍵資訊,生成結構化資料,當然,也會遇見有些Word文件是補充協議等,沒有相關要提取的資訊,這類會根據業務規則直接在流程裡面,根據模板判斷劃分出來。
2、PDF類。PDF類的會根據裡面資訊分為兩類,一類是文字型,一類是圖片型。
文字的可以使用UiBot的視窗元素中的預製元件獲取元素文字或者文字中的獲取文字來提取關鍵資訊。(需要注意的是使用Acrobat的時候,需要在編輯中選擇輔助工具來做如下圖操作)
圖片類的,就必須要使用OCR來進行識別,然後進行資訊提取,因為上面有蓋章等不同因素的影響,正確率並不能保證百分之百,甚至也沒有關鍵性可以迴流驗證的資訊,所以生成的結構化資料仍需要人工二次校驗,才可以錄入系統,所以基於圖片類的電子合同,並沒有為業務人員節省多少時間,無非是圖片類的電子合同佔比並不高,所以影響不大。
當然此類電子合同都是使用公司固定的統一模板,所以總體業務並不複雜,但如果合同模板不能統一,各有特色,可能就需要根據各個模板的型別來做歸類劃分和業務異常處理。
另一方面,就技術上來說,也可以直接用原始碼模式來引用Office(Word,PDF文字類)的物件直接後臺處理,相比較而言,處理速度會比較快一些。
原文地址:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69940722/viewspace-2663551/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- RPA開發教程丨RPA+NLP郵件智慧分析
- RPA開發教程丨RPA實施的四大階段
- E 籤包電子合同開發 --持續更新中
- 資訊系統開發合同要件
- 能源RPA丨RPA如何變革能源行業?行業
- iStylePDF安全電子文件解決方案之電子合同線上訂立
- CI快速開發電子商城專案視訊教程
- 保障電子合同合法、安全的技術有哪些?
- 大學女生遭網路騙子 電子合同未履行能否索賠
- gitbook 入門教程之使用 gitbook-cli 開發電子書Git
- gitbook 入門教程之使用 gitbook.com 線上開發電子書Git
- 工良出品,從零設計開發 .NET 開發框架:框架原始碼和教程電子書框架原始碼
- gitbook 入門教程之使用 gitbook-editor 編輯器開發電子書Git
- [開發教程]第29講:Bootstrap提示資訊boot
- OpenEMR開源電子病歷醫院資訊系統
- 汽車電子電氣架構開發諮詢服務架構
- 開源電子郵件營銷平臺 listmonk 使用教程
- 如何用 Linux 命令列發電子郵件Linux命令列
- 資訊圖:電子郵件的未來
- 電子文件資訊保安的重要性
- 誰開發了「史上最爛」的電子遊戲?遊戲
- 電子鋼琴專案--嵌入式開發
- 提取java環境資訊Java
- 今年我國電子資訊產業有望呈“低開高走”態勢產業
- Apple開發_提取出字串中長度為24的UUID子字串APP字串UI
- 如何提取SAP UI5應用的技術資訊UI
- 視屏教程、電子書、技術文件
- pancakeswap/uniswap夾子機器人系統開發方案丨Hunter狩獵者夾子機器人系統開發說明機器人
- 純java開發的電子郵件客戶端Java客戶端
- 圖解電子商務大時代——資訊圖圖解
- 國外電子商務產業鏈–資訊圖產業
- 狩獵者Hunter機器人系統開發丨夾子機器人開發邏輯(原理)機器人
- 巧用Python的camelot庫批量提取PDF發票資訊Python
- RPA+物理硬體機器人完成合同蓋章和自動密封機器人
- 新手教程:蘋果電腦如何開啟多個桌面?蘋果
- 燃氣行業引入電子簽章推動燃氣銷售合同線上簽署行業
- windows10中郵箱郵件總是顯示正在提取你的電子郵件如何解決Windows
- 智慧城市開發系統技術丨智慧城市NFT鏈遊開發丨DAPP丨nftAPP