很多工作流程中涉及文件的表格的提取,比如財報資訊的識別提取、銀行流水的表格審查等,並且這些文件常常在PDF、掃描件、圖片等無法直接複製出表格樣式的文件中。人工操作費時費力,還需要留心出錯的問題。
達觀資料智慧表格提取工具,結合NLP、OCR、CV 等自研人工智慧技術,以智慧化方式解決文件表格提取中的核心痛點問題。可以支援PDF、Word、掃描件、圖片等多種文件格式型別,快速提取文件中的表格資訊,更直觀、更方便、更準確的完成文件的表格提取,讓表格識別提取工作更輕鬆。透過上傳文件->檢視結果的操作簡單方式,便可清晰明瞭看到文件中所有的表格內容,且能夠對錶格資料進行預警提示,同時也可支援表格的各種編輯操作,包含:合併、拆分單元格、跨頁合併、表格線編輯,可移動、增加、刪除單元格線等各種複雜操作。可對影像流水單轉換為為可多銀行流水模板,並據此進行資料完整性、真實性檢查、審查交易對手、挖掘潛在關聯交易、分析企業經營情況。
可自動提取財報、審計報告、年報等披露文件中的不同口徑財務主表及附註資訊,並提供試算平衡校驗。可提取出年報、半年報、季度報表表格資料,完成各類報表資料高效檢視。紙質版電費分割單全資訊提取識別,匯出excel等多種格式檔案,方便快速核對檢視。精準識別掃描件、圖片、PDF中的表格資料,解決只讀格式檔案無法直接複製表格問題,助力文件結構化處理。- 支援Word、PDF、圖片(JPG、JPEG、TIF、PNG)、掃描件等不同文件格式
- 支援常見通用表格、銀行流水、訂單表、箱單、申請表、報關單表、備案表格、國際貨運單等數十種文件型別
- 表格內容直觀展示,一鍵定位檢視內容
- 提取結果檢視匯出,一眼知曉識別結果
- 強大表格編輯功能,人機結合零誤差
- 支援圖片汙染、水印、影像輕微揉搓、印章遮蓋、表格過密等多種文件情況下表格精準識別;