達觀智慧文件審閱系統，推動證券非結構化文件處理提質提效

達觀資料DataGrand發表於2021-12-02

原文網址 : http://blog.itpub.net/69997703/viewspace-2845301/

隨著智慧證券的推動發展，利用 OCR、NLP等先進技術解決基金確認單、託管劃款指令、基金宣推材料審批、通用表格解析多類場景的非結構化文件的資料識別與處理，實現相關場景非結構化文件的 識別解析、智慧稽核及與業務對接等，並透過平臺化建設提供一定的可擴充性和泛化能力。 實現提高業務自動化率、節省人力，提升業務辦理效率、提高滿意度，降低業務差錯率、促進業務創新等目的。

lQLPDhrrbzlCIIXNA-jNCS6w-nqyBpd4DQwBrvqHkYA2AA_2350_1000.png_720x720q90g

以某一線城市的證券經濟管理部門業務為例，需要對基金公司釋出的宣傳海報裡的過往業績、基金評價、風險提示、股東背景等要素按照證監會要求進行審批。業務人員接收到的海報材料五花八門，且不同基金公司不同型別的樣本質量參差不齊，使得業務人員花費大量時間在稽核過程當中。

達觀智慧文件審閱系統可以從樣本中找出關鍵稽核要素，透過對現有業務痛點的深入分析，基於 OCR、NLP、機器學習等金融科技能力構建非結構化 文件智慧稽核平臺，將非結構化文件數字化、結構化，實現內容的 自動識別、智慧提取、智慧稽核，在節省人工的基礎上達到提質增效的目的。

lQDPDhrrbzR9bKHNAjzNBFOwsmlRv8kiRFwBrvp_9MC5AQ_1107_572.jpg_720x720q90g

智慧文件關鍵要素抽取預審

以基金公司宣推海報為例：

1、透過全篇海報副文字提取，支援 禁用詞庫靈活配置，機器智慧稽核海報語義合規性。

lQDPDhrrbzR9bHPNAWjNAbWwMEBOlguynLoBrvp_9MA2AA_437_360.jpg_720x720q90g

禁用詞庫自由配置，可根據不同詞性做詞庫歸類與分級

2、針對宣推樣本特點，針對性表格抽取模組，對錶格進行 規則抽取與組合抽取，將基金公司與業績評價組合起來變成可能，透過模型增加召回率。

lQDPDhrrbzR9bH7NAjPNBFOw7ahP0E2jDxMBrvp_9UC8AA_1107_563.jpg_720x720q90g

靈活新增新的禁用詞，次數代表該禁用詞被擊中的次數

3、透過字型、位置資訊，“理解”文字，分辨出股東背景、風險提示、特殊基金等 重要資訊進行稽核。

lQDPDhrrbzR9bH_NAkrNBFOwcu3rHtd3DgIBrvp_9MC5AA_1107_586.jpg_720x720q90g

根據證監會不同時期要求，對海報新增稽核規則。規則分為邏輯與必有必無規則，支援靈活配置與調整。

首先會進行機器預審，抽取原文綠色則是透過，紅色則是預審不透過。並且在原文中會對關鍵元素高亮以及定位，快速定位問題核實結果。根據不同規則，在稽核詳情中清晰明瞭的展示稽核依據，便於業務同事快速判斷預審準確性。

截止2021年10月， 達觀智慧文件審閱系統已完成對120多家基金公司的確認單解析，支援PPT、複雜類、一頁通等七類宣推海報的解析與100多個關鍵要素的識別和抽取， 透過智慧識別、智慧審批，有效節省業務人員的稽核與比對的工作時間，並降低業務的差錯率，真正實現了資訊化、智慧化辦公。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69997703/viewspace-2845301/，如需轉載，請註明出處，否則將追究法律責任。

相關文章

喜訊！達觀資料中標國信證券文件智慧審閱專案
2021-12-21
達觀文件智慧方案助力打造審計業智慧函證中心
2021-10-08
AI+軟體工程：10倍提效！用ChatGPT編寫系統功能文件
2024-03-25
AI軟體工程ChatGPT
達觀智慧文件審閱系統，一鍵完成上百份合同資訊自動比對、錄入與風險核查
2021-12-29
架構設計文件提綱簡描
2019-05-13
架構
投行數字化轉型方案，達觀智慧文件處理賦能數字投行
2022-01-11
技術驅動的文件革命：思通數科智慧文件系統的OCR與自動化表格處理技術解析
2024-09-02
專訪達觀資料CEO陳運文：文件審閱2.0時代到來
2018-08-16
達觀智慧公文處理系統助力黨政機關嚴控公文質量
2021-11-09
紙質文件管理系統加速文件資料電子化流程
2020-07-08
[提問交流]關於對OT現有的文件系統使用疑問
2019-05-11
證券行業檔案自動化處理
2019-01-21
行業
達觀銀行詢證函解決方案，文件智慧稽核技術提升審計回函業務往來效率
2022-02-18
技術文件：基於 Python 的影像處理系統
2024-07-26
Python
研效優化實踐：WeTest提效測試
2022-01-19
優化
ElasticSearch 文件併發處理以及文件路由
2021-09-09
Elasticsearch路由
達觀資料：怎樣評價推薦系統的結果質量？
2020-04-02
文件連結推薦!
2019-06-19
提點效: 使用 Cursor
2024-09-23
研效最佳化實踐：WeTest提效測試
2022-01-18
windows10系統移動“我的文件”到非系統盤的方法
2019-03-28
Windows
HTML文件結構
2021-09-09
HTML
達觀智慧文字分析系統，賦能企業大資料加工處理
2022-01-27
大資料
提權 | Windows系統
2024-10-23
Windows
Apache POI處理Excel文件
2019-03-04
ApacheExcel
jQuery 篩選&文件處理
2022-04-16
jQuery
致laravel各位大佬 laravel說明文件提個意見
2021-03-04
Laravel
從資料提取到管理：合合資訊的智慧文件處理全方位解析【合合資訊智慧文件處理百寶箱】
2024-10-31
對自助提卡系統的一次程式碼審計
2020-02-04
證券交易系統搭建架構
2024-04-11
架構
企業引入雲脈紙質文件管理系統實現文件高效管理
2020-07-03
雲脈紙質文件管理系統：多重檢索輕鬆查詢文件
2020-08-05
達觀資料攜手某市審批局打造智慧“一業一證”申報資訊系統
2022-01-10
網賭網站系統維護不給出款提現怎麼處理？
2019-06-06
網站
網賭被黑提款系統風控稽核不給提現該怎麼處理？
2019-05-26
文件智慧：通用文件預訓練模型與資料集，推動NLP落地升級
2020-08-19
模型
ModStart開發者文件-系統架構
2022-01-05
架構
web前端分享：效能最佳化之文件碎片處理
2021-09-13
Web前端