證券行業檔案自動化處理

泰岳语义工厂發表於2019-01-21

證券行業是個充滿活力與挑戰的行業,同時,這個世界也比你想象的要瘋狂。 要熟悉主要經濟指標,快速準確解讀統計資料,對各行各業的財務表現反應敏銳,要從大量的資訊中篩選出最有價值的資料…… 由此而見,證券行業現存的大量文件,若都以人工方式處理,效率極低、投入很大。本文以文件中的證券化說明書為例,講解檔案自動化處理的便捷之道。

證券行業檔案自動化處理

是什麼

能對證券公司資產證券化發行說明書進行自動分析,提取出證券化業務關注的結構化資訊。

能幹啥

資產證券化發行說明書,大多以pdf格式儲存,文件篇幅較長,閱讀費時費力。對於證券業務分析人員來說,往往只關心發行說明書中的某些關鍵點。從發行說明書中自動提取分析人員關注的結構化資料、表格資料、關鍵圖表,將大幅提高分析人員的工作效率,還可利用發行說明書建設資產證券化結構化資料庫,提高資料綜合分析能力。

服務實現的功能,主要包括:

1、資產證券化發行產品資訊的結構化提取。從發行說明書中自動提取與發現產品相關的30多個產品屬性欄位,如產品名稱、發行規模、原始權益人等。

2、資產證券化發行產品資訊的關鍵圖表抽取,如交易結構、現金流支付機制等。自動定位發行說明書中各類圖表的位置,將圖表資訊自動生成為獨立的圖片。服務支援以圖片格式儲存的pdf格式的圖表抽取。

3、資產證券化發現產品的關鍵表格資料抽取。自動定位發行說明書中各類表格的位置,自動識別表格中的行、列資料,形成key-value的資料值對,同時支援將key-value資料對還原出原始表格格式。服務支援各種格式表格提取,如無邊框表格、無內線表格、只有行線表格等,支援以圖片格式儲存的pdf格式的表格抽取。

4、支援對資產證券化產品的模型分析。自動根據上述結構化資料實現模型推演。如證券情景分析,用於計算損失、內部收益率、損失臨界值等;證券和資產池本金償付模型;利息償付模型;是否啟動觸發事件等。服務支援模型的定製輸出。

還有啥

除了資產證券化發行說明書資訊提取的服務以外,泰嶽語義工廠還提供了PDF文件結構化、PDF表格提取、業務文件閱讀理解、證券業務文件碎片化、公告分類、股票發行說明書結構化。

在哪用

資產證券化結構化資料的自動構建,可將大量證券化發行說明書,自動加工成結構化資料,提高資料庫構建的自動化能力,減少人工工作量。

資產證券化分析,服務於相關的證券分析師,分析師節省了閱讀發行說明書的繁瑣工作,專注於對結構化結果的分析和統計比對等工作,大幅提高了分析師的工作效率。

啥特色

完善的機器學習模型,對上萬篇證券業務文件進行自動學習,形成了證券文件的機器學習模型,模型對證券領域的詞彙、句子均具有較高的識別能力。

發行說明書結構化提取準確率高,使用者無需進行資料標註,無需進行後處理,完全一站式解決文件的自動加工,提高效率,減少人工投入。

不需擁有專業的NLP技術,掌握海量證券行業文件快、準、狠!

泰嶽語義工廠
泰嶽語義工廠

泰嶽語義工廠是神州泰嶽推出的NLP服務的開放SaaS平臺,旨在為企業客戶和行業應用開發商提供最專業、最快捷、價效比最高的NLP技術和服務。該專欄聚焦於介紹神州泰嶽智慧語義認知技術和泰嶽語義工廠提供的NLP服務。

http://www.nlpai.cn/
專欄二維碼

相關文章