是什麼
能對證券公司資產證券化發行說明書進行自動分析,提取出證券化業務關注的結構化資訊。
能幹啥
資產證券化發行說明書,大多以pdf格式儲存,文件篇幅較長,閱讀費時費力。對於證券業務分析人員來說,往往只關心發行說明書中的某些關鍵點。從發行說明書中自動提取分析人員關注的結構化資料、表格資料、關鍵圖表,將大幅提高分析人員的工作效率,還可利用發行說明書建設資產證券化結構化資料庫,提高資料綜合分析能力。
服務實現的功能,主要包括:
1、資產證券化發行產品資訊的結構化提取。從發行說明書中自動提取與發現產品相關的30多個產品屬性欄位,如產品名稱、發行規模、原始權益人等。
2、資產證券化發行產品資訊的關鍵圖表抽取,如交易結構、現金流支付機制等。自動定位發行說明書中各類圖表的位置,將圖表資訊自動生成為獨立的圖片。服務支援以圖片格式儲存的pdf格式的圖表抽取。
3、資產證券化發現產品的關鍵表格資料抽取。自動定位發行說明書中各類表格的位置,自動識別表格中的行、列資料,形成key-value的資料值對,同時支援將key-value資料對還原出原始表格格式。服務支援各種格式表格提取,如無邊框表格、無內線表格、只有行線表格等,支援以圖片格式儲存的pdf格式的表格抽取。
4、支援對資產證券化產品的模型分析。自動根據上述結構化資料實現模型推演。如證券情景分析,用於計算損失、內部收益率、損失臨界值等;證券和資產池本金償付模型;利息償付模型;是否啟動觸發事件等。服務支援模型的定製輸出。
還有啥
除了資產證券化發行說明書資訊提取的服務以外,泰嶽語義工廠還提供了PDF文件結構化、PDF表格提取、業務文件閱讀理解、證券業務文件碎片化、公告分類、股票發行說明書結構化。
在哪用
資產證券化結構化資料的自動構建,可將大量證券化發行說明書,自動加工成結構化資料,提高資料庫構建的自動化能力,減少人工工作量。
資產證券化分析,服務於相關的證券分析師,分析師節省了閱讀發行說明書的繁瑣工作,專注於對結構化結果的分析和統計比對等工作,大幅提高了分析師的工作效率。
啥特色
完善的機器學習模型,對上萬篇證券業務文件進行自動學習,形成了證券文件的機器學習模型,模型對證券領域的詞彙、句子均具有較高的識別能力。
發行說明書結構化提取準確率高,使用者無需進行資料標註,無需進行後處理,完全一站式解決文件的自動加工,提高效率,減少人工投入。
不需擁有專業的NLP技術,掌握海量證券行業文件快、準、狠!