達觀文件智慧方案助力打造審計業智慧函證中心

達觀資料DataGrand發表於2021-10-08

據悉,外部審計在執行審計程式時,會涉及到大量的文字處理工作,如 合同內容抽取、流水資訊核驗、詢證函比對與追蹤、發票資訊抽取與金額合理性分析等。審計員需要在海量的文字資訊中篩選關鍵資訊,進而從完整性、真實性、截止性等角度發現相關風險,以完成審計目的。如今,各類文字資訊展示的方式多樣、收集方法眾多, 舞弊資訊的藏匿也愈發隱蔽,審計員人工收集、挖掘與分析資訊的難度與工作量越來越大,轉而留給分析與複核的時間則愈發緊張。在AI技術迅猛發展的今天,採用智慧化的演算法與技術,為審計人員提供更為便捷的文字處理與智慧分析工具是科技發展與審計行業發展的需求所驅,同時也是AI技術與業務深度融合,實現人工智慧技術落地與發展的重要舉措。

審計

審計行業可應用的智慧文字處理技術

智慧文字處理領域常提及的技術包括自然語言處理(NLP)、光學字元識別(OCR)、智慧流程化機器人(RPA),它們可以 將流水、報表、合同等散亂無固定格式的檔案中的關鍵資訊梳理 ,並輸出成統一的基礎格式,以便於後期資訊採用、分析與人員複核等。

如果將整個智慧文字處理流程比作一個虛擬的人,那麼 NLP技術為大腦,以類人腦的方式滿足文字與語義學習的需求; OCR技術是眼睛,通過獨特的字元識別技術對掃描件、圖片等載體中不可選中、不可編輯的文字及數字等資訊轉換為可編輯、可提取的資訊,以滿足使用者對流水、報表、合同掃描件或圖片等資訊的提取與再加工; RPA技術則是四肢,以高於人類實際手工操作千倍速度的方式實現被識別與抽取的資料的搬運與傳輸工作。

與此同時,在審計行業中,我們不僅將這三大人工智慧技術組合應用,還 結合財會審計業務中常用的語料資訊、業務思維特徵、審計基礎原理,並與業務場景深度融合,在純演算法的體系上增加統計學原理及既定規則定製(如對中國會計準則的應用等),方能實現技術場景落地與業務實用性的雙贏。

適合採用AI智慧文字處理技術的場景

由於計算機與人腦天然的不同,以目前AI的發展情況來看,人工智慧技術尚不能全部覆蓋審計工作的全部場景,特別是無文字資料提供,需要人工進行資訊互動與判斷的工作場景。

從NLP、OCR、RPA技術的實現原理來看,適合採用AI智慧文字處理技術的場景應包括如下特徵:

1. 文字資訊可獲得

2. 處理規則可梳理

3. 處理數量相對大

基於如上三個特徵,我們在 審計前期、審計過程中、審計結論及審計報告管理等審計流程中均選取出適用工作場景以智慧文字處理技術,為協助審計人員進行深度多向分析,以提高審計效率及審計效果。

基於如上原則,我們挑選了智慧函證流程這個代表性場景。

智慧函證流程簡介

發函是必執行的審計程式,通常審計員在發函時需要歷經如下幾個程式:

1. 編寫詢證函(銀行函證、往來函證、關聯方函證、存貨函證等)

2. 客戶資訊確認並蓋章

3. 函證件拷貝留底

4. 發函快遞資訊填寫

5. 發函快遞追蹤

6. 回函資訊追蹤

7. 回函資訊比對

8. 相關結論得出

基於“文字資訊可獲得、處理規則可梳理、處理數量相對大”三大原則,如上流程可採用的人工智慧技術優化方案如下表:

函證 表

在智慧函證方案中,我們應用到的人工智慧技術如下:

印章識別

審計工作中常用到帶印章的基礎文件。本例中,我們常做的是 印章定位與印章提取功能。

在印章定位中,我們使用OCR技術中的目標檢測(OD)技術,對日期章、客戶章、回函章進行定位,以得出相關結論,如:

1. 日期章、客戶章是否在函證指定位置加蓋;

2. 回函章是否在“相符”或“不符”區域加蓋;

在印章識別中,我們使用 達觀自研的印章識別技術,可識別菱形章、方章、圓形章、橢圓章等印章形狀,並可提取印章中的文字,進行相關資訊的整合。

如下圖所示,系統左側是印章原文形態,右側是文字識別結果,系統在對印章進行目標檢測後進行資訊識別。

函證1

因此,在此項技術下,我們可以 實現函證資訊中發函件與回函件的印章位置正確與否的判定,以及發函件與回函件的一致性比對。

函證的印章識別與比對作為發函程式中的必經程式,本項技術的實現無論在執行程式的必要性還是在稽核的準確性方面都具有解放人腦的意義,且此項方案不僅 可應用於會計師事務所,還可 用於投行在IPO過程中的發函程式。

文字智慧比對

在函證程式中,為了減少回函被篡改的風險,審計員通常對回函與發函前的拷貝件進行肉眼比較。在此流程中,我們可以 應用智慧文字比對功能,快速準確完成回函與發函件的異同比對工作。

文件比對功能通過使用NLP與OCR技術,可對目標檔案進行語義級別的比對,同時適用於掃描件、電子版PDF、圖片及word文件之間的比對,以保證具有更高的文字適用性和格式靈活性。

我們以服務協議合同為例介紹比對模組的具體功能及樣式:如上圖,系統可一目瞭然地對全文比對結果進行展示,並對比對結果以輔助線連線、比對詳情等方式展示,清晰可見。

在函證程式中,使用者只需上傳發函拷貝件與回函,即可開箱即用,發現兩份文件的異同。此舉採用地毯式語義理解的方式進行比對,因此與人眼觀察相比效率和準確率更高。

RPA抓取函證資訊

RPA適用於大量重複的操作,在書寫快遞單、函證及回函資訊物流追蹤的過程中,RPA技術可較好地實現快遞單資訊列印、函證控制表生成、物流資訊實時追蹤,並定期生成物流報告,以實現審計員的函證發收過程中的控制。

在以往手工操作過程中,快遞單的書寫與列印、函證收發過程與物流控制佔據了審計員較多的時間,一些大型會計師事務所不得不建立函證中心來控制成本。

若使用RPA進行控制,無論對於審計員還是函證中心來說,都具有極大的成本效益性,且由於RPA極高的準確率,在減少人工失誤及人工疲乏等都具有不可比擬的優點。

其他場景及應用

在審計流程中, 合同資訊抽取、銀行流水識別與分析、財務資料橫向縱向分析、費用全量合理化分析等場景都有較多的應用及可落地方案。我們希望智慧抽取、智慧稽核、智慧比對、RPA等AI技術能夠在細化的場景中實現輕定製的方案應用,以最大可能發揮計算機的優勢,並在不斷的場景化訓練中更新迭代模型,以實現類人腦智慧的不斷髮展與技術落地。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69997703/viewspace-2794985/,如需轉載,請註明出處,否則將追究法律責任。

相關文章