打破AI黑盒,用機器學習+知識圖譜助金融機構反洗錢

淵亭科技發表於2020-03-06

反洗錢,是指預防通過各種方式掩飾、隱瞞毒品犯罪、黑社會性質的組織犯罪、恐怖活動犯罪、走私犯罪、貪汙賄賂犯罪、破壞金融管理秩序犯罪等犯罪所得及其收益的來源和性質的洗錢活動的措施。

01 2020,仍是反洗錢監管大年

自2007年中國正式加入反洗錢金融行動特別工作組(FATF)以來,我國反洗錢和反恐怖融資的監管工作不斷加碼。央行、銀保監會、證監會陸續出臺檔案,涉及網際網路金融、銀行業、特定非金融機構等領域,因違反反洗錢規定被罰已成為資管機構罰單重災區。

處罰力度方面,央行對違規機構的罰沒金額逐年加大。在剛剛過去的2019年,央行披露的整年的反洗錢罰單達354張,金額達1.38億,超過2018同期資料,整體呈“量價齊飛”的特質。

2020年開年不久,監管針對“反洗錢”的相關處罰持續呈現出高壓態勢,央行不光頻頻開出千萬級鉅額罰單,還進行了“雙罰”,監管力度可見一斑。

與此同時,FATF第31屆第二次大會於2020年2月19日至21日期間在法國巴黎舉行。會上FATF公佈將於2020年6月審查各國關於FATF新監管指南的執行情況,包括虛擬資產經營者在反洗錢、禁止恐怖主義融資等方面是否有所進展等。

打破AI黑盒,用機器學習+知識圖譜助金融機構反洗錢

去年2月,FATF全會審議通過了中國第四輪反洗錢和反恐怖融資互評估,報告認為中國反洗錢和反恐怖融資體系具備良好基礎,同時存在一些問題需要改進。

內外高壓下,可以肯定的是,2020年反洗錢監管工作仍將持續向縱深發展,監管力度仍處於不斷收緊的態勢,資管機構亟需提升反洗錢能力。

02 資管機構反洗錢,難點在哪?

隨著金融交易平臺越來越多,移動轉賬和支付的普及,複雜的國際法以及數字貨幣的出現等,交易量快速增加,導致成倍增加的案件與有限人力資源反洗錢之間的矛盾凸顯。

海量資料使單一金融機構在監測洗錢資金流向、研判可疑交易、定位犯罪分子等方面存在困難,具體表現在:

  • 傳統的風險監測方法導致了較高的誤報率和大量人力浪費

隨著金融業務模式的發展,基於規則策略、依靠人力甄別的傳統風險監測方法在準確性和處理效率方面能力不足,難以適應線上業務發展和海量交易資料處理要求,以至造成大量的人物力浪費。

以商業銀行為例,傳統洗錢風險監測方法多是採用:依據總行反洗錢事後系統(由反洗錢專家設定反洗錢模型和指標),由反洗錢甄別人員每天對海量交易進行規則過濾,對觸發模型的異常交易進行甄別的方式進行異常交易賬戶戶甄別。

甄別人員面臨海量交易資料,不僅工作量巨大,效率低下,影響了可疑案件上報流程的整體效率及案件稽核流程的規範性。還存在大量誤報漏報風險:

一方面,採用基於人工總結的規則模型進行異常交易監測會帶來較高的誤報率;

另一方面,面對比如具有小額高頻特點的交易行為,甄別人員很難從中準確識別可疑交易而導致漏報,最終導致機構的有效可疑交易報告上報率低。

  • 基於歷史經驗的反洗錢規則系統無法識別多重身份或具有複雜交易路徑的洗錢行為

目前,反洗錢模型和指標依賴於專家對過去反洗錢工作經驗的總結。但近年來,通過複雜金融交易進行洗錢和資金轉移的趨勢愈加明顯。

狡猾的犯罪團體往往使用多重身份、大量賬號、低頻交易、變換交易路徑等複雜的方式混於正常交易之中,或通過跨行轉賬、證券投資、跨境支付、投資貿易、藝術品拍賣、賭博、數字貨幣等手段掩蓋洗錢交易行為。

以商業銀行為例,通過跨行交易切斷資金鍊,已成為洗錢及其上游犯罪資金轉移的慣用手法,單憑單點銀行系統提取的賬戶交易資訊,難以準確發現賬戶交易的可疑特徵。

再比如國際上,隨著跨境貿易頻繁發生,“貿易洗錢”已經成為重要的犯罪渠道,具有涉案金額大、影響範圍廣、隱蔽性強等特點。依賴既往經驗的反洗錢規則系統難以對以上洗錢交易行為進行有效甄別。

  • 傳統的客戶身份識別方法無法進行多層次的賬戶關聯關係分析和可疑身份定位

從2019年監管部門反洗錢行政處罰情況來看,機構違規具體內容中,“未按照規定履行客戶身份識別義務”為違規型別之首。而事實是客戶身份識別一直是是反洗錢工作中的攻堅難點。

要準確識別客戶身份不僅要了解客戶的基礎身份資訊,而且需要了解客戶的行為特徵資訊,以及客戶與客戶間的交易關聯關係。

這就需要對客戶的多維資料彙總分析,對與客戶相關聯的自然人或者非自然人的身份,以及他們之間發生的交易行為進行核實、調查和確證。且因為客戶的社會關係總是複雜多變,因此持續識別也非常重要。

當前大部分反洗錢合規系統的基礎都是關係型資料庫,但關係型資料庫並不擅長處理關聯問題。無法對複雜的客戶關係網路和資金流轉網路進行構建,難以解決多層級的賬戶關聯關係挖掘以及逐層計算分析等,而這些對於分析資金流動痕跡和評估賬戶洗錢風險至關重要。

03 用前沿科技手段,提升反洗錢能力

顯然,在面對海量複雜的資料時,人類的處理和決策遠落後於機器。藉助知識圖譜機器學習人工智慧等科技力量,可幫助資管機構提升合規水平與資料探索綜合能力。

認知智慧服務廠商淵亭科技針對合規成本高、誤報率高、識別難度大、缺乏有效性和靈活性等行業痛點,設計推出“反洗錢智慧交易監測分析平臺”。綜合利用機器學習在特徵發現和規律學習的優勢以及知識圖譜在關聯挖掘和知識計算方面的優勢,基於海量資料驅動,融合反洗錢專家規則,形成可解釋的、可自主學習的、可主動預警的自動化智慧反洗錢應用。

致力於幫助資管機構實現客戶全生命週期動態畫像和風險分類、可疑交易事件穿透式監測、洗錢行為特徵知識沉澱、洗錢風險事前預測等一系列目標。

  • 機器學習提升異常交易監測與上報效率

機器學習提升異常交易監測與上報效率機器學習是一種能夠直接從資料中“學習”資訊並建立規則的演算法,它模擬人類大腦學習,通過資料處理、特徵加工、模型訓練與驗證等工作程式完成模型的建立和優化迭代。

在反洗錢、反恐怖融資等合規領域,可以實現對人工風控分析、判斷行為等規律的自動學習。

在異常交易識別中,綜合運用有監督和無監督的方法,學習過去已有的洗錢可疑案宗,全方位提取與洗錢行為關聯的訊號,結合規則引擎和圖計算技術,建立綜合離群點檢測、時間序列預測、分類樹和迴歸樹等演算法的“智慧反洗錢模型”。

基於“智慧反洗錢模型”的異常交易識別引擎,甄別能力可以達到資深反洗錢專家95%的水平,可節省90%的人工核查成本,提升上報的及時性、規範性和有效性。

除此之外,由於機器學習模型成果在實際應用中具備持續學習的能力,因此隨著訓練次數的增加,機器的工作效率和對異常交易的判斷準確性將逐漸提升,尤其滿足網際網路線上業務模式下的海量實時交易監測需求。

  • 自研特徵計算引擎反哺反洗錢知識庫

人工智慧技術是一項可迭代的系統工程,當可用於訓練和學習的樣本資料增多時,演算法效能和模型精度可以得到相應提升。

目前,機器學習在反洗錢領域面臨著特徵量不夠多、不夠有效的問題,綜合使用人工智慧演算法可以發現新型洗錢特徵。

打破AI黑盒,用機器學習+知識圖譜助金融機構反洗錢

基於“圖計算、AI模型、規則模型”三大引擎,對有效洗錢訊號和噪音具備很好的區分能力,能夠自適應於不斷變化的環境,靈敏偵測洗錢特徵。

通過自動學習未知洗錢模式,平臺能夠不斷衍生、擴充和規則化定義洗錢特徵,形成洗錢特徵知識沉澱,反哺反洗錢知識庫。幫助資管機構迭代優化反洗錢規則體系,實現反洗錢監測閉環優化。

除此之外,視覺化模型的決策結果和可解釋的分析報告,將有助於反洗錢專家還原犯罪場景,幫助業務人員理解決策依據。

  • 分類識別交易型別,輔助上游犯罪監測

眾所周知,洗錢與毒品犯罪、貪汙賄賂、恐怖活動、違法走私、金融詐騙等許多嚴重刑事犯罪具有天然的聯絡。人工智慧技術基於洗錢特徵,運用多分類模型,可實現智慧識別和分類洗錢交易型別。

結合圖計算挖掘演算法,對基於內外部資料構建的異質關聯關係圖譜進行碰撞分析,可進一步穿透日趨複雜的洗錢及犯罪活動和複雜的資金流動,不斷擴大監測覆蓋的範圍,精準勾勒金融交易鏈條,完整展示洗錢及其上游犯罪主體關聯關係,輔助重點可疑案件串併案偵查識別。

  • 圖譜關聯分析精準定位可疑洗錢分子

跟傳統的關係型資料庫相比,圖資料庫邏輯可以更好地解決絕大多數底層資料分析問題,特別是在面對海量關係資料時,圖資料的資料邏輯維度要遠高於關係型資料。

作為圖資料庫的應用場景,知識圖譜提供了從“關係”的角度去分析問題的能力,通過深度圖譜關聯分析,能夠進一步提高可疑交易甄別的準確性。

更重要的是,知識圖譜在穿透、關聯和傳導方面具有天然優勢,尤其適用於利用多重身份、關聯交易、跨行跨境轉賬等手段進行資金流轉的反洗錢手段識別和犯罪團伙追蹤。

首先,通過將客戶身份資料、行為資料、交易資料及其他外部資料通過知識圖譜的方式進行表徵,深度梳理和視覺化呈現了複雜的客戶關係特徵網路和資金交易流轉結構。

其次,結合聚類分析、關聯分析、碰撞分析等多種圖計算演算法,在無目標的情況下發現未知的洗錢分子和行為特徵,逐層計算可疑賬戶與已知犯罪賬戶間的關聯關係(比如號碼共用、同時出入某場所等等以往可能忽略的風險),深度挖掘相關的潛在洗錢關係分子或組織,可協助進行犯罪團伙角色定位(募資者、傳話人、執行者等),識別隱匿的可疑洗錢分子身份。

相關文章