打破AI黑盒，用機器學習+知識圖譜助金融機構反洗錢

渊亭科技發表於2020-03-06

原文網址 : http://www.jiqizhixin.com/articles/2020-03-05-5

AI機器學習

反洗錢，是指預防通過各種方式掩飾、隱瞞毒品犯罪、黑社會性質的組織犯罪、恐怖活動犯罪、走私犯罪、貪汙賄賂犯罪、破壞金融管理秩序犯罪等犯罪所得及其收益的來源和性質的洗錢活動的措施。

01 2020，仍是反洗錢監管大年

自2007年中國正式加入反洗錢金融行動特別工作組（FATF）以來，我國反洗錢和反恐怖融資的監管工作不斷加碼。央行、銀保監會、證監會陸續出臺檔案，涉及網際網路金融、銀行業、特定非金融機構等領域，因違反反洗錢規定被罰已成為資管機構罰單重災區。

處罰力度方面，央行對違規機構的罰沒金額逐年加大。在剛剛過去的2019年，央行披露的整年的反洗錢罰單達354張，金額達1.38億，超過2018同期資料，整體呈“量價齊飛”的特質。

2020年開年不久，監管針對“反洗錢”的相關處罰持續呈現出高壓態勢，央行不光頻頻開出千萬級鉅額罰單，還進行了“雙罰”，監管力度可見一斑。

與此同時，FATF第31屆第二次大會於2020年2月19日至21日期間在法國巴黎舉行。會上FATF公佈將於2020年6月審查各國關於FATF新監管指南的執行情況，包括虛擬資產經營者在反洗錢、禁止恐怖主義融資等方面是否有所進展等。

打破AI黑盒，用機器學習+知識圖譜助金融機構反洗錢

去年2月，FATF全會審議通過了中國第四輪反洗錢和反恐怖融資互評估，報告認為中國反洗錢和反恐怖融資體系具備良好基礎，同時存在一些問題需要改進。

內外高壓下，可以肯定的是，2020年反洗錢監管工作仍將持續向縱深發展，監管力度仍處於不斷收緊的態勢，資管機構亟需提升反洗錢能力。

02 資管機構反洗錢，難點在哪？

隨著金融交易平臺越來越多，移動轉賬和支付的普及，複雜的國際法以及數字貨幣的出現等，交易量快速增加，導致成倍增加的案件與有限人力資源反洗錢之間的矛盾凸顯。

海量資料使單一金融機構在監測洗錢資金流向、研判可疑交易、定位犯罪分子等方面存在困難，具體表現在：

傳統的風險監測方法導致了較高的誤報率和大量人力浪費

隨著金融業務模式的發展，基於規則策略、依靠人力甄別的傳統風險監測方法在準確性和處理效率方面能力不足，難以適應線上業務發展和海量交易資料處理要求，以至造成大量的人物力浪費。

以商業銀行為例，傳統洗錢風險監測方法多是採用：依據總行反洗錢事後系統（由反洗錢專家設定反洗錢模型和指標），由反洗錢甄別人員每天對海量交易進行規則過濾，對觸發模型的異常交易進行甄別的方式進行異常交易賬戶戶甄別。

甄別人員面臨海量交易資料，不僅工作量巨大，效率低下，影響了可疑案件上報流程的整體效率及案件稽核流程的規範性。還存在大量誤報漏報風險：

一方面，採用基於人工總結的規則模型進行異常交易監測會帶來較高的誤報率；

另一方面，面對比如具有小額高頻特點的交易行為，甄別人員很難從中準確識別可疑交易而導致漏報，最終導致機構的有效可疑交易報告上報率低。

基於歷史經驗的反洗錢規則系統無法識別多重身份或具有複雜交易路徑的洗錢行為

目前，反洗錢模型和指標依賴於專家對過去反洗錢工作經驗的總結。但近年來，通過複雜金融交易進行洗錢和資金轉移的趨勢愈加明顯。

狡猾的犯罪團體往往使用多重身份、大量賬號、低頻交易、變換交易路徑等複雜的方式混於正常交易之中，或通過跨行轉賬、證券投資、跨境支付、投資貿易、藝術品拍賣、賭博、數字貨幣等手段掩蓋洗錢交易行為。

以商業銀行為例，通過跨行交易切斷資金鍊，已成為洗錢及其上游犯罪資金轉移的慣用手法，單憑單點銀行系統提取的賬戶交易資訊，難以準確發現賬戶交易的可疑特徵。

再比如國際上，隨著跨境貿易頻繁發生，“貿易洗錢”已經成為重要的犯罪渠道，具有涉案金額大、影響範圍廣、隱蔽性強等特點。依賴既往經驗的反洗錢規則系統難以對以上洗錢交易行為進行有效甄別。

傳統的客戶身份識別方法無法進行多層次的賬戶關聯關係分析和可疑身份定位

從2019年監管部門反洗錢行政處罰情況來看，機構違規具體內容中，“未按照規定履行客戶身份識別義務”為違規型別之首。而事實是客戶身份識別一直是是反洗錢工作中的攻堅難點。

要準確識別客戶身份不僅要了解客戶的基礎身份資訊，而且需要了解客戶的行為特徵資訊，以及客戶與客戶間的交易關聯關係。

這就需要對客戶的多維資料彙總分析，對與客戶相關聯的自然人或者非自然人的身份，以及他們之間發生的交易行為進行核實、調查和確證。且因為客戶的社會關係總是複雜多變，因此持續識別也非常重要。

當前大部分反洗錢合規系統的基礎都是關係型資料庫，但關係型資料庫並不擅長處理關聯問題。無法對複雜的客戶關係網路和資金流轉網路進行構建，難以解決多層級的賬戶關聯關係挖掘以及逐層計算分析等，而這些對於分析資金流動痕跡和評估賬戶洗錢風險至關重要。

03 用前沿科技手段，提升反洗錢能力

顯然，在面對海量複雜的資料時，人類的處理和決策遠落後於機器。藉助知識圖譜、機器學習等人工智慧等科技力量，可幫助資管機構提升合規水平與資料探索綜合能力。

認知智慧服務廠商淵亭科技針對合規成本高、誤報率高、識別難度大、缺乏有效性和靈活性等行業痛點，設計推出“反洗錢智慧交易監測分析平臺”。綜合利用機器學習在特徵發現和規律學習的優勢以及知識圖譜在關聯挖掘和知識計算方面的優勢，基於海量資料驅動，融合反洗錢專家規則，形成可解釋的、可自主學習的、可主動預警的自動化智慧反洗錢應用。

致力於幫助資管機構實現客戶全生命週期動態畫像和風險分類、可疑交易事件穿透式監測、洗錢行為特徵知識沉澱、洗錢風險事前預測等一系列目標。

機器學習提升異常交易監測與上報效率

機器學習提升異常交易監測與上報效率機器學習是一種能夠直接從資料中“學習”資訊並建立規則的演算法，它模擬人類大腦學習，通過資料處理、特徵加工、模型訓練與驗證等工作程式完成模型的建立和優化迭代。

在反洗錢、反恐怖融資等合規領域，可以實現對人工風控分析、判斷行為等規律的自動學習。

在異常交易識別中，綜合運用有監督和無監督的方法，學習過去已有的洗錢可疑案宗，全方位提取與洗錢行為關聯的訊號，結合規則引擎和圖計算技術，建立綜合離群點檢測、時間序列預測、分類樹和迴歸樹等演算法的“智慧反洗錢模型”。

基於“智慧反洗錢模型”的異常交易識別引擎，甄別能力可以達到資深反洗錢專家95%的水平，可節省90%的人工核查成本，提升上報的及時性、規範性和有效性。

除此之外，由於機器學習模型成果在實際應用中具備持續學習的能力，因此隨著訓練次數的增加，機器的工作效率和對異常交易的判斷準確性將逐漸提升，尤其滿足網際網路線上業務模式下的海量實時交易監測需求。

自研特徵計算引擎反哺反洗錢知識庫

人工智慧技術是一項可迭代的系統工程，當可用於訓練和學習的樣本資料增多時，演算法效能和模型精度可以得到相應提升。

目前，機器學習在反洗錢領域面臨著特徵量不夠多、不夠有效的問題，綜合使用人工智慧演算法可以發現新型洗錢特徵。

打破AI黑盒，用機器學習+知識圖譜助金融機構反洗錢

基於“圖計算、AI模型、規則模型”三大引擎，對有效洗錢訊號和噪音具備很好的區分能力，能夠自適應於不斷變化的環境，靈敏偵測洗錢特徵。

通過自動學習未知洗錢模式，平臺能夠不斷衍生、擴充和規則化定義洗錢特徵，形成洗錢特徵知識沉澱，反哺反洗錢知識庫。幫助資管機構迭代優化反洗錢規則體系，實現反洗錢監測閉環優化。

除此之外，視覺化模型的決策結果和可解釋的分析報告，將有助於反洗錢專家還原犯罪場景，幫助業務人員理解決策依據。

分類識別交易型別，輔助上游犯罪監測

眾所周知，洗錢與毒品犯罪、貪汙賄賂、恐怖活動、違法走私、金融詐騙等許多嚴重刑事犯罪具有天然的聯絡。人工智慧技術基於洗錢特徵，運用多分類模型，可實現智慧識別和分類洗錢交易型別。

結合圖計算挖掘演算法，對基於內外部資料構建的異質關聯關係圖譜進行碰撞分析，可進一步穿透日趨複雜的洗錢及犯罪活動和複雜的資金流動，不斷擴大監測覆蓋的範圍，精準勾勒金融交易鏈條，完整展示洗錢及其上游犯罪主體關聯關係，輔助重點可疑案件串併案偵查識別。

圖譜關聯分析精準定位可疑洗錢分子

跟傳統的關係型資料庫相比，圖資料庫的邏輯可以更好地解決絕大多數底層資料分析問題，特別是在面對海量關係資料時，圖資料的資料邏輯維度要遠高於關係型資料。

作為圖資料庫的應用場景，知識圖譜提供了從“關係”的角度去分析問題的能力，通過深度圖譜關聯分析，能夠進一步提高可疑交易甄別的準確性。

更重要的是，知識圖譜在穿透、關聯和傳導方面具有天然優勢，尤其適用於利用多重身份、關聯交易、跨行跨境轉賬等手段進行資金流轉的反洗錢手段識別和犯罪團伙追蹤。

首先，通過將客戶身份資料、行為資料、交易資料及其他外部資料通過知識圖譜的方式進行表徵，深度梳理和視覺化呈現了複雜的客戶關係特徵網路和資金交易流轉結構。

其次，結合聚類分析、關聯分析、碰撞分析等多種圖計算演算法，在無目標的情況下發現未知的洗錢分子和行為特徵，逐層計算可疑賬戶與已知犯罪賬戶間的關聯關係（比如號碼共用、同時出入某場所等等以往可能忽略的風險），深度挖掘相關的潛在洗錢關係分子或組織，可協助進行犯罪團伙角色定位（募資者、傳話人、執行者等），識別隱匿的可疑洗錢分子身份。

KGB知識圖譜幫助金融機構進行風險預判
2020-06-18
ISWC 2018概覽：知識圖譜與機器學習
2018-10-26
機器學習
知識圖譜學習記錄--知識圖譜概述
2020-12-19
知識圖譜學習
2019-03-21
【知識圖譜】知識圖譜資料構建的“硬骨頭”，阿里工程師如何拿下？深度學習在知識圖譜構建中的應用。
2018-03-23
阿里工程師深度學習
知識圖譜構建與應用推薦學習分享
2022-09-30
構建知識圖譜-初學
2020-05-18
圖解機器學* | 機器學*基礎知識
2022-03-09
圖解
知識圖譜|知識圖譜的典型應用
2022-10-18
安全知識圖譜|構建APT組織圖譜，打破資訊孤島效應
2021-11-29
APT
知識圖譜構建與應用
2022-09-20
機器學習知識積累
2018-07-22
機器學習
【知識圖譜】知識圖譜實體連結無監督學習框架
2018-04-18
框架
如何高效學習 Kubernetes 知識圖譜？
2021-09-15
機器學習學習筆記——基本知識
2024-04-15
機器學習筆記
機器學習基礎知識1
2020-10-24
機器學習
機器學習知識點整理（三）
2020-12-22
機器學習
實驗案例1構建簡單的金融知識圖譜
2024-05-22
知識圖譜Knowledge Graph構建與應用
2022-08-12
知識圖譜的器與用（一）：百萬級知識圖譜實時視覺化引擎
2020-03-26
視覺化
【知識圖譜】一個有效的知識圖譜是如何構建的？
2018-04-06
機器學習之必備知識篇
2019-03-17
機器學習
NLPIR技術運用知識圖譜技術應用於智慧金融
2019-12-31
谷歌大腦開發機器思維的“人類翻譯器”，打破AI“黑盒”新方式
2019-01-28
谷歌AI
網際網路,IT,大資料,機器學習,AI知識tag雲
2019-02-15
大資料機器學習AI
韓國金融監管機構釋出更嚴格的虛擬貨幣反洗錢準則
2018-06-29
知識圖譜01：知識圖譜的定義
2020-10-05
知識圖譜在網際網路金融行業的應用
2019-01-03
行業
機器學習數學知識積累總結
2019-02-15
機器學習
Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記1 — 機器學習基礎知識簡介
2018-11-20
機器學習筆記
【機器學習】--譜聚類從初始到應用
2018-04-06
機器學習聚類
【知識圖譜趙軍學習筆記】第二章知識表示
2020-11-24
筆記
機器學習數學知識積累之概率論
2018-06-25
機器學習
CMSE11475金融機器學習
2024-04-02
機器學習
機器學習在金融比賽中的應用
2019-02-16
機器學習
基於知識圖譜的知識泛化讓AI學會“舉一反三”
2020-12-08
AI
【機器學習】乾貨丨機器學習知識點；機器學習模型的“可解釋性”到底有多重要？
2018-03-14
機器學習模型
第四期知識與認知圖譜：神經機器翻譯也應該嵌入「知識」
2019-06-03

打破AI黑盒，用機器學習+知識圖譜助金融機構反洗錢

相關文章