【機器學習PAI實踐四】如何實現金融風控

李博Garvin發表於2017-04-18

（本文資料為虛構，僅供實驗）

一、背景

本文將針對阿里雲平臺上圖演算法模組來進行實驗。圖演算法一般被用來解決關係網狀的業務場景。與常規的結構化資料不同，圖演算法需要把資料整理成首尾相連的關係圖譜。圖演算法更多的是考慮邊和點的概念。阿里雲機器學習平臺上提供了豐富的圖演算法元件，包括K-Core、最大聯通子圖、標籤傳播聚類等。
本文的業務場景如下：
下圖是已知的一份人物通聯關係圖，每兩個人之間的連線表示兩人有一定關係，可以是同事關係或者親人關係等。已知“Enoch”是信用使用者，”Evan”是欺詐使用者，計算出其它人的信用指數。通過圖演算法，可以算出圖中每個人是欺詐使用者的概率，這個資料可以方便相關機構做風控。

二、資料集介紹

資料來源：本文資料為自己生成，用於實驗。
具體欄位如下：

欄位名	含義	型別	描述
start_point	邊的起始節點	string	人
end_point	邊結束節點	string	人
count	關係緊密度	double	數值越大，兩人的關係越緊密

資料截圖：

三、資料探索流程

首先，實驗流程圖：

1.最大聯通子圖

最大聯通子圖的功能很好理解，前面已經介紹了，圖演算法的輸入資料是關係圖譜結構的。最大聯通子圖可以找到有通聯關係的最大集合，在團伙發現的場景中可以排除掉一些與風控場景無關的人。本次實驗通過“最大聯通子圖”元件將資料中的群體分為兩部分，並賦予group_id。通過“SQL指令碼”元件和“JOIN”元件去除下圖中的無關聯人員。

2.單源最短路徑

通過“單源最短路徑”元件探查出每個人的一度人脈、二度人脈關係等。distance講的是“Enoch”通過幾個人可以聯絡到目標人。
如下圖：

3.標籤傳播分類

“標籤傳播分類”演算法為半監督的分類演算法，原理是用已標記節點的標籤資訊去預測未標記節點的標籤資訊。在演算法執行過程中，每個節點的標籤按相似度傳播給相鄰節點。
呼叫“標籤傳播分類”元件除了要有所有人員的通聯圖資料以外，還要有人員打標資料。這裡通過“已知資料-讀odps”元件匯入打標資料(weight表示目標是欺詐使用者的概率)：

通過SQL對結果進行篩選，最終結果展現的是每個人涉嫌欺詐的概率，數值越大表示是欺詐使用者的概率越大。

四、其它

參與討論：雲棲社群公眾號

免費體驗：阿里雲數加機器學習平臺

機器學習PAI全新功效——實時新聞熱點OnlineLearning實踐
2019-01-22
機器學習AI
資料探勘實踐（金融風控）-第四次任務
2020-09-24
如何實現實時機器學習？ - huyenchip
2022-01-14
機器學習
機器學習PAI快速入門與業務實戰
2018-09-17
機器學習AI
ML-機器學習實踐
2019-03-05
機器學習
機器學習PAI快速入門
2019-07-05
機器學習AI
【機器學習PAI實戰】—— 玩轉人工智慧之綜述
2019-03-21
機器學習AI人工智慧
機器學習(四)：通俗理解支援向量機SVM及程式碼實踐
2021-02-15
機器學習
《Python機器學習實踐》簡介
2022-09-02
Python機器學習
【機器學習PAI實戰】—— 玩轉人工智慧之美食推薦
2019-03-26
機器學習AI人工智慧
快速玩轉 Mixtral 8x7B MOE大模型！阿里雲機器學習 PAI 推出實踐
2024-01-23
大模型阿里機器學習AI
機器學習實踐：如何將Spark與Python結合？
2018-06-21
機器學習SparkPython
資料探勘實踐（金融風控）-第五次任務
2020-09-27
京東物流實時風控實踐
2023-03-01
評書：《美團機器學習實踐》
2018-12-08
機器學習
基於 KubeVela 的機器學習實踐
2022-04-07
機器學習
機器學習(一)：5分鐘理解機器學習並上手實踐
2021-01-16
機器學習
whylogs工具庫的工業實踐！機器學習模型流程與效果監控 ⛵
2022-11-28
機器學習模型
機器學習落地遊戲實踐簡析
2021-02-18
機器學習遊戲
飛漿(paddle)實現機器學習
2023-03-13
機器學習
用機器學習實現情感分析
2021-09-09
機器學習
阿里雲大資料認證——機器學習PAI實現精細化營銷-課堂筆記
2019-02-25
阿里大資料機器學習AI筆記
機器學習之支援向量機原理和sklearn實踐
2019-06-30
機器學習
《機器學習Python實現_10_02_整合學習_boosting_adaboost分類器實現》
2021-05-04
機器學習Python
觀遠AI實戰 | 機器學習系統的工程實踐
2019-01-16
AI機器學習
《美團機器學習實踐》—— 讀後總結
2018-11-06
機器學習
谷歌機器學習43條規則：機器學習工程的最佳實踐經驗
2018-05-22
谷歌機器學習
機器學習|決策樹-sklearn實現
2020-12-19
機器學習
如何通過 JavaScript 實現機器學習和神經學網路？
2018-06-20
JavaScript機器學習
決策樹在機器學習的理論學習與實踐
2018-03-29
機器學習
《機器學習Python實現_10_09_整合學習_bagging_stacking原理及實現》
2021-05-06
機器學習Python
《機器學習Python實現_10_06_整合學習_boosting_gbdt分類實現》
2021-05-05
機器學習Python
從Spark MLlib到美圖機器學習框架實踐
2018-10-19
Spark機器學習框架
機器學習之決策樹原理和sklearn實踐
2019-06-24
機器學習
網易雲音樂機器學習平臺實踐
2022-07-07
機器學習
資料探勘實踐（金融風控）：金融風控之貸款違約預測挑戰賽（上篇）[xgboots/lightgbm/Catboost等模型]--模型融合：stacking、blending
2023-05-17
boot模型
機器學習實踐篇第二篇-KNN演算法學習
2024-04-02
機器學習KNN演算法
機器學習實戰-SVM模型實現人臉識別
2022-06-17
機器學習模型
【機器學習】線性迴歸python實現
2019-01-17
機器學習Python