【機器學習PAI實踐四】如何實現金融風控
(本文資料為虛構,僅供實驗)
一、背景
本文將針對阿里雲平臺上圖演算法模組來進行實驗。圖演算法一般被用來解決關係網狀的業務場景。與常規的結構化資料不同,圖演算法需要把資料整理成首尾相連的關係圖譜。圖演算法更多的是考慮邊和點的概念。阿里雲機器學習平臺上提供了豐富的圖演算法元件,包括K-Core、最大聯通子圖、標籤傳播聚類等。
本文的業務場景如下:
下圖是已知的一份人物通聯關係圖,每兩個人之間的連線表示兩人有一定關係,可以是同事關係或者親人關係等。已知“Enoch”是信用使用者,”Evan”是欺詐使用者,計算出其它人的信用指數。通過圖演算法,可以算出圖中每個人是欺詐使用者的概率,這個資料可以方便相關機構做風控。
二、資料集介紹
資料來源:本文資料為自己生成,用於實驗。
具體欄位如下:
欄位名 | 含義 | 型別 | 描述 |
---|---|---|---|
start_point | 邊的起始節點 | string | 人 |
end_point | 邊結束節點 | string | 人 |
count | 關係緊密度 | double | 數值越大,兩人的關係越緊密 |
資料截圖:
三、資料探索流程
首先,實驗流程圖:
1.最大聯通子圖
最大聯通子圖的功能很好理解,前面已經介紹了,圖演算法的輸入資料是關係圖譜結構的。最大聯通子圖可以找到有通聯關係的最大集合,在團伙發現的場景中可以排除掉一些與風控場景無關的人。本次實驗通過“最大聯通子圖”元件將資料中的群體分為兩部分,並賦予group_id。通過“SQL指令碼”元件和“JOIN”元件去除下圖中的無關聯人員。
2.單源最短路徑
通過“單源最短路徑”元件探查出每個人的一度人脈、二度人脈關係等。distance講的是“Enoch”通過幾個人可以聯絡到目標人。
如下圖:
3.標籤傳播分類
“標籤傳播分類”演算法為半監督的分類演算法,原理是用已標記節點的標籤資訊去預測未標記節點的標籤資訊。在演算法執行過程中,每個節點的標籤按相似度傳播給相鄰節點。
呼叫“標籤傳播分類”元件除了要有所有人員的通聯圖資料以外,還要有人員打標資料。這裡通過“已知資料-讀odps”元件匯入打標資料(weight表示目標是欺詐使用者的概率):
通過SQL對結果進行篩選,最終結果展現的是每個人涉嫌欺詐的概率,數值越大表示是欺詐使用者的概率越大。
四、其它
參與討論:雲棲社群公眾號
免費體驗:阿里雲數加機器學習平臺
相關文章
- 【機器學習PAI實踐六】金融貸款發放預測機器學習AI
- 【機器學習PAI實踐九】如何通過機器學習實現雲端實時心臟狀況監測機器學習AI
- 資料探勘實踐(金融風控)-第四次任務
- 【機器學習PAI實踐三】霧霾成因分析機器學習AI
- 【機器學習PAI實踐五】機器學習眼中的《人民的名義》機器學習AI
- 【機器學習PAI實踐二】人口普查統計機器學習AI
- 京東物流實時風控實踐
- 【機器學習PAI實踐七】文字分析演算法實現新聞自動分類機器學習AI演算法
- 資料探勘實踐(金融風控)-第五次任務
- 【機器學習PAI實踐十二】機器學習實現雙十一購物清單的自動商品標籤歸類機器學習AI
- 【機器學習PAI實踐一】搭建心臟病預測案例機器學習AI
- 【機器學習PAI實踐十】深度學習Caffe框架實現影象分類的模型訓練機器學習AI深度學習框架模型
- 機器學習PAI全新功效——實時新聞熱點OnlineLearning實踐機器學習AI
- 【機器學習PAI實踐十二】機器學習實現男女聲音識別分類(含語音特徵提取資料和程式碼)機器學習AI特徵
- 【機器學習PAI實踐八】用機器學習演算法評估學生考試成績機器學習AI演算法
- 機器學習PAI快速入門與業務實戰機器學習AI
- 如何實現實時機器學習? - huyenchip機器學習
- 後流量時代,如何實現最佳的電商風控運營?
- 錢大媽基於 Flink 的實時風控實踐
- 金融系統IT運維監控的探索與實踐運維
- 資料探勘實踐(金融風控):金融風控之貸款違約預測挑戰賽(上篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blendingboot模型
- 【機器學習PAI實踐十二】機器學習演算法基於信用卡消費記錄做信用評分機器學習AI演算法
- 包銀消費CTO湯向軍:消費金融大資料風控架構與實踐大資料架構
- 機器學習實踐指南機器學習
- 關聯圖譜在轉轉風控的實踐
- 【機器學習PAI實踐十一】機器學習PAI為你自動寫歌詞,媽媽再也不用擔心我的freestyle了(提供資料、程式碼機器學習AI
- 【機器學習PAI實戰】—— 玩轉人工智慧之綜述機器學習AI人工智慧
- 大資料徵信如何提升金融機構風控能力大資料
- 快速玩轉 Mixtral 8x7B MOE大模型!阿里雲機器學習 PAI 推出實踐大模型阿里機器學習AI
- ML-機器學習實踐機器學習
- 信用算力實現金融級資料服務的實踐
- 【機器學習PAI實戰】—— 玩轉人工智慧之美食推薦機器學習AI人工智慧
- 實驗四 CTF實踐
- 機器學習總結 (機器學習實踐筆記)機器學習筆記
- 機器學習(四):通俗理解支援向量機SVM及程式碼實踐機器學習
- 機器學習PAI快速入門機器學習AI
- 零基礎入門金融風控之貸款違約預測挑戰賽——簡單實現
- 評書:《美團機器學習實踐》機器學習