SynchroTrap : 一個月內檢測 200 萬欺詐帳戶

awesome_hao發表於2017-10-09

原文網址 : http://www.ituring.com.cn/article/497304

網際網路上氾濫著各種欺詐行為。特別是社交網路誕生以來，許多職業黑客和黑色產業鏈便通過欺詐行為謀生。一個常見的欺詐行為便是大量的同時虛假點贊行為，也就是會有大量的使用者在短期內大量地給同一個頁面點贊（Synchronized Attack）。針對這種特定的欺詐行為，學術界的研究者和工業界的工程師專門研究了一種叫做 SynchroTrap 的演算法。這種演算法被部署在 Facebook 和 Instagram 的系統中，在一個月的時間內檢測出了 200 萬欺詐帳戶和 1156 次大規模網路攻擊。

SynchroTrap 的演算法非常簡單, 最根本的原理就是利用 Jaccard 相似性挑選出在某一個時間視窗內行為特別相近的那些使用者。

下面我們來直觀的感受一下 Synchronized Attack 和正常使用者行為之間的差異：

enter image description here

上圖中 (a) 顯示的是 Synchronized Attack ，可以看到大量的使用者在很短的時間區間內幾乎同時產生了某種行為；而圖中 (b) 的使用者行為更多的是一種隨機的分佈。

為了更好的理解 Synchronized Attack 這種欺詐行為，我們先來看一下欺詐行為的經濟學約束條件：

1.通常由於計算資源和運營成本的原因。欺詐使用者通常在有限的時間內控制大量的使用者。 2.因為黑色經濟的原因，欺詐行為通常都是任務性質的，也就是有任務時間限制的。

為了更好的解決 Synchronized Attack 問題，我們首先定義“匹配”的概念。所謂匹配是指： enter image description here

其中 U 是使用者 id ，C 是使用者的行為集合，而 T 是行為集合產生的時間。

定義使用者與使用者之間的 Jaccard 相似度為： enter image description here

其中：

enter image description here

計算完使用者與使用者之間的相似性後，我們得到了一張以使用者為節點的圖。然後我們採用單連結凝聚層次聚類的方法對使用者進行聚類： enter image description here

SynchroTrap 的時間複雜度是 O(r*n^2)。

SynchroTrap 演算法的原理非常的簡單, 把檢測 Synchronized Attack 問題轉化成了聚類問題。聚類問題不可避免的需要涉及到點和點之間距離的計算，SynchroTrap 的作者用常用的相似性距離計算度量 Jaccard Distance 來表示點和點之間的距離。然後採用了凝聚層次聚類的方法進行了聚類。整個演算法的過程非常的簡潔流暢。 enter image description here

上圖顯示的是在 11 周的時間裡每週被檢測的使用者數。

原文：Uncovering Large Groups of Active Malicious Accounts in Online Social Networks 原文作者：Qiang Cao , Xiaowei Yang , Jieqi Yu , Christopher Palow

用深度學習進行欺詐檢測
2019-04-28
深度學習
經典圖模型欺詐檢測系統BotGraph
2019-04-28
模型OTG
機器學習專案實戰----信用卡欺詐檢測(一)
2019-07-18
機器學習
印度欺詐檢測初創企業TrustCheckr獲天使輪融資
2018-03-14
Rust
機器學習專案實戰----信用卡欺詐檢測(二)
2019-07-19
機器學習
英偉達GPU加速Cloudera資料平臺提升欺詐檢測能力
2021-08-06
GPUCloud
機器學習在實時性欺詐檢測中的應用案例
2018-06-04
機器學習
圖神經網路在欺詐檢測與蛋白質功能預測中的應用概述
2024-11-23
神經網路
Juniper Research：50%的廣告主使用實時檢測廣告欺詐的服務
2022-03-09
揭秘Stripe欺詐檢測系統背後的機器學習演算法 - quastor
2022-01-20
機器學習演算法AST
基於圖資料庫 NebulaGraph 實現的欺詐檢測方案及程式碼示例
2023-02-21
資料庫
趨勢科技員工將多達70000個客戶資料出售給欺詐者
2019-11-07
金融欺詐資料分析
2018-07-16
微軟：微軟帳戶使用洩露密碼達4400萬個
2019-12-09
微軟密碼
揭祕Stripe欺詐檢測系統背後的機器學習演算法 - quastor
2022-01-20
機器學習演算法AST
鮑勃大叔是一個從未交付過軟體的欺詐者？ - Nico
2021-11-13
Coinbase將在一個月內取消多簽名賬戶支援
2018-03-23
微軟研究發現其 4400 萬個帳戶使用已洩露的密碼
2019-12-08
微軟密碼
檔案上傳——客戶端檢測繞過(JavaScript檢測）(一）
2020-04-18
客戶端JavaScript
金融反欺詐-交易基礎介紹
2020-08-19
信貸風控全流程-反欺詐
2024-11-21
如何應對與化解欺詐攻擊？
2023-02-08
鴻蒙高質量程式碼靜態檢測200條一
2024-11-12
鴻蒙
機器學習案例實戰之信用卡欺詐檢測【人工智慧工程師--AI轉型必修課】
2020-04-04
機器學習人工智慧工程師AI
DNA 檢測公司 MyHeritage 遭黑客入侵：9200 萬賬戶洩露
2018-06-07
黑客
CHEQ：2019廣告流量欺詐成本報告
2019-08-06
Stripe如何解決信用卡欺詐？ - Patrick
2022-12-01
Experian：2021年全球身份和欺詐報告
2021-07-02
DAIC：針對BEC欺詐的開源利器
2021-03-08
AI
擁有帳戶檔案
2021-05-21
金融風控反欺詐之圖演算法
2019-05-09
演算法
INTERPOL：全球金融欺詐趨勢評估報告
2024-06-08
如何及早發現和緩解採購欺詐?
2022-07-13
程式碼回現 | 如何實現交易反欺詐？
2021-04-14
如何實現一個手帳 App
2019-08-25
APP
GitHub 安全警告已檢測出 400 多萬個漏洞
2018-03-30
Github
一款200萬月活的SLG，改變了阿里互娛什麼？
2021-09-27
阿里
騰訊安全聯合釋出《2020中國移動廣告反欺詐白皮書》，深度揭秘三大反欺詐主流模式
2020-12-29
模式
《死亡細胞》移動版國內銷量突破200萬
2021-07-14

SynchroTrap : 一個月內檢測 200 萬欺詐帳戶

相關文章