談談信貸的風險標籤

率士之濱發表於2020-10-17

    關注 “番茄風控大資料”,獲取更多資料分析與風控大資料的實用乾貨

 

在網際網路逐步步入大資料時代後,不可避免的給企業和使用者行為帶來一系列改變與重塑;其中最大的變化莫過於,使用者的一切行為在企業面前是“視覺化”的。隨著大資料技術的深入研究與應用,企業的專注點日益聚焦於怎樣利用大資料來為精細化運營及精準營銷服務,進而深入挖掘潛在的商業價值。於是,使用者畫像的概念也就應運而生。

 

在推薦系統中,做好了標籤可以實現精準化營銷和推送;在信貸行業,有了標籤體系不僅可以幫我們實現客戶分群,實現風險把控。業內,我們除了模型也一直在想方設法構建客群的標籤體系,今天我們就來聊一下與風險相關的標籤情況。

 

 

一.系統功能架構

 

首先一個完整的標籤體系,使用者畫像及應用專案包括底層資料來源採集和儲存、畫像標籤模型構建、資料模型應用三個層級,系統功能架構如下:

 

 

 

二.模型架構

 

畫像標籤模型分析主要分原始資料統計分析、統計標籤建模分析、模型標籤預測分析三塊,具體如下:

 

 

 

 

三.使用者畫像模型

 

使用者畫像模型是結合使用者基本屬性分析,對網際網路行為特徵進行描述,包括使用者登入、搜尋、關注、消費等各方面資料,在信貸風控的全流程中,我們就會除了會判斷客戶的檔案資訊也更會參考他的徵信情況、還款行為、催收資料,以標籤方式展示每個使用者的個性化特徵,畫像是系統分析結果的總結,是系統資料探勘的起始。目前在畫像中所用到的一些分析方法如下:

 

  • 聚類分析

聚類分析將看似無序的物件進行分組、歸類,以達到更好地理解研究物件的目的.聚類結果要求組內物件相似性較高,組間物件相似性較低.在使用者研究中,很多問題可以藉助聚類分析來解決,比如使用者活躍度行為聚類、使用者消費情況聚類等.

  • 分類演算法

分類是按照某種標準給使用者貼標籤,再根據標籤來區分歸類,分類是事先定義好類別,類別數不變.根據使用者群的文化觀念,訂單消費、行為習慣等不同細分新的類別,企業根據使用者的不同制定品牌推廣戰略和營銷策略,將資源針對目標使用者集中使用.

  • 時間序列分析

時間序列分析是一種動態的資料統計方法.該方法基於隨機過程理論和數理統計學方法,研究隨機資料序列所遵從的統計規律,以用於解決實際問題.比如使用者的週期性行為分析、因子迴歸分析建模等.

  • RFM模型

RFM模型較為動態地顯示一個使用者的全部輪廓,R表示使用者購買的時間有多遠,F表示使用者在時間內購買的次數,M表示使用者在時間內購買的金額,加權得到RFM得分.

  • 推薦系統演算法

利用使用者的一些行為,通過一些演算法(協同過濾、LFM、打分模型、關聯分析等),推測出使用者可能喜歡的東西.推薦講究準確性,提高使用者-內容(訂單、知識等)等組合的匹配度,提升服務質量.

  • 關聯分析

關聯分析就是在關係資料或其他資訊載體中,查詢存在於專案集合或物件集合之間的頻繁模式、關聯、相關性或因果結構,挖掘潛在的行為和消費關聯特徵.

 

 

四.貸款屬性標籤

 

因為篇幅有限,今天就稍微列出跟風險標籤稍微相關的貸款情況的標籤內容,另外還有更詳細的檔案情況跟貸後表現資料標籤,請參考知識星球上的內容:

 

我們的課程已經上架了配套的視訊教程並且關於之前文章裡提到的程式碼和資料,如果有興趣學習的同學,也可以加一下官微瞭解下。謝謝!

報名星球請新增小番微信,備註下行業+風控從業模組,謝謝您!

 

番茄學院管理員:小番
備註請填寫行業崗位,謝謝啦!

 

還有關於標籤的相關的圖表、熱力圖、詞雲就不做過多展示:

 

 

我們的課程已經上架了配套的視訊教程並且關於之前文章裡提到的程式碼和資料,如果有興趣學習的同學,也可以加一下官微瞭解下。謝謝!

報名星球請新增小番微信,備註下行業+風控從業模組,謝謝您!

番茄學院管理員:小番
備註請填寫行業崗位,謝謝啦!

相關文章