這場評分卡模型直播解答了我對於信貸風險的大部分疑問

頂象技術發表於2022-08-12

8月4日下午15:00頂象第三期業務安全大講堂正式開講。本期業務安全大講堂由頂象研發總監管勝老師進行分享,針對信貸風控,管勝老師就評分卡模型做了深入淺出的講解,深刻剖析了評分卡模型的原理、如何構建評分卡模型以及評分卡模型如何評估、應用、跟蹤等問題,不僅讓大家對信用貸有了更深的理解,同時對評分卡模型的構建產生了極大關注度。

直播過程中,我們也收到了一系列關於評分卡模型的疑問,現將部分問答整理出來,供大家參考。感興趣的同學也可關注頂象公眾號或影片號回看直播重點。

圖片

Q1:評分卡模型為什麼要做篩選特徵,使用更多特徵不是更好嗎?

管勝:這個問題非常好,從演算法的推理來看,特徵越多模型的效果會越好,但是要注意,這個好可能僅僅發生在訓練集上,對於測試集可能就不好了,它跟特徵分箱是同一個道理,箱分得越細越多,過擬合的風險就越大,特徵越多同樣也會存在過擬合的風險,

除了過擬合的風險外,還有幾個壞處:

* 讓模型變得更復雜,解釋性變差。

* 引入特徵越多,模型上線的難度越大,線上上收集特徵可能不容易。

* 特徵可能會波動,特徵越多,整體模型的波動性也會更大,導致模型的穩定性下降。


Q2:PSI 對評分卡的穩定性監控很重要,你們是怎麼實現的?

管勝:模型的開發階段與應用監控階段是分開的,資料也是分開的,開發階段採用的是離線資料,應用階段是實時資料,而做PSI監控,需要對2個資料集採用一致的方式進行分箱,然後計算2個資料集的PSI,要實現這個PSI對比,工程的難度會很大,在我們的產品實現上讓演算法人員開發的模型,無感知就自動支援PSI監控,把開發與應用做了整合。

* 模型部署時,會自動將訓練集的資訊附帶在模型中;

* 模型在應用過程中,對應用樣本集按訓練集的方式進行分箱;

* 每個月,對比一次計算出PSI。


Q3:分箱合併的過程,卡方檢驗合併與WOE合併,哪一種效果更好?

管勝:這是2種完全不同的分箱合併的思路,不過他們的共同點都是:有監督的,利用標籤的資訊來判斷是否需要合併。

至於哪一種效果更好,其實並不能用公式來確定,需要根據實際的嘗試才能知道,從實際的經驗來看,兩種效果的差距並不大。不過,WOE合併相對卡方檢驗來說,在複雜程度與應用上都更加簡便。


Q4:評分卡的模型是怎麼在風控體系使用的?

管勝:評分卡模型分為A卡、B卡、C卡,在信貸風控中,這3種使用最為久遠與成熟。

A卡是貸前評分卡,也稱為反欺詐評分卡,作為準入門檻使用。

B卡是貸中評分卡,借貸期間或信用卡使用期間,管理使用者的風險與額度調整。

C卡是貸後評分卡,用於逾期催收借貸。


Q5:對機器學習、模型相關內容非常感興趣,想往這個方向轉,有推薦的書籍或者方法麼?

管勝:首先還是要有一定的數學與統計學基礎,對於傳統機器學習來說,更多的都是統計學的知識,建議先學習機率論與數理統計,另外還需要學習線性代數。然後在實踐中學習,安裝python 與sklearn,檢視演算法的內部實現程式碼,特別要深入理解模型的訓練與評估過程。對於深度學習,複雜的理論公式反而不多,建議多看引用量大的優秀Paper,學習更多的網路設計的原因與技巧。


Q6:我看您用的是自研的機器學習平臺,內建了哪些演算法呢?

管勝:已經封裝好的演算法元件有100+多個,涵蓋:資料讀寫、特徵工程、分類聚類迴歸演算法、文字類演算法、關聯網路類演算法、金融評分類演算法、時序資料類演算法、模型評估,另外還包括“人行徵信特徵衍生”元件,幾乎可以解決任意場景建模的演算法需求。


最後,再給大家簡單介紹下頂象《業務安全大講堂》系列直播課,本系列彙集業內大咖組建豪華講師天團,剖析各類欺詐手段,詳解前沿安全技術,幫助企業應對業務安全新風險。

圖片


下期將由頂象技術總監杜威為大家帶來《業務安全平臺核心模組解析——裝置指紋》的主題課程,敬請期待!


相關文章