基於Hadoop的例項:P2P借款人信用風險實時監控模型設

adnb34g發表於2018-09-29

一提到 hadoop相信熟悉IT領域或者經常關注網際網路新聞的朋友都應該很熟悉了,當然,這種熟悉可能也只是聽著名字耳熟,但並不知道它具體是什麼東西,或者用來做什麼。這些都不重要,重要的是你知道有hadoop這麼個東西就可以了。

前段時間碼了一些 hadoop方面的分享文章,純屬個人的一點小經驗,可能有的地方寫的不好,將就下吧!今天要分享的這篇是轉載的一篇大快搜尋公眾號上的文章,是關於時下比較熱鬧的P2P金融方面對hadoop應用的一個架構設計。

以下為原文:

P2P網路貸款(“peer-to-peer”)為中小企業和個人提供了便利的融資渠道。近年來,隨著網際網路金融的逐步發展,P2P網貸已成為時下炙手可熱的網際網路金融新模式。憑藉著“高收益”的理財優勢,各類P2P網貸平臺呈現逐年增長的態勢。目前,我國正常執行P2P平臺數量已達近3000家,累計成交量約8000億元。

然而,網貸業在爆發式增長的同時,也存在著重大風險。高利率龐氏騙局、投放假標的、平臺自融、洗錢、資金挪用、虛報理財業績、跑路等形形色色的平臺問題不斷髮生。大平臺逾期還款,小平臺跑路的新聞屢見不鮮,給投資人造成巨大損失,造成信任危機。使投資者損失慘重。目前 P2P網貸面臨的最大風險是信用風險,信用風險已經成為P2P網貸行業發展的主要瓶頸,而借款人信用評估則是降低信用風險、提高企業風險管理水平的決定性因素。

國內外關於 P2P網貸借款人信用評估方面的相關研究主要是從評估指標和評估方法兩個方面進行探討的。由於國外具有比較完備的資料共享徵信系統,所以國外對於借款人信用評估的研究不僅包括平臺本身的借款人資訊,還包括政府信用系統、社交網路、購物行為等其他平臺共享資訊;而國內關於P2P網貸的研究大都只是介紹了目前主要P2P網貸平臺的運營模式,或者僅針對特定平臺進行風險研究,評估指標的採用沒有一個統一的標準。 

因此,雖然目前應用於借款人信用風險評估的指標多達幾十種,但是除了少數針對借款人個人資訊的指標相同外,不同 P2P網貸平臺採用的其他指標都不盡相同,在研究信用風險問題時,由於採用的指標不同,給出的結論也不盡相同,很難給出指標與風險之間明確的作用關係,而關於對借款人進行信用風險評估,需要哪些基本指標作為評估標準,才能說明評估的全面性、通用性、可信性的研究鮮有報導。

另一方面,隨著資料量和資料種類的不斷增加, P2P網貸平臺的資料量已達到了PB、EB甚至 EB級別,而隨著銀行信用系統、其他共享系統等平臺資料的不斷接入,應用大資料技術進行平臺資料管理和分析已是必然。目前絕大多數借款人信用風險評估研究都是基於靜態分析給出的結果,然而資料是變化的,風險在變化中產生,從動態角度,對借款人信用風險進行實時分析、跟蹤監測更具實際意義。

基於上述原因,本研究應用大資料技術,建立借款人信用風險實時監測模型和風控方案,為 P2P網貸平臺借款人信用風險評估提供大資料架構參考。

研究內容的整體框架如圖 1所示:

1 研究整體框架

 

大資料實時監測模型架構如圖 2 所示:

2 大資料實時監測模型框架

 

研究技術路線如圖 3 所示:

3 研究技術路線

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2215230/,如需轉載,請註明出處,否則將追究法律責任。

相關文章