網際網路金融發展的關鍵是風險控制,“風險控制”已然成為諸多網際網路金融企業能否長大的魔咒,這個不爭的事實像一座大山擺在眾多網際網路金融大佬與創業者的面前。為什麼阿里金融能夠將它的網路小貸不良率控制在不到1%,有膽量再貸多點嗎?大資料探勘技術和網際網路金融的風險控制到底是什麼關係?網際網路金融將怎樣建立有效的風險控制生態體系?本文將帶你揭開大資料探勘與網際網路金融風險控制的神祕面紗。
最近網際網路金融圈不僅自己玩的很開心,而且還拉上了金融界甚至央行的大佬們一起玩的很開心。儘管讓網際網路金融企業頭痛的問題——央行徵信系統不對市場開放,仍然沒有解決,但至少央行的態度明朗,支援網際網路金融的發展,並認為網際網路金融是傳統金融的有益補充。
生命的神奇之處在於它總能找到一個出口。作為新生事物的網際網路金融也不例外,在那扇門朝他們關閉的同時,他們卻找到了另外一扇窗。在亦步亦趨的探索中,他們中的大企業通過自身力量,小企業通過聯合的力量找到了適合自身發展的風險控制生態系統,正朝著良性和有序的方向發展,正如凱文凱利在他的《失控》中描述的群氓智慧那隻無形的手。
網際網路金融掌握了可以顛覆傳統金融的風控技術
在不依賴央行徵信系統的情況下,市場自發形成了各具特色的風險控制生態系統。大公司通過大資料探勘,自建信用評級系統;小公司通過資訊分享,藉助第三方獲得信用評級諮詢服務。
網際網路金融企業的風控大致分為兩種模式,一種是類似於阿里的風控模式,他們通過自身系統大量的電商交易以及支付資訊資料建立了封閉系統的信用評級和風控模型。另外一種則是眾多中小網際網路金融公司通過貢獻資料給一箇中間徵信機構,再分享徵信資訊。
央行的徵信系統是通過商業銀行、其它社會機構上報的資料,結合身份認證中心的身份稽核,提供給銀行系統信用查詢和提供給個人信用報告。但對於其它徵信機構和互聯金融公司目前不提供直接查詢服務。2006年1月開通執行的央行徵信系統,至2013年初,有大概8億人在其中有檔案。在這個8億人當中,只有不到3億人有過銀行或其他金融機構發生過借貸的記錄,其中存在大量沒有信貸記錄的個人。
而這些人卻有可能在央行徵信系統外的其它機構、網際網路金融公司自己的資料系統中,存有相應的信貸記錄。市場上一些線下小貸公司、網路信貸公司對於借貸人的信用評級資訊需求非常旺盛,也因此催生了若干市場化徵信公司,目前國內較大的具有代表性的市場化徵信公司有幾家:如北京安融惠眾、上海資信、深圳鵬元等等。
從P2P網貸公司和一些線下小貸公司採集動態大資料,為網際網路金融企業提供重複借貸查詢、不良使用者資訊查詢、信用等級查詢等多樣化服務是目前這些市場化的徵信公司正在推進的工作。而隨著加入這個遊戲規則的企業越來越多,這個由大量動態資料勾勒的信用圖譜也將越來越清晰。
網際網路海量大資料中與風控相關的資料
網際網路大資料海量且龐雜,充滿噪音,哪些大資料是網際網路金融企業風險控制官鍾愛的有價值的資料型別?下圖為大家揭示了網際網路海量大資料中與風控相關的資料,以及哪些企業或產品擁有這些資料。
(圖)風控相關大資料及代表企業或產品
利用電商大資料進行風控,阿里金融對於大資料的謀劃可謂非一日之功。在很多行業人士還在雲裡霧裡的時候,阿里已經建立了相對完善的大資料探勘系統。通過電商平臺阿里巴巴、淘寶、天貓、支付寶等積累的大量交易支付資料作為最基本的資料原料,再加上賣家自己提供的銷售資料、銀行流水、水電繳納甚至結婚證等情況作為輔助資料原料。所有資訊彙總後,將數值輸入網路行為評分模型,進行信用評級。
信用卡類網站的大資料同樣對網際網路金融的風險控制非常有價值。申請信用卡的年份、是否通過、授信額度、卡片種類;信用卡還款數額、對優惠資訊的關注等都可以作為信用評級的參考資料。國內最具代表性的企業是成立於2005年,最早開展網上代理申請信用卡業務的“我愛卡”。其創始人塗志雲和他的團隊又在2013年推出了信用風險管理平臺“信用寶”,利用“我愛卡”積累的資料和流量優勢,結合其早年的從事的FICO(費埃哲)風控模型,做網際網路金融小微貸款。
利用社交網站的大資料進行網路借貸的典型是美國的Lending Club。Lending club於2007年5月24日在facebook上開張,通過在上面鑲嵌的一款應用搭建借貸雙方平臺。利用社交網路關係資料和朋友之間的相互信任聚合人氣。借款人被分為若干信用等級,但是卻不必公佈自己的信用歷史。
在國內,2013年阿里巴巴以5.86億美元購入新浪微博18%的股份,其用意給人很多遐想空間,獲得社交大資料,阿里完善了大資料型別。加上淘寶的水電煤繳費資訊、信用卡還款資訊、支付和交易資訊,已然成為了資料全能選手。
小貸類網站積累的信貸大資料包括信貸額度、違約記錄等等。但單一企業缺陷在於資料的數量級別低和地域性太強。還有部分小貸網站平臺通過線下采集資料轉移到線上的方式來完善信用資料。這些特點決定了如果單兵作戰他們必定付出巨大成本。因此,貢獻資料,共享資料的模式正逐步被認可,抱團取暖勝過單打獨鬥。其中有資料統計的全國小貸平臺有幾百家,全國性比較知名的有人人貸、拍拍貸、紅嶺和信用寶等。
第三方支付類平臺未來的機遇在於,未來有可能基於使用者的消費資料做信用分析。支付的方向、每月支付的額度、購買產品品牌都可以作為信用評級的重要參考資料。代表產品為易寶、財付通等。
生活服務類網站的大資料如水、電、煤氣、有線電視、電話、網路費、物業費交納平臺則客觀真實地反映了個人的基本資訊,是信用評級中一類重要的資料型別。代表產品為平安的“一賬通”。
網際網路金融風控大資料加工過程
(圖)大資料加工過程圖解析
如上圖所示,在進行資料處理之前,對業務的理解、對資料的理解非常重要,這決定了要選取哪些資料原料進行資料探勘,在進入“資料工廠”之前的工作量通常要佔到整個過程的60%以上。
在資料原料方面,越來越多的網際網路線上動態大資料被新增進來。例如一個虛假的借款申請人資訊就可以通過分析網路行為痕跡被識別出來,一個真實的網際網路使用者總會在網路上留下蛛絲馬跡。對徵信有用的資料的時效性也非常關鍵,通常被徵信行業公認的有效的動態資料通常是從現在開始倒推24個月的資料。
通過獲得多渠道的大資料原料,利用數學運算和統計學的模型進行分析,從而評估出借款者的信用風險,典型的企業是美國的ZestFinance。這家企業的大部分員工是資料科學家,他們並不特別地依賴於信用擔保行業,用大資料分析進行風險控制是ZestFinance的核心技術。他們的原始資料來源非常廣泛。
他們的資料工廠的核心技術和機密是他們開發的10個基於學習機器的分析模型,對每位信貸申請人的超過1萬條原始資訊資料進行分析,並得出超過7萬個可對其行為做出測量的指標,而這一過程在5秒鐘內就能全部完成。
事實上,在美國,徵信公司或者大資料探勘公司的產品不僅用於提供給相關企業用於降低金融信貸行業的風險,同時也用於幫助做決策判斷和市場營銷,後兩者不在本文的探討範圍內,但是可以從另一個方面給我們很多啟發。