大資料風控很好,但過度的吹,就變成了黑

鐳射財經發表於2020-07-04

大資料風控很好,但過度的吹,就變成了黑

來源 | 雲上言 作者 | 劉波

1

凡事過猶不及,當整個市場都在談論大資料風控,都在吹捧機器學習時,危機已經悄然而至。

不僅是金融科技公司在談,網際網路巨頭在談,整個銀行圈也在談。

城商行、農商行覺得這是彎道超車的機會,國有大行害怕錯失新技術的視窗,金融科技公司對誰都在鼓吹。

尤其在疫情發生後,金融業的無接觸服務從之前的可選項一下子變成了必選項,出門不談點大資料,都不好意思見人。

疫情期間,我線上聽了不少金融科技公司專家的論壇發言,不少人有真才實學,讓我和自己的從業經驗交相印證,獲益良多。但更多人的觀點和方法論讓我越聽越心驚,而這些發言者中,很多已經是金融科技上市公司的高管,他們服務的銀行非常多,這讓我不禁深深的擔憂。

銀行部分業務朝線上化轉型當然是方向,科學的資料化決策當然是很好的路徑,但販賣焦慮,甚至神話大資料風控,大可不必。

我的職業生涯,在阿里參與了中國第一家網際網路小貸的建設,在螞蟻第一次籌建網際網路銀行並管理它的主要業務,到新網銀行第二次籌建網際網路銀行並分管所有資產業務、賬戶和存款理財,我的整個職業生涯都與網際網路、大資料、金融這幾個關鍵詞相伴。

我當然不排斥大資料風控,從我的從業經歷可以看出,我是它最早的嘗試者和推動者之一。

我一直在行業一線,細數一下,這些年從我直接管理部門發放的全線上小微貸款超過了1萬億元(不含聯合貸),消費信貸超過了4000億元(含聯合貸)。但今天,我發現自己已經聽不懂這個市場上的某些專家在說些什麼。

2

金融業務的風險決策,是一個數學問題,但絕不僅僅是一個數學問題。決策樹、樸素貝葉斯分類、支援向量機、邏輯迴歸、線性迴歸、隨機森林……這些演算法是工具,是方法,但不能也不應該是決策的全部。

我看到很多的風控團隊,有些甚至是國內一線公司的風控團隊,清一色數學、統計學高學歷技術專家,基本就是在電腦前研究演算法,研究資料。他們給出的每一個判斷,都有詳細的資料支撐,他們每一次調整,都貌似接近當下最優解。

你很難挑戰他們,因為他們掌握資料,你個人的經驗又怎麼能挑戰動輒幾百萬的資料樣本呢?

但很多人不瞭解,同樣的資料,解讀是具備多角度的。由於資料本身具備複雜關聯性,資料呈現的背後又有更多的原因,資料本身就會“騙人”。

看似對,有時候要比明顯的錯危害大得多。

科學的決策,不但需要適合的工具,還需要深刻了解你的業務場景,深刻了解你的客戶,演算法是為了決策服務,而不應該成為決策本身。

3

這麼說太抽象,舉一些例子吧。

主流銀行(我不喜歡用傳統銀行這個詞,主流銀行更為準確)信貸風險控制,最看重兩點:一是貸前審批控制違約機率(PD),二是貸後處置降低違約損失率(LGD)。

為了控制違約機率,必然要求客戶提供多項資料去證明有能力有意願歸還貸款,銀行流水、收入證明、社保公積金、房產證、車輛行駛證都是為了證明這件事——我不一定讓你抵押,但你需要證明你有哪些。

公務員、企事業單位、銀行從業人員、知名企業的員工更容易獲得貸款,無它,認為你收入穩定,違約成本高,違約機率低。

降低違約損失率的方法也很簡單,就是尋找優質抵押品,由於中國的房價在去年以前穩定的上漲了二十年,在過去二十年裡,房產抵押是最為吃香及穩妥的抵押物,其次就是汽車。這二十年裡,銀行做零售貸款很粗放但很有效,房屋按揭貸款幾乎是銀行零售貸款的全部。

我並不覺得複雜模型演算法比這些簡單直接的方法更高明,控制風險更有效。

簡單說,要是能方便的獲取到這些核心資訊,很多時候沒有必要獲取客戶各種行為資料,做複雜的風險相關性分析。

資料是有成本的,資料的獲取是需要客戶授權的。如果一個客戶幾十K核心資料就能決策,幹嘛非要分析上百兆的資料呢?

單戶上百兆資料,為了節省成本,還得研製複雜的資料路由規則,讓單戶資料成本可控。

這麼多資料標籤要進入模型,得考慮缺失度容忍問題,否則模型運轉不起來,運轉起來效果可能也不好,這就需要一套複雜演算法。

另外,還要考慮資料來源的可替代性,否則一旦某個關鍵資料來源出現問題,就是大癱瘓,這又是一整套複雜工程。

所以說,複雜並不代表先進,簡單並不代表不好,關鍵是匹配你的業務,匹配你能掌握的資源。

大資料風控很好,但過度的吹,就變成了黑。

4

談了主流銀行,也要談談我心目中比較適配的大資料風控是什麼樣的。真正好的大資料風控,應該是充分利用你所匹配的資源,有一條清晰的風控邏輯主線。

不來虛的,直接上乾貨。

花唄產品設計之初,它的風控充分利用阿里巴巴、螞蟻的海量交易資料,它的底層邏輯是馬斯洛需求理論:生理的需要,安全的需要,情感的需要,尊重的需要,自我實現的需要。

在這套理論下,你買同樣金額的柴米油鹽和你買魚竿、單反獲得的模型評價是不一樣的,而且監測的不是你的單次購買行為,而是你的消費習慣,這是花唄起步時風控的邏輯主線。

淘寶貸款的風控,表面上看是純信用貸款,但由於阿里巴巴強大的生態圈,可以從交易、資金、物流多方面監測商家。所以淘寶、天貓的商家不必提供任何資料,甚至不必查詢徵信,就可以直接評估信貸額度和利率。

淘寶貸款的授信,只看我給商家帶來了多少銷量和利潤,保證你的信貸額度小於違約成本就能保證貸款安全——我能幫你賺10萬元,給你8萬元貸款,你若不還,10萬元利潤就沒了,而且店都沒了,你到底還不是不還?

更何況,你的所有銷售額都在支付寶上,你的所有客戶都在淘寶、天貓上。

淘寶、天貓貸款風控邏輯的本質是店鋪質押貸款。

微粒貸最初的白名單客戶,來自於騰訊以及已識別優質企業員工的關係鏈,騰訊最強大的資料來源是可以清晰的透過關係鏈定義出你整個的人生軌跡和社交圈。

你上哪個小學,你上哪個中學,你上哪個大學,你在哪家企業工作,你在哪個圈層,可以透過你的同學、朋友、同事清晰的定位。正是因為此,微粒貸才可以在你未申請貸款前,就把你貸款的額度利率算好,直接呈現在你面前。

關係鏈,是微粒貸發展初期的風控邏輯主線。

新網銀行本身不掌握任何場景和資料,但它的平臺化戰略可以透過合作,梳理出清晰的風控邏輯主線。

做網貸存管,不是像其他銀行一樣為了存款,而是為了從源頭摸清非銀互金機構的多頭借貸資料,這些是珍貴的第一手也是獨家的資料來源。

和工行、銀聯、移動、以及眾多國民APP的網際網路巨頭合作,也不僅僅是為了獲客,更重要的是充分利用雙方優勢建模。

沒有什麼一蹴而就的妙招,需要的是戰略上的堅持和勤奮。

談了這麼多,舉了這麼多例子。無非向大家表達,資料是中性的,演算法本身只是工具,可以推崇但不要過分神化。你的風控體系如何設計,需要的不僅僅是大資料專家,更重要的是充分理解和分析機構本身所處市場,瞭解清楚你的優勢是什麼?你的潛在客戶在哪裡?

沒有絕對好的方法論,只有適合的。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69969060/viewspace-2702462/,如需轉載,請註明出處,否則將追究法律責任。

相關文章