大資料時代,怎樣才能獲得真正有價值的資訊

龐觀發表於2018-07-23

入夏以來,網際網路金融的天空是天雷滾滾。特別是7月份,10天100多家平臺出事,引起公眾高度關注。

從之前的野蠻生長,到後來嚴監管下的跑路潮,再到如今的兩極分化,網際網路金融發展格局正在經歷一個從超額利潤到價格戰再到健康發展的過程。與之對應,放貸機構之間的競爭也可以分為三個階段:第一階段拼的是資金成本;第二階段拼的是運營成本;第三階段拼的是風險成本。而拐點的關鍵,就是徵信基礎。

歡迎加群 499754614學習交流,備註澆水。

徵信 大資料 :90%是垃圾

如果把中國網際網路金融的發展列一個時間表,大致可以分為三個階段。

2006-2011年,可以看做是信貸資產拓荒期:件均放款3-5萬,目標人群是白領與企業主,主要通過線下獲客,現金放款。

2011-2013年,稱得上是信貸資產的爆發期:授信金額兩極化發展,人群擴充至學生、藍領,線上獲客變得越來越重要。

2013年之後,信貸資產開始場景化:阿里、京東、鏈家等場景巨頭加入。

與此對應,徵信需求和解決方案也發生了很大的變化。在信貸資產拓荒期,風控最關注的是負債率,對於固定目標客戶群體,根據銀行流水判斷收入,根據央行徵信判斷負債。徵信的主要工具就是零散QQ群,參與者都是基層從業者,效率低。

在信貸資產的爆發期,風控開始關注穩定性,關注借款用途,尤其是多重負債。徵信的主要工具是系統化中央資料庫,參與主體是P2P公司,效率有所提高。

從國內大資料徵信行業的發展現狀來看,組合式的信用評估是大勢所趨。眾所周知,國內徵信體系不完善,網際網路金融行業尚未接入央行徵信系統。在此背景下,業內平臺獲取原始資料通常有三種方式:內生資料、通過第三方購買和資料交換。

值得注意的是,儘管很多企業經常會吹噓自己擁有多少TB,甚至是PB的資料量,實際上它們擁有的90%是劣質資料。

有一位風險投資人這樣抱怨,“在資料的海洋中,大部分企業都沒有花時間去思考它們應該收集什麼資料,還有采用怎樣的方式來收集資料。而是習慣於一網打盡,結果它們收集到的是一堆沒有任何預先計劃和結構條理的垃圾。”

百行徵信一家獨大

從1980年代末至今,徵信行業先後經歷了起步、搭建徵信平臺、央行主導統籌等數個階段。

2015年1月5日,人民銀行印發《關於做好個人徵信業務準備工作的通知》,要求芝麻信用,騰訊徵信等八家機構做好個人徵信業務的準備工作,擇時發放第一批牌照,但一直不見下文。

最終等來的卻是由中國網際網路金融協會與芝麻信用、騰訊徵信等把家徵信機構聯手成立的百行徵信。這意味著徵信這個金融業最關鍵的閥門,最終還是要由政府來監督把控。

今年6月28日,百行徵信與蘇寧消費金融等15家網際網路金融機構和消費金融機構在深圳舉行了信用資訊共享合作簽約儀式。根據合作協議,這15家機構將成為百行徵信首批接入代表機構,向百行徵信系統全面、準確、及時地報送徵信資訊。百行徵信將對信用資訊進行採集、整理、儲存和加工,並向接入機構提供信用資訊的查詢及相關增值服務。

截止目前,百行徵信已與120餘家網際網路金融機構和消費金融機構達成了信用資訊合作共享協議,與50餘家機構達成了合作意向。

業內人士擔憂的是,徵信公司的核心競爭力在於擁有自己獨有的資訊。作為直接競爭對手,徵信公司之間不可能用自己的核心資料去提升競爭對手的競爭力。可以說,一方面徵信公司致力於解決資訊不對稱,另一方面徵信公司也在構建資料壁壘。這種資訊孤島,短期內無法完全消失。

“各家徵信公司都採取中央資料庫的方式,大家上傳資料,需要時再查詢。但並非所有人願意上傳資料,操作起來也比較麻煩。”

更現實的問題在於,資訊共享的邊界如何界定?在進行資料採集時,如何兼顧資料的質量及採集範圍,避免侵犯使用者隱私?共享資訊的標準有待明確。

小公司很難有機會

在一位互金領域的風險投資人看來,中國徵信市場結構是以公辦徵信機構為主,市場機構為輔,央行徵信中心壟斷大部分市場,留給市場機構的空間很小。

傳統徵信產業鏈由資料公司、徵信公司及徵信使用方三者構成。這其中,資料公司的核心競爭力在於對獨特資料來源的掌控和挖掘能力,而徵信公司的核心競爭力則在於資料來源完整度,資料覆蓋人群完整性以及資料的分析畫像能力。

網際網路對於徵信產業的改變,只是增加了資料公司的資料來源,或提升了獲取資料的效率,但這兩點對於徵信公司而言,無法重構徵信公司核心的資料清洗、挖掘及畫像的核心環節。對於徵信使用方而言,網際網路的出現,則有可能增加了自身直接採集資料能力及風控的能力,降低對前兩者的需求。

“中國大資料徵信和風控市場,市場化空間僅數百億,即使年均增長20%以上,也需要十幾年才達市場千億的規模。”

牌照徵信公司依託牌照賦予的融資能力及資料來源權利做大,但做大的空間取決於央行徵信中心的開放程度,而初創純資料徵信公司沒有做大的空間。

如果央行不將資料與牌照公司共享,後者將無法低成本獲得最核心的全銀行信貸資料,只能從央行購買,且無法在短時間內推出比央行徵信中心更有效的徵信產品,只能做輔助作用。

未來徵信行業將面臨資料同質化、產品同質化的問題,價格戰無法避免,網際網路免費的思路甚至還會降低行業整體產值。

沒有徵信牌照,徵信創業公司無法合法的去獲取核心資料,比如銀行信貸資料或者運營商,公安局的隱私資料;也無法以牌照去融資收購其他徵信公司,資金上毫無優勢。因而,業內人士認為,初創公司很難在徵信領域發展壯大,成為未來的寡頭之一。

徵信業界最經典的成功的例子就是美國的FICO,美國FICO評分主要應用了五個方面的外部的大資料:還款歷時、未償債務、信貸歷時長度、對新信貸的追求及其信貸組合。它對於這五個維度的外部的大資料進行建模,構建FICO評分,現在FICO評分覆蓋了美國99%的各種各樣的個人信貸的決策記錄。

在上述投資人看來,中國不會出現像FICO那樣獨立的風控模型公司,原因有幾點:首先,現今國內各大銀行使用的風控模型基本屬於一次性買斷或自建模型團隊,現行市場並沒有空間給獨立風控模型公司做大。其次,傳統FICO模型不能滿足在網際網路時代多緯度資料建模的需要。最後,細分領域風控模型的專業化,隨著信貸行業的細分化及專業化,通用模型已無法滿足風控需求。


相關文章