摘要:在網際網路技術和資訊科技的推動下,大資料在金融行業的風控中獲得了引人注目的進展,但是在實際運用中其有效性還需進一步提高。當前大資料風控有效性不足既有資料質量的障礙,也有大資料風控的理論性障礙,還有資料保護的制度障礙。消除這些障礙、提高大資料風控的有效性,需要金融企業、金融研究部門和政府監管部門的共同努力。

關鍵詞:網際網路金融;大資料;風險控制

大資料已經撼動了世界的方方面面,從商業科技到醫療、政府、教育、經濟、人文以及社會其他各個領域。早在1980年,阿爾文∙托夫勒(Alvin Toffler,1980)在《第三次浪潮》一書中就預言大資料將成“第三次浪潮”。奧巴馬政府將大資料定義為“未來的新石油”。凱文∙凱利(Kevin Kelly,2014)認為所有的生意都是資料生意。2013年網際網路金融將“大資料”推向了新的高度。金融的核心是風險控制,將風控與大資料結合、不斷完善和優化風控制度和體系,對於網際網路金融企業和傳統金融企業而言都同等重要。

Economical stock market chart and graph
一.大資料風控發展迅速,但有效性不佳

在應用層面,金融行業利用大資料進行風控已經取得了一定的成效。使用大資料進行風控已成為美國等已開發國家網際網路金融企業的標準配置。

美國Zest Finance公司開發的10個基於學習機器的分析模型,對每位信貸申請人的超過1萬條原始資訊資料進行分析,並得出超過7萬個可對其行為做出測量的指標,而這一過程在5秒鐘內就能全部完成。

為網上商家提供金融信貸服務的公司Kabbage主要目標客戶是ebay、Amazon、PayPal等電商,其通過獲取這些企業網店店主的銷售、信用記錄、顧客流量、評論、商品價格和存貨等資訊,以及他們在Facebook和Twitter上與客戶的互動資訊,藉助資料探勘技術,把這些店主分成不同的風險等級,以此來確定提供貸款金額數量與貸款利率水平。

中國網際網路金融企業對於大資料風控的運用也如火如荼。

阿里推出了面向社會的信用服務體系芝麻信用,芝麻信用通過分析大量的網路交易及行為資料,對使用者進行信用評估,這些信用評估可以幫助網際網路金融企業對使用者的還款意願及還款能力做出結論,繼而為使用者提供相關的金融和經濟服務。

騰訊的微眾銀行推出的“微粒貸”產品,其風控核心就是,通過社交大資料與央行徵信等傳統銀行信用資料結合,運用社交圈、行為特徵、交易、基本社會特徵、人行徵信5個維度對客戶綜合評級,運用大量的指標構建多重模型,以快速識別客戶的信用風險。

對於大資料風控的理論研究尚處於萌芽階段,本文以“大資料風控”為主題在CNKI資料庫進行搜尋,與此相關的文獻數量可以從側面反映大資料風控的理論研究現狀。

CNKI資料庫中以“大資料風控”為主題的文獻共46篇。在這些文獻中,以報導性的文章較多,重要報紙全文庫和特色期刊總共為33篇,佔比72%;而理論研究的文章較少,中國學術期刊總庫為12篇,佔比26%;尚沒有CSSCI2014—2015年的來源期刊(如圖1)。

1460217376-5948-3417eb9bbd90186ea9cb02

圖1 CNKI資料庫與大資料相關的文獻數量和分類

雖然大資料風控在實踐上已經有所進展,但是其有效性也受到一些挑戰。

例如,以大資料風控為基石的P2P平臺就頻頻暴露出各種各樣的問題來。對於P2P平臺來說,由於其純線上操作的特點,大資料風控的有效性是決定其經營狀況的重要因素,如果大資料風控有效性較差,則面臨的壞賬壓力較大,容易出現提現困難甚至跑路的問題。

網貸之家的資料顯示,2015年上半年新增問題平臺419家,是2014年同期的7.5倍,已超過2014年全年問題平臺數量。截至2015年10月底,全國問題平臺數累積已達1115家。

二.當前大資料風控有效性不足的原因分析

一些學者對於大資料風控的有效性問題進行了研究。

王強(2015)指出當前個人大資料徵信的問題,一是資料的真實性,二是資料收集的法律障礙,三是壞賬的不可預測性問題。

甚至有作者認為大資料風控是無效的,陳宇(2015)援引各種證據認為大資料風控是無效的。

總體而言,當前大資料風控有效性欠佳的原因主要有以下幾個方面:

(一)資料的質量問題

當前大資料風控的有效性欠佳,其首要原因就是資料的真實性不高,包括社交資料和交易資料兩個方面。

1.社交資料的真實性問題

美國lending club和facebook合作獲取社交資料,在中國宜信也曾大費周折的收集借款人的社交資料,最後兩者得出的結論都是社交資料根本就不能用。美國很多大資料徵信公司的資訊錯誤率高達50%,垃圾進、垃圾出。

2.交易資料的真實性問題。

當前許多電商平臺的刷單現象非常嚴重,這將導致交易資料的嚴重失真。隨著網購的火爆,有關電商平臺“刷單”的報導屢見報端。

電商“刷單”有兩種方式,一種是商家找所謂的消費者進行“刷單”。賣家買快遞單號,其收件人和寄件人與實際的買家、賣家不一致。

另一種是快遞公司發空包,但快遞公司並未完成配送,而幫助商家完成平臺上的物流資訊。

(二)大資料風控的理論有效性問題

從IT技術層面論證大資料風控的實踐性案例已經很多,但是在經濟金融的理論層面,大資料風控還面臨一些問題需要解決。

1.金融信用與社會信用的相關性不確定

目前大資料主要來源於網際網路,而人們在網路中的表現並不能完全反映其真實的一面。相同的人群在不同場合呈現的特徵是不一樣的,尤其是目前人們線上上、線下割裂的狀態,其行為方式往往會出現強烈的反差。

例如有些人不善交際,卻將自己做的美食展示在微博上,吸引大量關注,粉絲暴增。因此網路並不能確切地證明某人的社交圈子,也就是說網際網路的資料很難還原使用者現實中的資訊。

2.大資料對於“黑天鵝”事件的滯後性

在現實世界,總會出現不可預測的“黑天鵝”事件,一旦出現則有可能衝擊大資料風控模型的基本假設,進而影響大資料風控的有效性。大到美國的次貸危機,小到個人意外事件的發生,在某種程度上大資料風控是無法預測的,但這些事件的發生,對巨集觀經濟和微觀主體都會產生重大的影響。

例如,2008年美國次貸危機後產生了一種“策略性違約”行為——貸款主體本身有能力還款,但是其在房價遠低於貸款總額的時候,重新購買一套房子,並對之前的房貸斷供,貸款者可以此方法進行“套利”。

雖然此類違約者會因此有不良信用記錄,但是這對信用報告的影響有限,因為其他的債務按期償還。而大資料對這種突變事件的預測能力則非常有限。

(三)大資料收集和使用的制度問題

在資料收集和使用的過程中也面臨著合法使用的問題。如何高效、適度地開發和使用大資料,不僅僅是一個技術問題,也是一個社會問題,這些洩露的資料大量流入資料黑市,造成了使用者安全、企業安全甚至國家安全方面的連鎖反應。資料的收集和使用在很多時候都沒有徵得資料生產主體的同意,這導致了資料的濫用和隱私的洩露。

近年來,個人資料洩露事件頻頻發生,因個人資料洩露而造成損失的新聞屢見報端。獵豹移動安全實驗室釋出的《2015年上半年移動安全報告》顯示,截至2015年上半年,獵豹共監測到496起資料洩露事件,影響超過544萬人。2015年10月19日,烏雲網釋出訊息稱,網易的使用者資料庫疑似洩露。

1460217377-4641-3417eb9bbd90186ea9df03

圖2 2005-2014年國內外資料洩密情況

資料來源:上海漢均資訊科技有限公司《2005—2014年全球洩密事件分析報告》

資料安全問題也將越來越多的企業推向風口浪尖。

上海漢均資訊科技有限公司釋出的《2005—2014年全球洩密事件分析報告》顯示,10年間,全球洩密事件中,我國洩密事件數量佔比為58.5%,其中高頻發地域主要是東部沿海經濟較發達、產業格局以高技術含量為主的一二線城市(如圖2)。

Verizon釋出《2015年資料洩露調查報告》,報告覆蓋95個國家,其中有61個報告了問題,涉及79790個安全事件(Security Incident),超過2000個(2122個)確認資料洩露(Data Breach)。

三.提高大資料風控有效性的路徑

儘管大資料風控的有效運用尚處在諸多障礙,但這並不能成為大資料風控無效的理由。因為對於資料這個資源的挖掘尚處於初級階段,在消除障礙、解決問題中前行,是大資料風控發展的必然趨勢。有效掃除當前大資料風控的障礙需要各方面的共同努力,其中金融企業、金融研究部門和政府監管部門的角色尤為重要。

對於金融企業而言,要從基礎資料上保證客戶資料的多樣化、連續性和實時性,確保資料真實可靠。

對於金融研究者而言,可從經濟學、數學等多個角度綜合論證大資料風控的有效性,為大資料風控提供理論支援。

對於政府監管部門而言,需要從法律制度、會計制度等方面進行建設,構建資料合理運用的良好環境體系。

(一)對於金融企業而言,要構建多樣化、連續性和實時性的基礎資料

1.多維度的收集資料,互聯互通,打破資料的孤島

美國徵信系統的完善是因為美國政府對其擁有的大資料資源的開放程度日益透明化。

目前我國的大資料風控系統還沒有實現互通互聯,阿里、銀聯、平安、騰訊以及眾多的P2P公司,都是各自為政,P2P公司拿不到央行的資料,幾家大的網際網路平臺在相關大資料的分享上彼此也未互通有無。

因而,各金融企業要建立互聯互通機制,打破資料孤島,從而能多維度地收集資料,確保資料之間能夠相互驗證。

2.從供應鏈交易環節獲取資料

獲取真實資料最好的途徑就是要切入客戶的交易環節,尤其是穩定可持續的交易環節,即供應鏈。

一方面,經過了幾十年的發展,當前的供應鏈都有一套完整上下游進入和退出機制,資料的真實性對於核心企業而言至關重要,因而這些資料的質量非常優異。

另一方面,這些資料和資料維度對於供應鏈中的企業評價是可靠的,金融企業可以此為基礎,加上自身的風險控制經驗,構建一套全新的基於資料的信用評價機制。

3.積極佈局“物聯網+”

物聯網覆蓋了產品生產、交易和使用的環節,因而網際網路只是物聯網的一部分。在物聯網下,不僅要獲取交易環節的資料,更重要的是獲取生產環節和使用環節的資料。

因而,金融企業要積極佈局“物聯網+”,為獲取更為全面的資料打下基礎。例如,企業機器執行資料,可以收集客戶汽車駕駛資料,可穿戴裝置的身體狀況資料,等等。這些資料都是大資料風控不可或缺的部分。

(二)對於金融研究部門而言,可從經濟、金融等多個角度綜合論證大資料風控的有效性,為大資料風控提供理論支援

當前對於大資料風控模型的構建大多是從技術的角度探討的。但是,從經濟、金融角度進行的探討亟待加強,不同的經濟假設會使模型推導的結果產生截然不同的變化。因而,從經濟、金融等角度對大資料風控有效性的研究就顯得很有必要了。比如大資料風控如何順應經濟週期的變化,如何從統計上論證過去的資料對於未來行為判斷的準確性,如何解決道德風險所帶來的不確定性。例如,唐時達(2015)提出要把資料提升至與傳統抵質押品同等重要的高度,建立“資料質押”風控體系。

(三)對於政府監管部門而言,要推動和完善與資料相關的制度建

1.法律制度的建設,對資料的收集和使用予以法律上的保護

我國對於資料保護的制度性舉措散見於多部法律中,如憲法、刑法、侵權責任法等,多是以保護個人隱私、通訊祕密等形式出現,尚缺乏一部資料保護的專門性法律。這導致了資料的法律邊界不明,資料保護法律的操作性不強、資料保護執法機制滯後等問題,制約了資料收集和運用的發展。

對此,最理想的狀況是出臺一部《資訊保護法》。在完善個人資訊保護法律制度的道路上,應出臺《個人資訊保護法》,明確國家機關、商家和其他法人、自然人掌握個人資訊的邊界和使用的範圍[6-7]。齊愛民、盤佳(2015)認為要構建資料主權和資料權法律制度[8]。2014年最高人民法院頒佈的《關於審理侵害資訊網路傳播權民事糾紛案適用法律若干問題的規定》(以下簡稱《規定》)就是此領域的進展之一,《規定》首次明確了個人資訊保護的範圍。

2.會計制度建設,對資料資產予以明確的計量

隨著資料重要性的提升,資料列入企業資產負債表只是時間問題,資料將和土地、勞動力和資本一樣,成為一種生產要素(Viktor Mayer-Schönberger,2013)。越來越多的理論界和實務界的研究者都傾向於認為資料將成為個體的財產和資產。

2012年達沃斯世界經濟論壇釋出的《大資料,大影響》報告認為,資料已經成為一種新的經濟資產類別。

姜建清在2014達沃斯世界經濟論壇上發表觀點,其認為個體的資料其實就是個體財產的一部分,沒有經過本人同意不應該被濫用。

因此,需要建立相應的會計制度對於資料價值進行科學有效的評估。有學者對此進行了初步研究。例如,劉玉(2014)從會計的角度對資料的資產可行性進行了分析,探討了資料資產的計量方法,研究了大資料資產的折舊、披露等問題。

文丨巴曙鬆;侯暢(東北大學工商管理學院);唐時達(北京大學光華管理學院博士後流動站)

參考文獻:

[1]王強“.垃圾進垃圾出”:大資料徵信的難題[EB/OL].財新網,2015-04-23.

[2]陳宇.風吹江南之網際網路金融[M].上海:東方出版中心,2014,(6):234-240.

[3]樑宵.企業資料安全“烏雲”密佈:難以估量的“未來”危機[N].中國經營報,2015-11-01(6).

[4]本報記者朱劍紅.打破信用資訊“孤島”(政策解讀)[N].人民日報,2015-06-26(2).

[5]唐時達,李智華,李曉巨集.供應鏈金融新趨勢[J].中國金融,2015,(10):40-41.

[6]葉文輝.大資料徵信機構的運作模式及監管對策——以阿里巴巴芝麻信用為例[J].國際金融,2015,(8):18-22.

[7]本報見習記者韓天琪.個人資訊保護圈如何劃[N].中國科學報,2014-11-02(5).

[8]齊愛民,盤佳.資料權、資料主權的確立與大資料保護的基本原則[J].蘇州大學學報(哲學社會科學版),2015,(1):64-70.

[9]劉玉.淺論大資料資產的確認與計量[J].商業會計,2014,(18):3-4.

來源:《金融理論與實踐》 2016年02期(本文僅代表作者觀點)