07

199IT資料中心微信賬戶:i199IT

作為對資料、技術、方法和制度的一種全面革新,大資料將對徵信資料的來源和形態、徵信加工處理方式、徵信評估技術、徵信產品的傳播分享渠道以及徵信制度基礎進行全面重構,從而對徵信市場產生深刻影響。當前,大資料已經滲透到社會各個領域,並引發廣泛深刻的社會變革。以資料處理為核心的徵信行業,不可避免地受到大資料浪潮的洗禮。本文在對大資料及大資料徵信的基本特徵進行比較研究的基礎上,分析了大資料對我國徵信市場的影響,並提出了相關政策建議。

關鍵詞: 徵信市場,大資料,金融監管

一、大資料及大資料徵信的基本特徵

(一)對大資料的基本認識

對於大資料的定義,不同的機構有不同的理解。全球管理諮詢公司麥肯錫認為:“大資料是指大小超出典型資料庫軟體工具收集、儲存、管理和分析能力的資料集”。研究機構Gartner則定義:“大資料是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產”。美國國家標準與技術研究院(NIST)的定義是:“大資料是用來描述在我們網路的、數字的、遍佈感測器的、資訊驅動的世界中呈現出的資料氾濫的常用詞語,它為解決以前不可能解決的問題帶來了可能性”。著雲臺分析師團隊認為,大資料是和雲端計算聯絡在一起的,因為大資料對大量非結構化資料、半結構化資料的分析,需要依託雲端計算的分散式處理、分散式資料庫和雲端儲存分配給數百甚至上千臺電腦同時運算。

而就大資料的特徵而言,研究機構和學者也有不同的側重。研究機構IDC將大資料的特徵概括為4V,即海量的資料規模(Volume)、快速的資料流轉和動態的資料體系(Velocity)、多樣的資料型別(Variety)以及巨大的資料價值(Value)。大資料專家維克托·邁爾-舍恩伯格則從應用角度出發,提出了大資料的三大特徵:

分析更多的資料,甚至是所有資料,而不再單純依賴於樣本分析;

適當忽略微觀層面上的精確度會讓人們在巨集觀層面擁有更好的洞察力;

建立在相關關係分析法基礎上的預測才是大資料的核心,只要發現兩個現象之間的顯著相關性,就可以創造巨大的經濟或社會效益。

綜合以上比較權威的定義和特徵描述,筆者認為大資料是當今時代資料、技術、方法和制度深刻變革的有機集合。其中資料是基礎,技術和方法是手段,制度是保證。

資料層面。大資料首先是一種多元多維資料的集合。這些資料既包括人類歷史上留存的原來無法量化而現在可以量化的存量資訊,更包括當今時代人類每時每刻產生的增量資料。既包括結構化資料,也包括大量的半結構化和非結構化資料。總量上的海量化、增長上的指數化、形式上的多樣化、價值上的巨大化是當代大資料的主要特徵。作為一種戰略資產,大資料將在現代競爭中日益發揮重要作用。

方法層面。現代資訊科技的發展,特別是網際網路技術的迅猛發展和網際網路去中心化、扁平化、自組織的特性,使得大資料的獲取、儲存、傳輸、處理、分析變得越來越便捷,大資料逐漸發展成為一門新學科,一種分析與解決問題、尤其是決策與預測問題的新方法、新手段。由於大大解除了獲得資料的範圍約束、成本約束,大資料從傳統資料處理注重因果分析走向更加註重相關分析,從傳統的注重抽樣調查變為全樣本調查,從傳統注重精確變為注重模糊,等等。這種分析方法和思維方式的全新變革,大大深化了人類對自然規律、社會規律和人類自身行為規律的認識。

制度層面。大資料之所以在今天出現,除了技術和方法革命的因素之外,其實還隱含了制度變革的含義。那就是在工業社會向資訊社會縱深轉型的歷史時期,資料逐漸成為與物質、能源同等重要的戰略資源,資料的公開、共享與服務成為時代發展的主題。如果沒有資料公開的制度,再強大的技術和再先進的方法也無法催生大資料時代的到來。

(二)大資料徵信的基本特徵

徵信理念擴充。傳統徵信試圖通過已知的因果邏輯關係分析歷史資料,從而預測資訊主體未來的行為。如,傳統徵信分析個人信用卡還款情況、判斷個人的信用狀況,作為是否對其開展信貸業務的重要參考,認為個人信用卡還款資料與資訊主體未來的信用行為存在比較密切的因果邏輯關係。大資料應用除揭示資訊主體的歷史資料和行為之間的因果邏輯關係外,還努力發現事物之間的相關性、關聯性,並對其加以廣泛利用。如,Facebook公司每天可以採集500TB(1TB=1024GB)以上的使用者社交行為資訊,包括使用者的評論和上傳的圖片、音樂、互動“點贊”等,這些資訊表面上看似乎與個人信用沒有關係,但深入歸納分析後,能夠非常逼真地“描繪”出使用者的行為和消費習慣,以及收入、工作和教育情況,從而為判定個人信用狀況提供了新視角。

資料來源更廣。傳統徵信技術僅能對結構化的資訊進行蒐集和加工。資訊主要來自金融機構、政府部門和掌握某類信用資訊的公共企業,資訊量少、來源範圍窄。而網際網路時代,大資料技術獲取資料的範圍更加廣泛。除傳統資料來源外,大資料可以蒐集的資訊包括:基於網際網路的各類交易資訊,如網路購物記錄;網路搜尋及社交行為,如QQ、微博、Facebook平臺上的社交資訊;專用裝置和感測器監測記錄,如個人行動軌跡;航班排程資訊;股票實時交易資料。這些資訊主要以文字、音訊、視訊和郵件等非結構化的資料形式存在,傳統徵信技術無法對這類資訊進行蒐集和加工,難以挖掘蘊含在其中的巨大價值。

資料形式更多。傳統徵信業務要求資料必須是結構化的,才能加以利用分析。如,傳統徵信技術要求,給定一系列資料指標,獲得這些指標儘可能多且準確的資料項,運用某個穩定的數學模型得出結論。而大資料的資料形式則不僅包括結構化資料,更包含以網際網路郵件、網頁、圖片、視訊等形式出現的半結構化和非結構化資料。傳統徵信技術不能加工利用這些半結構化、非結構化資料,而大資料應用技術可以以較低的成本採集、加工此類資料,甚至在特定的分析過程中可同時交叉處理這類不相容的資料形式。此外,傳統徵信要求資料儘可能準確,越準確的資料得出的結論越可靠;資料項不連續或缺失可能導致傳統徵信模型無法應用。而大資料模糊關聯技術超越了資料準確性的傳統約束,甚至可以對碎片化的資訊以及不完整的資料流進行加工和分析。

資料容量更大。大資料處理的資料規模是傳統徵信業務資料處理規模的幾何量級培增。傳統徵信業務處理的資料量一般以GB位元組計,而大資料處理的資料量一般以PB(1024TB)位元組計。中國人民銀行徵信中心的企業和個人徵信系統作為全球最大的徵信系統之一,收錄了400多萬企業和3億多人的信貸記錄,並每日更新,其收錄的資料量以TB位元組計。然而,其規模與大資料處理的資料規模相比,仍然有較大差距。美國金融業監管局(FNRA)建立的投資者交易記錄資料庫,可以每天抽取超過200億條事務記錄,並進行跨幾天、幾周和幾個月的趨勢分析,以發現可能預示著欺詐的異常交易行為。而Ebay建立的大資料分析平臺,每天處理的資料量就高達100PB,遠遠超出傳統徵信技術能夠處理的資料規模,這樣的資料規模是傳統徵信技術難以進行處理的。此外,網際網路時代,大資料的積累速度遠超傳統資料的積累速度。如,2013年“雙十一”單日,支付寶核心資料庫叢集就處理了41億個事務,執行了285億次SQL,生成15TB日誌。

徵信成本更低。一是降低了資料採整合本。基於網際網路的大資料應用技術,不僅降低了採集傳統徵信資料的成本,而且降低了採集新型非結構化資料的成本,使得加工這類資料成為可能。如抓取網頁資料,傳統徵信技術可能無法做到,或者成本極高,但大資料技術可以利用專門的軟體方便地批量抓取。如,Facebook通過Hive每半小時就能掃描105TB的網頁資料,而如果依靠人工獲取這類資訊,成本之高會使企業根本難以承受,且效率極低。二是降低了加工、分析資料的成本。傳統徵信技術主要依靠改善硬體效能以提高處理大規模資料的分析能力。而硬體裝置效能的提高所花費的成本也極高,往往使實力較弱的企業望而卻步。大資料時代分散式計算、雲端計算技術的發展改變了單純依靠提高硬體裝置計算效能以改善計算能力的方式,提高了裝置利用效率,大大降低了資料運算成本。同時,雲端計算、分散式計算也降低了硬體裝置的能耗。如,谷歌宣稱,由於採用了雲端計算技術,其計算成本僅為競爭對手的1/100,儲存成本僅為競爭對手的1/30(孫健、賈曉菁,2010)。三是提高了資訊處理的效率。以網際網路為基礎的資料蒐集能力的改進,不僅降低了傳統結構化資料的蒐集時間,也降低了非結構化資料的蒐集時間。如大資料技術可以快速地完成網頁資料抓取。大資料技術、尤其是雲端計算技術的發展也大大提高了資料加工和分析效率,使以前需要幾個月才能完成的資料處理現在只要幾個小時就能完成。如,信用卡公司VISA使用大資料處理技術,把以前需要一個月才能處理完成的730億單信用卡交易資訊的處理時間降低到13分鐘。Zestfinance公司利用大資料分析和機器學習技術,開發的模型可以同時處理7萬個指標以判斷借款人的信用狀況,模型運算的時間可以短至3秒,比傳統方法使違約率降低了40%。

二、大資料對徵信市場的影響分析

作為對資料、技術、方法和制度的一種全面革新,大資料將對徵信資料的來源和形態、徵信加工處理方式、徵信評估技術、徵信產品的傳播分享渠道以及徵信制度基礎進行全面重構,從而對徵信市場產生深刻影響。

(一)市場主體不斷增加,市場競爭趨於激烈:

大資料時代我國徵信市場將進入新的“藍海”,越來越多的機構將以自身的技術優勢進入徵信市場。可以預見,在大資料時代,我國徵信市場將迎來一個主體創新活躍、市場競爭加劇的“春秋戰國”時期。創新路徑無外乎以下三種:一是傳統徵信機構向大資料徵信延伸。大資料技術發展對傳統徵信機構提出了嚴峻的挑戰,也提供了變革的機遇。傳統徵信機構唯有主動迎接挑戰,積極抓住機遇,充分利用大資料應用技術,提升自身的產品創新能力和服務水平,才不至於在未來的競爭中被邊緣化。二是大資料公司、網際網路公司向徵信滲透。大資料技術的發展,使得與傳統徵信業務看似無關的網際網路公司介入了徵信領域,成就了徵信新業態。新興的網際網路公司在資料的蒐集、加工技術、徵信產品的供給、服務型別和形態等方面,能夠採用不同於以往傳統徵信機構的經營模式。其往往通過提供特色產品,專注於某個細分的徵信市場,從整體上擴大徵信市場。如,騰訊公司,通過分析其使用者使用QQ的行為,對使用者的身份進行識別驗證,準確率高達95%以上,為未來網上開立銀行或證券交易賬戶提供了重要的身份驗證參考。新興網際網路公司通過對非傳統徵信資料的挖掘,創新徵信服務和產品,產生了徵信市場新業態,進一步擴大了徵信市場的服務領域。三是傳統徵信機構和新興網際網路公司的融合。在大資料應用的思維和技術方面,網際網路公司有著傳統徵信機構無可比擬的優勢,而傳統徵信機構在徵信市場中的資源積累同樣是網際網路公司不能輕易取代的,只有二者相結合,才能更好地滿足市場對徵信服務的新要求,徵信市場的發展最終將自然推動兩類機構的融合,共同擴充徵信市場。

表1:傳統徵信和大資料徵信的比較 比較項 傳統徵信 大資料徵信

(二)徵信產品更加豐富,徵信服務不斷深化

大資料以革新的技術進行資料探勘,不僅對傳統資料的挖掘更加深入,而且發現了新的資料形式所包含的巨大價值,從而產生了更豐富的徵信產品。大資料通過對傳統資料的挖掘及非結構化的資料分析,生產風險預警、風險評估、信用業務決策等增值產品,形成對傳統徵信產品的重要補充。如,Equifax運用大資料技術加工、分析數億消費者雜亂無章的資訊,包括消費者雜誌訂閱情況、地址變更情況、購買零售商品情況、納稅申報單型別等,以預測消費者的支付能力和消費意向。同時,徵信產品供給的增加也激發了市場對徵信產品的需求。騰訊公司利用其公開的資料平臺,通過實時監測客戶網路社交行為,預測客戶的信用風險並預警,滿足了某些網際網路公司瞭解客戶的需求。大資料使徵信產品更加豐富,激發了市場供求,促進了徵信市場向新領域的擴充。

(三)信用意識不斷提高,徵信需求不斷擴大

(四)風險問題日益突出,市場監管面臨挑戰

在大資料時代,隨著更多敏感資訊的挖掘、徵信機構的增加、市場競爭的加劇,風險問題將日益突出,市場監管的難度將加大,監管面臨的挑戰日益嚴峻。風險點主要體現在四個方面:

一是徵信機構非法營運所帶來的法律風險。網際網路本身的開放性和便利性在促進徵信市場發展的同時,也增加了資訊洩露和濫用的風險。一些敏感資訊很容易在資訊主體未知的情況下被分析、使用,甚至用於非法目的,由此帶來嚴峻的資訊保安保護和消費權益保護問題。

二是徵信機構由於治理結構不完善、內控制度不健全所帶來的業務操作風險和人員道德風險。

三是徵信機構及相關合作部門核心技術水平及網路維護不力導致的資訊及網路安全風險。如資訊主體的信貸記錄和非銀行資訊等資料在通過網際網路傳輸的過程中,存在因黑客攻擊、網路病毒而導致的資訊被非法訪問、盜取和篡改的風險。

四是資訊壟斷技術上的徵信壟斷導致的市場不正當競爭風險。一些網際網路企業憑藉其市場壟斷地位獲取的壟斷資訊介入徵信市場,形成壟斷優勢,造成徵信供給的壟斷,扼殺了徵信市場的創新活力和市場活力,造成雙重壟斷的市場格局。

三、順應大資料時代要求、加快我國徵信市場發展的建議

徵信市場是我國市場經濟體系的重要組成部分,是全面深化改革程式中進一步發揮市場決定性作用和推進國家治理體系和治理能力建設的重要基礎。我國徵信市場建設從20世紀90年代開始起步,經過20多年的不斷探索,儘管取得了不小成績,但總體上仍處於發展的初級階段,市場主體少、規模小,市場廣度和深度不足、結構不合理,服務較單一,法制不完善,活躍度不高,遠不能滿足經濟社會發展對信用資訊產品的要求,與已開發國家相比更是存在較大差距。資料奔流的大資料時代給我國徵信市場發展帶來了挑戰,更帶來了跨越發展的難得機遇。我們應該順應大資料時代的要求,積極應對新挑戰,主動搶抓新機遇,加快促進我國徵信市場健康發展,搶佔徵信業發展的制高點。作為我國徵信市場的監督管理部門,人民銀行肩負著制定遊戲規則、營造市場環境、加強市場監管、推動市場發展的重要職責,應該審時度勢、因勢利導、改革創新、促進發展。

(一)著力發展市場化機構,加快完善徵信組織體系

從已開發國家的經驗來看,市場化徵信機構是徵信市場發展的主體,也是徵信市場活力的源泉。鼓勵市場化徵信機構的發展,通過市場的優勝劣汰,最終形成一定數量的治理結構完善、內部控制嚴密、業務模式清晰、具有相當競爭實力的品牌徵信機構,是我國徵信市場發展的必由之路。在大資料時代,各類資本進入徵信市場的積極性較高,為加快完善我國徵信市場組織體系、提升徵信市場的供給水平提供了很好的契機。筆者認為,在目前我國徵信機構數量少、規模小的情況下,保持開放的心態,在守住資訊保安和保護金融消費權益底線的基礎上,應儘量減少不必要的限制,大力鼓勵各個地區、各種模式的各類資本進入徵信市場,促進各種市場化徵信業態的蓬勃發展。這不僅有助於完善我國徵信市場的組織體系,促進徵信市場的合理競爭,改進徵信市場服務,從而有利於我國徵信市場的儘快成熟;也有助於監管部門儘快積累監管經驗,提高監管履職能力。

(二)鼓勵產品創新,加快完善徵信服務體系

一是鼓勵傳統徵信機構運用大資料技術,充分挖掘現有資料資源,創新徵信產品,服務新的市場需求。尤其是金融信用資訊基礎資料庫作為目前我國最大的徵信資源中心,應充分利用大資料技術,深入挖掘資料價值,創新徵信產品,提高服務水平。

二是鼓勵新興網際網路公司利用自身的資料和技術優勢,開發大資料徵信產品,以自身專長服務特定徵信細分市場。

三是鼓勵傳統徵信產品與大資料徵信產品的複合創新。

從以上分析可以看到,傳統徵信與大資料徵信其實各有所長,並不存在相互替代的關係。為了滿足徵信市場更全面、更多樣化的信用資訊需求,應該積極鼓勵傳統徵信產品與大資料徵信產品的複合創新,從而提升我國徵信市場的服務水平。

(三)加強法制建設,加快完善徵信法規體系

隨著大資料技術的發展,資訊的公開與封鎖、保密與洩密、持有與洩露、使用與濫用、授權與非授權等各種矛盾和糾紛相應增加,徵信市場中資訊提供者、資訊加工者與資訊消費者等各種參與主體之間的利益訴求多元化,需要儘快加強相關法制建設,依法調解各利益主體間的利益訴求。在大資料時代,我國徵信法制建設應該重點解決以下幾個問題:

一是資訊公開問題。如前文分析,如果沒有資訊公開作為保障,再強大的技術和再先進的方法也難以催生大資料的真正發展。所以,應該通過加快立法,打破政務資訊、商務資訊、社會資訊、司法資訊等各類資訊的部門壁壘,促進各類資訊依法公開與互聯共享。這是主動迎接大資料時代來臨的基本前提。

二是權益保護問題。大資料時代,如何保護相關主體的權益成為一個極為突出的問題。應該通過立法,儘快破解徵信機構在保護企業商業祕密和個人隱私以及產品研發之間面臨的兩難選擇,明確當企業商業祕密和個人隱私受到侵害時的相應申訴渠道、申訴程式和司法救濟方式。

三是司法懲處問題。要通過立法,儘快明確對無故封鎖資料和非法採集、竊取、洩露、傳播資料等損害相關主體權益的行為的具體懲罰措施。

(四)築牢風險防線,加快完善徵信監管體系

徵信業是經營市場主體信用資訊的特殊行業,由於容易涉及企業祕密、個人隱私等敏感問題,因此其也是一個高風險行業。在大資料時代,隨著企業和個人越來越全面的資訊被採集、儲存、迴圈利用,給企業祕密和個人隱私帶來了巨大威脅,從而對監管體系提出了更嚴峻的挑戰。因此,要從保護資訊保安、維護消費權益的角度出發,築牢風險防線,加快構建以徵信機構完善的法人治理結構和有效內部控制為基礎、以徵信業行業自律為補充、以監管部門牌照管理以及現場和非現場監管為主導的徵信管理監督體系。

一是築牢徵信機構防線。徵信機構完善的公司治理和內部控制是防範徵信風險的第一道防線。從監管部門來說,應該加強對徵信機構公司治理和內部控制的嚴格監管。

二是築牢行業自律防線。未來徵信市場必將快速擴充,徵信行業的相關法規及監管能力或不能實時跟上行業發展的需求,給徵信監管工作帶來巨大挑戰。因此,成立徵信行業協會,運用市場紀律約束的力量,協調徵信機構之間、徵信機構和監管機構之間的關係,促進徵信行業技術和業務交流,加強行業自律,對行業不當行為進行懲戒,有助於徵信市場的健康發展。

三是築牢監管防線。面對大資料時代市場主體增多、市場競爭加劇、市場風險加大的新挑戰,應該加快探索以規範徵信市場競爭、保護信用資訊主體權益為目標的、既符合大資料時代特點又適合我國國情的、現場與非現場相結合、事前准入、事中監管和事後處置相連線的徵信監管制度。

(五)深化配套改革,加快完善徵信營商環境

營造良好的需求環境。徵信需求始終是徵信市場發展的動力。徵信市場的需求按照來源來分,大致可以分為兩類:一類是市場自發的需求,另一類是行政引導的需求。對於還處在發展初級階段的我國徵信市場而言,既要注重市場自發需求的培育、也要通過適當的行政手段來引導需求。當前,為了營造良好的需求環境,除了應繼續落實好在行政管理事項中使用信用記錄和信用報告的有關要求之外,還應該引導各相關主體加大在經濟社會管理事項中使用信用記錄和信用報告的力度,一方面通過信用管理改進經濟和社會管理的效能,另一方面擴大徵信市場需求。

營造良好的資料環境。當前我國資訊割裂、資訊壟斷現象比較嚴重,不同部門、機構掌握不同的資訊資源,不能實現資源整合和資訊的充分利用。如,金融信用資訊基礎資料庫掌握個人信用交易的歷史資料,公檢法掌握個人違法記錄,水電管理部門掌握水電繳費記錄,淘寶網掌握個人、企業商品交易資訊,騰訊公司掌握個人社交資訊等。一方面,監管機構應鼓勵和推動相關機構及時公開共享相關資訊,鼓勵徵信機構多角度開展資源整合,盤活信用資料資源,真正發揮資料的作用;另一方面,監管機構也要未雨綢繆,防止資訊壟斷企業攜壟斷優勢進入徵信市場形成徵信再壟斷。

營造良好的人才環境。人才是市場創新發展的關鍵。在大資料時代,資訊科技日新月異,徵信模式不斷創新,對徵信人才的需求不斷增加。要通過各種辦法,有意識地培養大批既掌握大資料技術和方法、又熟悉徵信業務和法律法規的複合型人才。

營造良好的權益保護環境。要從保護資訊主體的合法權益出發,充分考慮舉證責任與舉證能力的現實要求,加快建立健全信用資訊主體和消費者的維權組織、維權渠道、維權制度,加大對洩露企業祕密和個人隱私行為的打擊懲處力度。

本文僅代表作者個人觀點,不代表作者所在單位意見。

參考文獻:

[1]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大資料時代[M].浙江人民出版社,2013.

[2]維克托·邁爾-舍恩伯格著.刪除:大資料的取捨之道[M].浙江人民出版社,2013.

[3]塗子沛.大資料:正在到來的資料革命,以及它如何改變政府、商業與我們的生活[M].廣西師範大學出版社,2013.

[4]龍海明,王志鵬,申泰旭.大資料時代徵信業發展趨勢探討[J].金融經濟,2014,(12).

[5]孫健,賈曉菁.Google雲端計算平臺的技術架構及對其成本的影響研究[J].電信科學,2010,(1).

作者:林平,中國人民銀行深圳市中心支行

摘自:《南方金融》