1470387058-9256-3417eb9bbd59190e4beb36

1470387059-6254-3417eb9bbd59190e4bec37

  我們研究經濟的時候,一定會放眼世界看更大的版圖,因為今天的中國已經是世界第二大經濟體了。看這張圖的時候大家想一想,如果沒有網際網路,我們不可能及時地看到這個世界。80年代,電話開始進入了普通中國家庭。但是數量還是很少,通訊基本還是靠書信。現在資訊發展非常快,這就要求我們思考:當我們放眼世界的時候,以什麼樣的思想和工具觀察這個世界?

1470387058-1331-3417eb9bbd59190e4c1c38

1470387058-6974-3417eb9bbd59190e4c1d39

1470387058-6013-3417eb9bbd59190e4c1d3a

1470387058-3136-3417eb9bbd59190e4c1d3b

  這些大資料的發展歷程大家已經耳熟能詳了。大資料分析未來的發展趨勢是:資料將應用於社會化的分析,工具會越來越靈活;越來越多的人藉助視覺化方法來表現資料魅力,視覺化做好以後資料會有美感方面的創新。資料的蒐集將不但來自特定機構的資料,也來自老百姓的無私奉獻。我們知道,每個人在網上隨便一個動作都能留下很多痕跡,特別是當有些機制會讓民眾以很自然的方式參與公共資料的採集,這會減少政府維護基礎設施的成本,也讓市民有很好的參與感。大資料疊加上網際網路、雲端計算,會帶來新機遇。

1470387059-1453-3417eb9bbd59190e4c383c

1470387059-5778-3417eb9bbd59190e4c393d

 今天我希望講一講大資料和經濟分析的關係,過去我們有巨集觀經濟、微觀經濟,今後經濟研究領域會越來越注重用資料說話,資料會給我們呈現什麼東西呢?

關於大資料只重視相關性不重視因果性,這個說法有片面性。資料表明海盜數量減少和全球氣候變暖高度相關,可這有什麼用?我們不能把全球氣溫抬高來遏制海盜數量。人類現在的思維水平更多地可能還是願意找一些因果關係才能重複使用,包括結構化和非結構化,目前很多科學家做的努力都是把非結構化的資料結構化或半結構化,就是因為目前我們的認知水平多數還是用結構化的方式處理更有效和更習慣。

1470387059-9402-3417eb9bbd59190e4c603e

 我們嘗試用大資料處理手段做行業分析,開發出一些行業指數。這些資料一定不是交易資料的全部,但是經過持續採集、連續分析,當它作為一個行業指數來說還是有比較好的參考價值的。這裡面我們著重做了一些行業相關的指數。今天我說的資料主要來自銀聯刷卡資料,它有一定的代表性。當然第一,大家知道外國的卡不歸它管;第二,現金交易不歸它管,第三方支付也拿不到資料,所以採集到的資料仍然不是全面資料。但即便不是全面資料也可以呈現出一些比較有趣的現象。

1470387059-1600-3417eb9bbd59190e4c833f

  這是房地產資料,雖然和傳統統計方式不太一樣,它確實呈現出與國家統計局公佈的資料擬合度很高的情形。而且,我們的實時性很強,這些資料對於一些想提前知道經濟狀況,想提前對經濟進行預測的金融機構還是有很大價值的。

1470387059-9942-3417eb9bbd59190e4ca540

  這是一個高階酒店的行業資料,這是以2011年的資料做基準,黃色的曲線可以看出它的起伏。灰色的豎道是環比增長情況。

1470387060-4115-3417eb9bbd59190e4ceb41

1470387060-4029-3417eb9bbd59190e4ceb42

 這裡面有三個數,一個是餐飲指數增長增速,一個是酒店增速,和各省GDP的增速。裡面可以看到全部是深紅色的地方是西藏這個地方,酒店指數這塊——青海、新疆發展很快,包括貴州、廣西也都發展得比較快。在整個沿海地區呈現出相對發展較慢的情況,但是那邊的經濟並不是想象的那麼差,只不過它的餐飲業酒店業飽和度比較高,所以就沒有呈現出那麼好的增長趨勢。

1470387060-7798-3417eb9bbd59190e4d0243

 這張圖說明了什麼?剛才介紹了幾本書,其中講到了區域相關性,我們有幾個大的經濟區域,它們之間存在著什麼樣的經濟關係,我們也用手上的資料進行分析,呈現出類似一些情況。

1470387061-2842-3417eb9bbd59190e4d0f44

 前不久我們做了一個大資料交流會,和韓國的學者一起交流。我們利用跨境交易資料做了統計,2013年—2015年跨境交易金額資料香港第一,澳門第二,韓國從2014年的第三掉到2015年的第五,2015年日本從後面又趕上來了,這是不是背後有可以解釋或者暫時不能解釋的原因?另外是交易筆數,香港第一,到2015年韓國第二,日本第三,這說明什麼呢?說明在韓國買的都是小件東西,所以交易筆數多但是金額不多,在日本買的都是大件東西,交易筆數相對少一點,但是交易總額多一些。這就是我想說的,有的時候當你利用手上一部分資料,分析它會發現一些比較奇特的現象。

1470387060-4345-3417eb9bbd59190e4d2c45

 這個是日韓跨境消費資料,主要集中在珠寶百貨與美容行業,韓國珠寶類的交易幾乎不太多,特別突出的是韓國行業的美容,這個和大家的認知差不多,很多人去韓國購買深度或者淺層的美容服務,但是在那兒買珠寶的很少。我們展示這個資料並和韓國學者交流,他們承認他們的珠寶類產業不夠發達,據說和他們國家的珠寶加工水平不高有關,這些資料是不是反過來指出規劃產業的時候在這些略有不足的地方存在發展空間,這對他們也有指導意義。

1470387061-9934-3417eb9bbd59190e4d3e46

 這是中日韓消費經濟呈現區域引力效應圖,豎向是在幾地的消費,橫向是三個月後又在這些地方消費。紅色的框是三個月出現在香港消費,三個月又出現在香港消費的比較多,泰國只有百分之七點多,法國百分之八點幾,瑞士只有百分之四,美國有百分之二十多,其中是什麼原因不敢輕易下結論。這裡面有幾個藍框,講區域引力效應,香港和澳門框的比例相對高一些,日本和韓國的框整體又是在百分之十幾以上,另外就是法國和瑞士,前面講的幾本書,其中有一本講到了區域經濟引力,相鄰地區或者風格相近的地方因為對彼此的風格很認同,所以願意再去。如果我們對這種問題一探究竟會很有趣,比如為什麼去過香港以後去澳門就多一些,這些都可以做一些深入探討。

1470387061-9818-3417eb9bbd59190e4d5c48

1470387061-5168-3417eb9bbd59190e4d5147

 我們非常認同塔塔資料開放資料共享的理念,當越來越多的資料擺在我們面前,挖掘這些資料會呈現出很多新的發現。和傳統經濟分析用抽樣資料建模不一樣,我們用“全量”資料來分析。我們提出來的大資料思維就是這樣,今天我們看這個世界應該強呼叫更大的視野,更多的維度並言之有據。