從BAT看企業構建大資料體系的六層級

本文將企業大資料體系的構建分為六個層級,但並非是線性過程,每個層級之間或有基礎關係,但並不是說一定要逐層構建。例如創業型公司,在缺乏資料研發實力的時候,多數會藉助第三方平臺進行資料上報與分析。

下面一張圖,是本文的精華概括,後面一一展開與大家探討。


一、資料基礎平臺

基礎的資料平臺建設工作,包含資料平臺建設,資料規範,資料倉儲、產品資料規範,產品ID,使用者ID,統一SDK等。

很多公司的資料無法有效利用,就是缺乏統一規範,產品資料上報任由開發按照自己的理解和習慣上報,沒有標準化的SDK和上報協議,並且資料散落在各個部門產品的伺服器,無法構建結構化的資料倉儲。

做資料平臺的架構,很多人會理解為高大上的技術活,其實整個資料平臺價值的體現,需要公司各個部門的配合,例如關鍵資料指標體系的建立,需要從各個部門業務指標進行提煉,並得到業務部門認可。常見的關鍵指標有:DAU、PCU、WAU、MAU、按天留存率(1-30日留存)、累計留存率(7日、14日、30日累計留存率),新增使用者,有效新增使用者,活躍轉化率,付費轉化率,收入指標,ARPU人均收入,渠道效果資料等。

下圖是騰訊和阿里的資料平臺架構


阿里大資料業務架構:


阿里雲梯分散式計算平臺整體架構:


二、資料包表與視覺化

在第一層級中,進行資料指標體系規範,統一定義,統一維度區分,就可以很方便的進行標準化可配置資料包表設計,直觀的視覺化輸出設計,包括行為、收入、效能、質量等多種資料類別。

在PPT中以友盟、迅雷、百度、騰訊等公司的資料包表體系進行詳細講解。

騰訊資料門戶


阿里資料地圖


三、產品與運營分析

在建立資料平臺和視覺化基礎上,對已有的使用者行為、收入資料等進行各種分析,輸出日報、週報、月報、各種專題分析報告。常見的資料分析工作如下:

1. A/B TEST進行產品分析優化;

2. 運用漏斗模型進行使用者觸達分析,如TIPS、廣告等曝光到活躍的轉化;

3. 收入效果監控與分析,包含付費轉化率、渠道效果資料等;

4. 業務長期健康度分析,例如從使用者流動模型、產品生命週期分析產品成長性和健康度;

5. 營銷推廣活動的實時反饋;
使用者畫像也是常見的資料分析方式,包括使用者如性別、年齡、行為、收入、興趣愛好、消費行為、上網行為、渠道偏好、行為喜好、生活軌跡與位置等,反映使用者各種特徵,以達到全面的瞭解使用者,針對性的為使用者提供個性化服務的目的,通常每半年做一次使用者畫像的專題分析。

下圖是常見的資料分析思路


常用分析工具:EXCLE,SPSS,SAS,Enterprise Miner,Clementine,STATISTICA。個人用的比較多的是:EXCEL和SPSS。

下圖是SPSS常用的資料分析與挖掘方法


四、精細化運營平臺

基於資料基礎上搭建的精細化運營平臺,主要的平臺邏輯多數是進行使用者細分,商品和服務細分,通過多種推薦演算法的組合優化進行商品和服務的個性化推薦。另外還有針對不同產品生命週期,使用者生命週期構建的產品資料運營體系。


五、資料產品

廣義的資料產品非常多,例如搜尋類,天氣預報類等等。這裡主要講狹義的資料產品,以BAT三家公司的資料產品為例進行分享。

騰訊:廣點通、信鴿

阿里:資料魔方、淘寶情報、淘寶指數、在雲端

百度:百度預測、百度統計、百度指數、百度司南、百度精算

擷取幾張PPT如下:





六、戰略分析與決策

戰略分析與決策層,更多的是跟很多傳統的戰略分析、經營分析層面的方法論相似,最大的差異是資料來自於大資料。

有很多企業錯誤的把“業務運營監控層”和“使用者/客戶體驗優化層”做的事情放在經營分析或者戰略分析層來做。傅志華認為“業務運營監控層”和“使用者/客戶體驗優化層”更多的是通過機器、演算法和資料產品來實現的,“戰略分析”、“經營分析”更多的是人來實現。很多企業把機器能做的事情交給了人來做,這樣導致發現問題的效率較低。

建議是,能用機器做的事情儘量用機器來做好“業務運營監控層”和“使用者/客戶體驗優化層”,在此基礎上讓人來做人類更擅長的經驗分析和戰略判斷。

在變化極快的網際網路領域,在業務的戰略方向選擇上,資料很難預測業務的大發展方向,如果有人說微信這個大方向是通過資料探勘和分析研究出來,估計產品經理們會笑了。從本質上來說,資料在精細化營銷和運營中能起到比較好的作用,但在產品策劃、廣告創意等創意性的事情上,起到的作用較小。但一旦產品創意出來,就可以通過灰度測試,資料驗證效果了。

BLUES【公眾號ID:bluemidou】迅雷產品總監,原騰訊、YY語音高階產品經理。