本文來源:數智化轉型俱樂部

資料中臺自14年至今,已然成為了2B、2G業務最熱門的話題,政府機構、企事業單位、網際網路公司等進行著數字化、資料化、智慧化轉型。市場普遍認為,阿里巴巴將自身資料中臺建設能力對外賦能是拉起本輪資料中臺浪潮的根本所在。

本文將帶你全面瞭解阿里巴巴做資料中臺的歷史。

1

緣起

在2014年以前,阿里巴巴有很多條業務線,都有自己的ETL團隊,每個ETL團隊建設和維護自己的資料體系。當時許多人認為,這種自下而上的自給自足能夠最高效地滿足業務需求。也因此,各個ETL團隊之間缺乏相互信任,也缺乏最大化互通的可能性。

即便在2020年的很多公司,這種現象也普通存在。不同部門、不同業務、不同系統之間都有自己單獨的ETL處理體系,每個ETL體系只關注與自己垂直業務相關的需求,並從底向上完整支撐業務體系。這種情況的出現,大多是由於業務發展迅速,為了快速低成本的滿足業務資料需求,單獨拉出資料支撐團隊造成的。

對於當時的阿里巴巴而言,這種分散資料處理體系帶來了很多問題。以日誌採集資料為例,就同時存在若干份資料:淘寶資料基礎層、廣告資料基礎層、搜尋資料基礎層各有一份日誌資料,不僅直接耗費了非常多的儲存資源,更重要的是扼殺了資料中間層和資料應用層等複用的可能性。

圖2014年以前阿里巴巴分業務自建資料體系的抽象圖

下圖展示的是2014年以前,阿里巴巴各個資料團隊建設的資料任務關係圖。每個圓形代表著一條業務線的資料任務集合,任意兩個圓形之間的連線代表著兩者的關係。由此可見:資料處理流向是混亂的、無方向性的;資料管理是無序的,基本處於失控狀態;除了浪費研發資源和儲存資源,也必然滿足不了業務需求。

圖阿里巴巴資料公共層建設之初計算環境1上的資料任務關係圖

業務猛烈發展與資料支撐能力不匹配產生了巨大的矛盾,也促使阿里巴巴內部開始進行資料公共層的建設,資料公共層旨在可持續地建設阿里巴巴智慧大資料體系。

2

發展

從零散的資料到統一的資料

從2014年起,阿里巴巴啟動資料公共層建設專案,以OneData體系特別是方法論為指導。

資料公共層建設初期是為了消除因”煙囪式”開發給業務帶來的困擾和技術上的浪費。而OneData體系是保障和推進專案建設的關鍵。OneData體系一方面致力於資料標準的統一,另一方面追求讓資料變為資產而非成本。OneData體系除了方法論,還包含工具型產品、規範等,具體體現為:資料規範定義、資料模型定義、模型智慧化設計、規範ETL開發、落實資料規範和模型定義的研發工具、對於整個體系的自動化調優和監控。

通過建設統一的ODS資料基礎層,建設基於業務應用或需求來源端的抽象資料邏輯層來豐富資料中間層,允許資料應用層的百花齊放來打造阿里巴巴資料公共層。從而將零散的資料變為統一的資料。

從資料孤島到資料融通

在業務突飛猛進發展過程中,不同的事業部、業務條線會為了快速實現需求,資料單獨定義、儲存、使用,從客觀性來講,每個發展壯大的企事業單位都避免不了資料孤島的產生。資料孤島不僅包含物理孤島(獨立儲存、維護、使用),而且包含邏輯孤島(定義不一致、計算邏輯不一致)。

阿里巴巴創新性的建立OneID體系,將所有業務範圍(電商、金融、廣告、物流、文化、教育、娛樂、裝置、社交等)中的人、貨、場、物、錢等實體打通,解決體系內邏輯性資料孤島問題。在阿里雲的強力支撐下,集團內所有隔離資料進行統一的儲存和管理,解決體系內物理孤島問題。

從資料孤島到資料融通,使得資料擁有創造價值的可能性。

從授人以魚到授人以漁

從以定製化開發的方式將資料交付到業務人員,到基於資料規範但需要配置,再到全鏈路資料打通,直到主題式服務,阿里巴巴一次次努力追求的正式從授人以魚到授人以漁。

2012年前後,服務於1688有超過300多個API,梳理後發現這些API之間無法整合,因為每個API只服務於一個業務應用而不能被共享,API應用的資料應用層資料表也不能被共享。

從2012年至2016年,阿里巴巴通過OneService體系將API資料服務從物理表SQL模式升級至面向主體查詢邏輯模型的SQL模型,大大提升了系統的可用性,也使得資料中臺面向業務人員使用變成了現實,達到了授人以漁的目標。

3
從資料成本到資料價值

對於大部分企業來說,業務系統創造的資料不僅需要佔據大部分的儲存空間,而且還需要技術人員持續維護,是一筆不小的成本開支。

阿里巴巴致力於將資料從成本中心變為資產中心,在業務資料化與資料業務化兩大方向,資料賦能業務、驅動創新四大業務場景上取得了豐碩的成功。

資料中臺賦能業務、驅動創新的四大典型場景包含:全域性資料監控、資料化運營、資料植入業務、資料業務化。

全域性資料監控,如戰略決策的智慧方案:最大限度降低資料分析的難度,最大程度提高資料分析效果,同時不動聲色中傳遞品牌價值,以高效優質地輔助戰略決策和資料化運營。

圖雙十一資料大屏&銀泰互動大屏

資料化運營,如使用者管理的智慧方案:基於全鏈路全渠道的資料構建、資料連線與萃取管理體系,對使用者進行全生命週期的精細化管理(如智慧CRM)。

2017年熱播的一部電視劇,該電視劇在優酷土豆獨家播放十天,播放量就突破了60億次,屬於”現象級IP”。但這樣的”現象級IP”並不是偶然產生的,除資本投入因素外,資料化運營在其中發揮了巨大的作用。

事前通過輿情分析鎖定IP,及時獨立採購IP;事中實時監控流量變化、播放情況,及時調整流量入口,有針對性的推送使用者;事後,及時總結和覆盤,進行使用者沉澱,挖掘相似內容,形成閉環。

資料植入業務:智慧影像鑑別,智慧客服。

通過資料模型演算法,將影像鑑別從手工變為自動化,節省95%以上工作量。

圖資料智慧植入業務系統

資料業務化,如零售管理的智慧方案:規避傳統零售的鬆散式管理,將庫存、定價、補貨、銷售等統一協同,整體提升線上線下零售體驗和效果(如生意參謀)。

4

集大成

到今天為止,阿里雲資料中臺體系(Dataphin、QuickBI、QuickAudience)經歷了阿里幾乎所有業務的考驗,包含新零售、金融、物流、營銷、旅遊、健康、大文娛、社交領域。在此過程中,雲上資料中臺除了形成自己的核心能力外,更向上”賦能業務前臺”、向下與”統一計算後臺”連線並與之融為一體,形成雲上資料中臺業務模式。

同時,阿里巴巴從2018開始,將自身的資料中臺能力向外輸出賦能,對社會創造更多價值。


如您對商業智慧,數智化轉型感興趣,請加微信:wendy199it