阿里雲數加平臺

  • 3年入駐1000家合作伙伴
  • 2016年將是真正的大資料元年
  • 一口氣推20款產品

“這是一個人人都在談大資料的時代,但只有極少數人在用大資料。”阿里雲大資料事業部資深總監徐常亮說,2016年才是真正意義上的大資料元年。

1月20日,阿里雲在2016雲棲大會上海峰會上宣佈開放阿里巴巴十年的大資料能力,釋出全球首個一站式大資料平臺“數加”,首批亮相20款產品。這一平臺承載了阿里雲“普惠大資料”的理想,即讓全球任何一個企業、個人都能用上大資料。

在輸出自身大資料能力的同時,“數加”還向有資料開發能力的團隊開放。這些團隊可入駐“數加”,藉助數加上的工具為各行各業提供資料服務。“這就像在淘寶開店一樣,只是他們售賣的是專業能力。”徐常亮表示,阿里雲計劃用3年時間吸引1000家合作伙伴入駐,共同分享1萬億的大資料蛋糕。

據IDC出版的數字世界研究報告顯示,2013年人類產生、複製和消費的資料量達到4.4ZB。而到2020年,資料量將增長10倍,達到44ZB。大資料已經成為當下人類最寶貴的財富。但全球真正享受大資料紅利的公司不足千分之一,人類已挖掘的資料財富更是不到百萬分之一。

在過去的5年裡,全球大資料計算效能實現了超過20倍的增長,100TB資料排序時間由8274秒縮短到377秒。“束縛大資料的技術瓶頸已經被完全打破,資料將從企業的成本中心轉變為價值中心,2016年我們將迎來大資料應用的全面落地。”徐常亮說,通過數加平臺,我們希望所有企業都能像阿里巴巴一樣更高效的使用大資料。

藉助大資料技術,阿里巴巴取得了巨大的商業成功。通過對電子商務平臺上的客戶行為進行分析,誕生了螞蟻小貸、花唄、借唄;菜鳥網路通過電子面單、物流雲、菜鳥天地等資料產品,為快遞行業的升級提供技術方法。

在這些創新中,“數加”承載了阿里巴巴EB級別的資料加工計算,經歷了上萬名工程師的實戰檢驗。大麥網是阿里雲“數加”平臺的嚐鮮者。通過採用“數加”的推薦引擎,大麥網的研發成本從900人天降低到了30人天,效率提升了30倍。

行業的健康發展,自律很重要。徐常亮強調,資料是客戶的寶貴資產,任何雲端計算平臺都不能移作它用。阿里雲將嚴格遵守去年7月份發起的《資料保護倡議書》,也希望全行業能夠自律,共同迎接大資料產業的爆發。

此次,“數加”平臺首批集中釋出了20款產品,覆蓋資料採集、計算引擎、資料加工、資料分析、機器學習、資料應用等資料生產全鏈條。“這些技術至少領先業界三年”,徐常亮說。

大資料計算服務(MaxCompute)、分析型資料庫(Analytic DB)、流計算(StreamCompute)共同組成了底層強大的計算引擎,速度更快,成本更低。經測算,自建Hadoop叢集的成本是數加的1.5倍,國外計算廠商AWS 的EMR成本更是數加的5倍。

計算引擎之上,“數加”提供了最豐富的雲端資料開發套件,包括資料整合、資料開發、排程系統、資料管理、運維視屏、資料質量、任務監控。

在資料分析方面,通過移動資料分析(Mobile Analytics)產品,開發者可快速搭建日誌採集、分析系統;通過數加BI報表產品,3分鐘即可完成海量資料的分析報告;通過資料視覺化產品DataV,一星期就能做出雙11同款大屏。

同時,基於DataV,數加還發布了面向政府的行業應用產品“郡縣圖治”。通過這款產品,縣長可以在一個螢幕下統覽全縣各項經濟民生資料,為政府決策提供輔助。

對於時下大熱的機器學習,數加更是提供了全面支援。“數加”釋出的機器學習工具,可基於海量資料實現對使用者行為、行業走勢、天氣、交通等的預測。圖形化程式設計讓使用者無需編碼、只需用滑鼠拖拽標準化元件即可完成開發。產品還整合了阿里巴巴核心演算法庫,包括特徵工程、大規模機器學習、深度學習等。

為了能夠幫助開發者更快捷在應用中整合大資料功能,“數加”同時提供了規則引擎、推薦引擎、文字識別、智慧語音互動等資料應用產品。