Spark基礎:使用維基百科資料集來用Spark進行原型實驗

OReillyData發表於2016-07-07


640?wx_fmt=jpeg



Apache Spark的真正價大能力在於用它可以構建一個一一致的分析景,囊括了從ETL(資料抽取、轉換入)、批理分析、實時流分析、機器學圖類型資料分析,到可化的多種功能。在歷時2天的程裡,布萊恩·克萊坡通過對多種基百科資料集的手操作來展示了理想中Spark可以完成的多化的程模式。在培訓結,參加者將具運用Spark來行概念驗證和原型搭建的能力。

程包括50%的座和50%的踐。所有的參與者在束後可以得Databricks內容一個月的接入,方便參與者繼續進踐和完成作

 


閱讀原文 ( read more ) 瀏覽更多培訓資訊

相關文章