Spark基礎:使用維基百科資料集來用Spark進行原型實驗
Apache Spark的真正價值和強大能力在於用它可以構建一個統一一致的分析場景,囊括了從ETL(資料抽取、轉換和載入)、批處理分析、實時流分析、機器學習、圖類型資料分析,到可視化的多種功能。在這個歷時2天的課程裡,布萊恩·克萊坡通過對多種維基百科資料集的動手操作來展示了理想中Spark可以完成的多樣化的編程模式。在培訓結束時,參加者將具備運用Spark來進行概念驗證和原型搭建的能力。
本課程包括50%的講座和50%的動手編程實踐。所有的參與者在課程結束後還可以獲得Databricks內容一個月的接入,方便參與者繼續進行課堂實踐和完成作業。
閱讀原文 ( read more ) 瀏覽更多培訓資訊
相關文章
- 【大資料】Spark RDD基礎大資料Spark
- 使用Spark和Cassandra進行資料處理(一)Spark
- Spark基礎Spark
- 用Spark進行實時流計算Spark
- spark基礎之spark sql執行原理和架構SparkSQL架構
- 第2章 用Scala和Spark進行資料分析Spark
- Spark資料收藏--------Spark執行架構Spark架構
- 基於樹莓派的叢集實驗(一)--spark on yarn樹莓派SparkYarn
- spark streaming執行kafka資料來源SparkKafka
- 基於 Spark 的資料分析實踐Spark
- spark學習筆記--叢集執行SparkSpark筆記
- 用Spark和DBSCAN對地理定位資料進行聚類Spark聚類
- 大資料基礎學習-9.Spark2.1.1大資料Spark
- 基於Spark對消費者行為資料進行資料分析開發案例Spark
- 使用 Spark 進行微服務的實時效能分析Spark微服務
- scala基礎語法-----Spark基礎Spark
- 大資料Spark叢集模式配置大資料Spark模式
- spark實戰之:分析維基百科網站統計資料(java版)Spark網站Java
- spark基礎之spark streaming的checkpoint機制Spark
- Spark 3.2使用體驗Spark
- 本地開發spark程式碼上傳spark叢集服務並執行(基於spark官網文件)Spark
- Spark基礎-Scala提取器Spark
- Spark SQL外部資料來源與實現機制SparkSQL
- Spark修煉之道(進階篇)——Spark入門到精通:第一節 Spark 1.5.0叢集搭建Spark
- Spark學習(二)——RDD基礎Spark
- Spark基礎-Scala檔案操作Spark
- Spark學習進度-Spark環境搭建&Spark shellSpark
- 第一篇:使用Spark探索經典資料集MovieLensSpark
- Spark綜合使用及使用者行為案例訪問session統計分析實戰-Spark商業應用實戰SparkSession
- Spark SQL:Hive資料來源複雜綜合案例實戰SparkSQLHive
- Spark SQL:JDBC資料來源複雜綜合案例實戰SparkSQLJDBC
- Spark叢集和任務執行Spark
- Spark修煉之道(進階篇)——Spark入門到精通:第七節 Spark執行原理Spark
- ELK 在 Spark 叢集的應用Spark
- Spinach: 使用Spark SQL進行即席查詢 [session]SparkSQLSession
- scala_準備_spark_基礎Spark
- Spark效能優化指南:基礎篇Spark優化
- Spark Streaming基礎概念介紹Spark