第2章 用Scala和Spark進行資料分析

陳孟寒發表於2015-10-23

2.1 資料科學家的Scala

2.2 Spark 程式設計模型

2.3 記錄關聯問題

2.4 小試牛刀:Spark shell和SparkContext

2.5 把資料從叢集上獲取到客戶端 

2.6 把程式碼從客戶端傳送到叢集

2.7 用元組和case class對資料進行結構化

2.8 聚合

2.9 建立直方圖

2.10 連續變數的概要統計

2.11 為計算概要資訊建立可重用的程式碼

2.12 變數的選擇和評分簡介

2.13 小結 

相關文章