大資料學習路線教程圖,如何快速入門Spark

千鋒雲端計算發表於2019-12-23

隨著網際網路的發展,大資料已經成為了新一代的“網紅”,各行各業幾乎都和大資料產生著關係。Spark是大資料中重要的框架之一,下面為大家分享如何快速入門spark。

大資料學習路線教程圖,如何快速入門Spark

Apache Spark是在大資料工業界裡用的最多的基於記憶體的技術框架,尤其是RDD的特性以及應用,對幫助理解Spark和任務提交的流程以及快取機制。

透過以上教程可以讓大家掌握Spark的環境搭建,任務排程流程,以及RDD程式碼的應用。

大資料學習路線教程圖,如何快速入門Spark

課程目錄:

第1章 Spark知識講解

01_為什麼學習Spark

02_Spark和MapReduce的對比.mp4

03_Spark框架體系

04_Spark下載

05.Spark執行模式介紹

06.Spark叢集安裝

07.Spark程式執行流程

08.Spark相關名詞解釋

09_SparkShellLocal

10_SparkShellCluster

11_Spark2.2和Spark1.6Shell對比

第2章 Maven和IDEA

12_Maven和IDEA下載

13_Maven安裝

14_IDEA安裝

15_IDEA中配置Maven

16_Scala環境安裝和IDEA中配置Scala外掛

17_IDEA建立Spark工程

18_Spark開發WordCount程式

19_Spark程式打包

20_Spark叢集執行打包程式

第3章 RDD知識講解

21_RDD概念

22_RDD執行流程

23_RDD屬性

24_RDD彈性

25_RDD的兩種建立

26_RDD程式設計API

第4章 Transformation演算法

27_Transformation演算法

28_Action演算法

29_Map

30_filter

31_flatMap

32_sample

33 union

34 intersection

35 distinct

36 join

37_leftOuterJoin

38_rightOuterJoin

39_cartesian

40_groupBy

41_mapPartition

42_mapPartitionWithIndex

43_sortby

44_sortbykey

45_repartition

46_coalesce

47_partitionBy

48_repartitionAndSortWithinPartitions

49_reduce

50_reduceByKey

51_aggregateByKey

52_combineByKey

第5章 Action演算法

53_collect

54_count

55_top

56_take

57_takeOrdered

58_first

59_saveAsTextFile

60_foreach

61_其他運算元之countByKey

62_其他運算元之countByValue

63_其他運算元之filterByRange

64_其他運算元之flatMapValues

65_其他運算元之foreachPartition

66_其他運算元之keyBy

67_其他運算元之keys和values

68_其他運算元之collectAsMap

69_RDD函式傳遞

70_RDD的依賴關係

71_RDD任務劃分

72_Lineage血統

73_RDD快取(持久化)


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69916964/viewspace-2669556/,如需轉載,請註明出處,否則將追究法律責任。

相關文章