Spark原理-物理執行圖
物理圖的意義
誰來計算RDD呢
Task
Task如何設計
1 . 第一個想法,每個RDD 的每個分割槽都對應一個Task
2 . 第二個想法,用一個Task計算所有RDD 中對應的分割槽
3 . 這兩個想法都有問題,分階段,採用資料流動的模型來進行設計
階段怎麼劃分
階段 + Task 就是執行RDD 的執行者
總結
資料是如何流動的
- 資料計算髮生在需要資料的地方,FinalRDD
- 第一個獲取資料的 RDD 是 firstRDD
小案例
val firstRdd = sc.parallelize(Seq("spark flink", "docker k8s", "spark docker"))
val splitRdd = firstRdd.flatMap(_.split(" "))
val reduceRdd = splitRdd.map((_, 1)).reduceByKey(_ + _)
val mapRdd = reduceRdd.map(item => s"${item._1},${item._2}")
mapRdd.foreach(println(_))
執行過程
相關文章
- Spark的執行原理Spark
- spark執行原理、模型Spark模型
- 【Spark】 Spark作業執行原理--獲取執行結果Spark
- 圖解Java執行緒池原理圖解Java執行緒
- 如何執行 Angular library 的原理圖 SchematicsAngular
- spark學習筆記--叢集執行SparkSpark筆記
- Spark學習(一)——執行模式與執行流程Spark模式
- Dive into TensorFlow系列(1)-靜態圖執行原理
- 《深入理解Spark》之Spark的整體執行流程Spark
- 檢視spark程式執行狀態以及安裝sparkSpark
- 自適應查詢執行:在執行時提升Spark SQL執行效能SparkSQL
- SpringMVC執行原理SpringMVC
- CLR執行原理
- Yarn執行原理Yarn
- SpringBoot執行原理Spring Boot
- Spark叢集和任務執行Spark
- 圖解通訊原理(乙太網通訊及物理層工作原理)圖解
- spark streaming執行kafka資料來源SparkKafka
- Locust 執行原理分析
- 《微機執行原理》
- 前端-JavaScript執行原理前端JavaScript
- MySQL 執行原理【表】MySql
- Android Animation 執行原理Android
- Java併發(四)----執行緒執行原理Java執行緒
- 圖解JVM記憶體模型及JAVA程式執行原理圖解JVM記憶體模型Java
- Spark入門(二)--如何用Idea執行我們的Spark專案SparkIdea
- Spark的工作原理Spark
- Java執行緒池二:執行緒池原理Java執行緒
- Spark閉包 | driver & executor程式程式碼執行Spark
- Spark Task 的執行流程② - 建立、分發 TaskSpark
- eBPF 執行原理和流程eBPF
- [Spring]MyBatis的執行原理SpringMyBatis
- java多執行緒原理Java執行緒
- MySQL 執行原理【事務】MySql
- 執行緒池原理初探執行緒
- 【多執行緒】ThreadLocal原理執行緒thread
- kill 指令的執行原理
- JavaScript執行原理解析JavaScript