Q:Spark和Hadoop的架構區別
Q:Spark和Hadoop的架構區別
A:Hadoop:MapRedcue由Map和Reduce兩個階段,並透過shuffle將兩個階段連線起來的。但是套用MapReduce模型解決問題,不得不將問題分解為若干個有依賴關係的子問題,每個子問題對應一個MapReduce作業,最終所有這些作業形成一個DAG。
Spark:是通用的DAG框架,可以將多個有依賴關係的作業轉換為一個大的DAG。核心思想是將Map和Reduce兩個操作進一步拆分為多個元操作,這些元操作可以靈活組合,產生新的操作,並經過一些控制程式組裝後形成一個大的DAG作業。
Q:Spark和Hadoop的中間計算結果處理區別
A:Hadoop:在DAG中,由於有多個MapReduce作業組成,每個作業都會從HDFS上讀取一次資料和寫一次資料(預設寫三份),即使這些MapReduce作業產生的資料是中間資料也需要寫HDFS。這種表達作業依賴關係的方式比較低效,會浪費大量不必要的磁碟和網路IO,根本原因是作業之間產生的資料不是直接流動的,而是藉助HDFS作為共享資料儲存系統。
————————————————
原文連結:https://blog.csdn.net/xiaokaiabcde/article/details/103030363
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69949806/viewspace-2904565/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- hadoop和spark的區別HadoopSpark
- 如何掌握Spark和Hadoop的架構SparkHadoop架構
- SOA架構和微服務架構的區別架構微服務
- 分散式架構和微服務架構的區別分散式架構微服務
- H5架構和原生架構的區別H5架構
- hadoop1.0 和 Hadoop 2.0 的區別Hadoop
- Spark Streaming和Flink的區別Spark
- Spark TempView和GlobalTempView的區別SparkView
- SOA架構和微服務架構的區別是什麼?架構微服務
- 解決方案架構、系統架構和企業架構區別架構
- Hadoop 和 GBase 8a 的區別Hadoop
- 大資料架構師必讀:常見的七種Hadoop和Spark專案案例大資料架構HadoopSpark
- java架構-執行緒和程式的區別Java架構執行緒
- 全棧工程師和架構師的區別全棧工程師架構
- 你和架構師的的區別是什麼?架構
- Hadoop的架構模型Hadoop架構模型
- X86架構與ARM架構的區別:架構
- 超融合架構與傳統IT架構的區別架構
- Hadoop YARN 架構HadoopYarn架構
- MPP與Hadoop,兩種主流大資料系統架構有啥區別?Hadoop大資料架構
- Spark 外部變數和BroadCast變數的區別Spark變數AST
- 四大CPU架構的區別架構
- 【架構與設計】常見微服務分層架構的區別和落地實踐架構微服務
- Hadoop的HDFS架構入門Hadoop架構
- Hadoop-Yarn架構HadoopYarn架構
- 介面、資料結構、資訊架構的區別資料結構架構
- 【Hadoop】SNN與HA的區別Hadoop
- Hadoop(一)Hadoop核心架構與安裝Hadoop架構
- Kappa架構取代Hadoop的Lambda架構成為主流 - WaehnerAPP架構Hadoop
- 我的架構夢:(五十九) Apache Hadoop 架構與原理架構ApacheHadoop
- 12-factor應用和微服務架構應用的區別微服務架構
- 帶有Apache Spark的Lambda架構ApacheSpark架構
- Hadoop架構已凋謝?!Hadoop架構
- hadoop:spark-project專案的hadoop配置HadoopSparkProject
- 領域驅動設計和Clean架構之間的區別? - stackexchange架構
- Spark與MapReduce的對比(區別)Spark
- 系統設計:使用Scala、Spark和Hadoop構建推薦系統SparkHadoop
- 常見的七種Hadoop和Spark專案案例HadoopSpark