Q:Spark和Hadoop的架構區別
Q:Spark和Hadoop的架構區別
A:Hadoop:MapRedcue由Map和Reduce兩個階段,並透過shuffle將兩個階段連線起來的。但是套用MapReduce模型解決問題,不得不將問題分解為若干個有依賴關係的子問題,每個子問題對應一個MapReduce作業,最終所有這些作業形成一個DAG。
Spark:是通用的DAG框架,可以將多個有依賴關係的作業轉換為一個大的DAG。核心思想是將Map和Reduce兩個操作進一步拆分為多個元操作,這些元操作可以靈活組合,產生新的操作,並經過一些控制程式組裝後形成一個大的DAG作業。
Q:Spark和Hadoop的中間計算結果處理區別
A:Hadoop:在DAG中,由於有多個MapReduce作業組成,每個作業都會從HDFS上讀取一次資料和寫一次資料(預設寫三份),即使這些MapReduce作業產生的資料是中間資料也需要寫HDFS。這種表達作業依賴關係的方式比較低效,會浪費大量不必要的磁碟和網路IO,根本原因是作業之間產生的資料不是直接流動的,而是藉助HDFS作為共享資料儲存系統。
————————————————
原文連結:https://blog.csdn.net/xiaokaiabcde/article/details/103030363
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69949806/viewspace-2904565/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- hadoop和spark的區別HadoopSpark
- 如何掌握Spark和Hadoop的架構SparkHadoop架構
- SOA架構和微服務架構的區別架構微服務
- H5架構和原生架構的區別H5架構
- SOA架構和微服務架構的區別是什麼?架構微服務
- Spark TempView和GlobalTempView的區別SparkView
- [架構設計] 元件和模組的區別架構元件
- LNMP架構與LNAMP架構的區別LNMP架構
- bs架構與cs架構的區別架構
- 求救,架構和框架什麼區別?架構框架
- java架構-執行緒和程式的區別Java架構執行緒
- hadoop1.0 和 Hadoop 2.0 的區別Hadoop
- 你和架構師的的區別是什麼?架構
- 超融合架構與傳統IT架構的區別架構
- X86架構與ARM架構的區別:架構
- Spark Streaming和Flink的區別Spark
- 全棧工程師和架構師的區別全棧工程師架構
- spark基礎之spark sql執行原理和架構SparkSQL架構
- 大資料架構師必讀:常見的七種Hadoop和Spark專案案例大資料架構HadoopSpark
- Hadoop的架構模型Hadoop架構模型
- 介面、資料結構、資訊架構的區別資料結構架構
- Hadoop 和 GBase 8a 的區別Hadoop
- 《openstack 和hadoop的區別是什麼?》Hadoop
- 四大CPU架構的區別架構
- 【架構與設計】常見微服務分層架構的區別和落地實踐架構微服務
- MPP與Hadoop,兩種主流大資料系統架構有啥區別?Hadoop大資料架構
- Spark資料收藏--------Spark執行架構Spark架構
- Hadoop YARN 架構HadoopYarn架構
- NUMA,MPP和HADOOP的區別與聯絡Hadoop
- 一文讀懂Hadoop、HBase、Hive、Spark分散式系統架構HadoopHiveSpark分散式架構
- net三層架構與MVC的區別架構MVC
- MVC與三層架構區別MVC架構
- 12-factor應用和微服務架構應用的區別微服務架構
- 帶有Apache Spark的Lambda架構ApacheSpark架構
- Spark 外部變數和BroadCast變數的區別Spark變數AST
- Hadoop的HDFS架構入門Hadoop架構
- 架構師與程式設計師的區別架構程式設計師
- 程式設計師與架構師的區別程式設計師架構