Spark相對於Hadoop有哪些優勢?
Spark是UC Berkeley AMP lab所開源的類Hadoop MapReduce的通用的平行計算框架,是一個基於記憶體計算的開源的叢集計算系統,目的是讓資料分析更加快速,Spark是一種與Hadoop相似的開源叢集計算環境,Spark基於map reduce演算法實現的分散式計算,擁有Hadoop MapReduce所具有的優點;
但不同於MapReduce的是Job中間輸出結果可以儲存在記憶體中,從而不再需要讀寫HDFS,因此Spark能更好地適用於資料探勘與機器學習等需要迭代的map reduce的演算法。
相對於Hadoop,它主要有以下優勢:
但不同於MapReduce的是Job中間輸出結果可以儲存在記憶體中,從而不再需要讀寫HDFS,因此Spark能更好地適用於資料探勘與機器學習等需要迭代的map reduce的演算法。
相對於Hadoop,它主要有以下優勢:
- 啟用了記憶體分佈資料集,除了能夠提供互動式查詢外,它還可以最佳化迭代工作負載。
- 提供了高的效能和大資料處理能力,使得使用者可以快速得到反饋體驗更好。
- 提供的資料集操作型別有很多種,不像Hadoop只提供了Map和Reduce兩種操作。
- 出色的支援Interactive Query、流計算、圖計算等。
- 在機器學習方面有著無與倫比的優勢,特別適合需要多次迭代計算的演算法。
- 擁有非常出色的容錯和排程機制,確保系統的穩定執行。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15498/viewspace-2123630/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料Storm相比於Spark、Hadoop有哪些優勢(摘錄)大資料ORMSparkHadoop
- HTML5相對於HTML4有哪些優勢?HTML
- 相對於其他技術而言,雲端計算有哪些相對的優勢?
- 獨立主機相對於其他網站空間的優勢有哪些?網站
- Spark與Hadoop MapReduce相比,有哪些優點你知道嗎?SparkHadoop
- 【hadoop/Spark】相關命令HadoopSpark
- Python相較於Java而言,有什麼優勢?PythonJava
- DevSecOps優勢有哪些dev
- 容器相對於虛擬機器在儲存方面的優勢有那些?虛擬機
- 聚合支付,對商戶而言的優勢有哪些?
- 容器雲有哪些特點?有哪些優勢?
- 學Python有哪些優勢Python
- 夜遊對旅遊行業的有哪些優勢行業
- 無程式碼相對於低程式碼的優勢分析
- 品牌&域名息息相關,在GoDaddy申請域名有哪些優勢?Go
- Hadoop大資料平臺有何優勢?Hadoop大資料
- 一對一直播系統原始碼有哪些優勢原始碼
- 公有云服務對比IDC服務,有哪些優勢?
- go語言有哪些優勢Go
- Redis相比Memcached有哪些優勢?Redis
- 學習Python有哪些優勢Python
- 獨享ip有哪些優勢?
- 與IPv4相比,IPv6具有哪些優勢?
- 區塊鏈點對點交易系統的優勢有哪些?區塊鏈
- dble簡介及相對於MyCAT的優勢方面的介紹
- 企業雲盤有哪些優勢
- 註冊瑞士公司有哪些優勢?
- 大資料渠道有哪些優勢大資料
- 使用雲服務有哪些優勢?
- 住宅代理IP的優勢有哪些?
- WebSocket有什麼優勢?有哪些特點?Web
- Hadoop/Spark相關面試問題總結HadoopSpark面試
- RunnerGo相較於Jmeter優劣勢分析GoJMeter
- 美元穩定幣有哪些優勢和劣勢?
- 大資料框架對比 - Hadoop、Spark、Storm、Samza、Spark、Flink大資料框架HadoopSparkORM
- 線上教育培訓系統對教育行業有哪些優勢行業
- hadoop不同版本有哪些Hadoop
- 雲伺服器 ECS 有哪些優勢?伺服器
- APP內測分發有哪些優勢?APP