hadoop概要
hadoop
hadoop 簡介:
hadoop是一個能夠對大量資料進行分散式處理的軟體框架,實現了google的MapReduce程式設計模型和框架,
把應用程式分割成效的工作單元,並把這些單元放到叢集節點上執行。
角色:
NameNode:
NameNode是HDFS守護程式,負責記錄檔案如何分割成資料塊的,以及這些資料塊分別被儲存在哪些資料節點上
主要功能:對記憶體及I/O進行集中管理
DataNode:
DataNode屬於叢集中的每個伺服器都執行的一個後臺程式,負責把HDFS資料塊讀寫到本地的檔案系統
Secondary NameNode:
Secondary NameNode使用者監控HDFS狀態的輔助後臺程式,做NameNode的備用
JobTracker:
JobTracker後臺程式用來連線應用程式與Hadoop。 每個Hadoop叢集只有一個JobTracker,一般執行在叢集的Master節點上
TaskTracker:
TaskTracker與負責儲存資料的DataNode結合,遵循主/從架構 每個節點上僅有唯一的一個TaskTracker
族群:
Hadoop子專案:
Hadoop Common: 屬於hadoop專案的核心部分,為Hadoop各子專案提供各種工具
HDFS: 提供高吞吐量訪問的分散式檔案系統 GFS的開源實現
MapReduce:大型資料的分散式並行程式設計模型和程式執行框架 google的MapReduce的開源實現
Hadoop相關專案:
AVRO:作為Hadoop的RPC(遠端過程呼叫模組),使Hadoop的RPC模組通訊速度更快,資料結構更緊湊
Cassandra:是一套開源分散式的NoSQLogic資料庫系統 Facebook開發 集google BigTable 的資料模型與Amazon Dynamo的完全分散式的架構於一身
Hama: 為科學計算提供一個機遇整體同步平行計算技術的分散式計算框架
HBase:Apache Hadoop專案,開源 基於列儲存模型的分散式資料庫
Hive:提供資料摘要和查詢功能的資料倉儲
Pig:是在MapReduce上構建的一種高階的資料流語言
ZooKeeper:用於解決分散式系統中一致性問題,是Chubby的開源實現
hadoop 簡介:
hadoop是一個能夠對大量資料進行分散式處理的軟體框架,實現了google的MapReduce程式設計模型和框架,
把應用程式分割成效的工作單元,並把這些單元放到叢集節點上執行。
角色:
NameNode:
NameNode是HDFS守護程式,負責記錄檔案如何分割成資料塊的,以及這些資料塊分別被儲存在哪些資料節點上
主要功能:對記憶體及I/O進行集中管理
DataNode:
DataNode屬於叢集中的每個伺服器都執行的一個後臺程式,負責把HDFS資料塊讀寫到本地的檔案系統
Secondary NameNode:
Secondary NameNode使用者監控HDFS狀態的輔助後臺程式,做NameNode的備用
JobTracker:
JobTracker後臺程式用來連線應用程式與Hadoop。 每個Hadoop叢集只有一個JobTracker,一般執行在叢集的Master節點上
TaskTracker:
TaskTracker與負責儲存資料的DataNode結合,遵循主/從架構 每個節點上僅有唯一的一個TaskTracker
族群:
Hadoop子專案:
Hadoop Common: 屬於hadoop專案的核心部分,為Hadoop各子專案提供各種工具
HDFS: 提供高吞吐量訪問的分散式檔案系統 GFS的開源實現
MapReduce:大型資料的分散式並行程式設計模型和程式執行框架 google的MapReduce的開源實現
Hadoop相關專案:
AVRO:作為Hadoop的RPC(遠端過程呼叫模組),使Hadoop的RPC模組通訊速度更快,資料結構更緊湊
Cassandra:是一套開源分散式的NoSQLogic資料庫系統 Facebook開發 集google BigTable 的資料模型與Amazon Dynamo的完全分散式的架構於一身
Hama: 為科學計算提供一個機遇整體同步平行計算技術的分散式計算框架
HBase:Apache Hadoop專案,開源 基於列儲存模型的分散式資料庫
Hive:提供資料摘要和查詢功能的資料倉儲
Pig:是在MapReduce上構建的一種高階的資料流語言
ZooKeeper:用於解決分散式系統中一致性問題,是Chubby的開源實現
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/26613085/viewspace-1128915/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- css概要CSS
- ExecutorService介面概要
- Redux 概要教程Redux
- Promise物件概要Promise物件
- MyBatis sqlSession概要梳理MyBatisSQLSession
- 手寫SpringMvc概要SpringMVC
- IPSec組播概要
- 快取模式概要快取模式
- 軟體測試概要
- ORACLE 概要檔案管理Oracle
- 編譯系統概要編譯
- SQLT 概要和安裝SQL
- C++知識概要C++
- Easysearch 效能測試方法概要
- ChatGPT的終極指南概要ChatGPT
- Android 元件化架構概要Android元件化架構
- 關係型資料庫概要資料庫
- Java——事件處理機制概要Java事件
- 軟體概要設計文件(終)
- 各廠商人機互動概要
- AMD 規範與CMD 規範概要
- Spark-Shuffle過程概要參考Spark
- 遊戲伺服器架構概要遊戲伺服器架構
- 對Tomcat的簡單概要小結Tomcat
- 社交系統ThinkSNS+技術概要
- 社交系統 ThinkSNS+ 技術概要
- JVM系列(五):gc實現概要01JVMGC
- MySQL:Innodb表 Data free 的計算概要MySql
- AI概要設計文件評審實踐AI
- Oracle 12.2之後補丁RU RUR概要Oracle
- HadoopHadoop
- Hadoop演進與Hadoop生態Hadoop
- Hadoop - macOS 上編譯 Hadoop 3.2.1HadoopMac編譯
- MogDB 2.1.1 初始化引數概要說明
- 領域驅動設計(DDD)入門&概要
- Hadoop學習筆記——————1、Hadoop概述Hadoop筆記
- 【Hadoop篇04】Hadoop配置日誌聚集Hadoop
- Hadoop入門系列(2)-安裝HadoopHadoop
- Hadoop–HDFSHadoop