Hadoop大家庭有哪些?Hadoop家族主要成員關係

shenmanli發表於2017-07-10
Common
一組由分散式檔案系統和通用I/O的元件與介面(序列化, Java RPC, 持久化資料結構)。


Avro
一種支援高效、跨語言的RPC以及永久化儲存資料的序列化系統。


MapReduce
分散式資料處理模型和執行環境,執行於大型的商用機叢集。


HDFS
分散式檔案系統,執行於大型的商用機叢集。


Pig
一種資料流語言和執行環境,用以檢索非常大的資料集。 Pig 執行在HDFS 和MapReduceclusters上。


Hive


分散式的,按列儲存的資料倉儲。 Hive 管理儲存在HDFS 的資料,並提供基於SQL的查詢語句(執行時候,引擎翻譯成MapReduce作業) 以查詢資料。


HBase


一個分散式的,按列儲存的資料庫HBase使用HDFS 作為底層儲存,同時支援MapReduce的批量計算和點查詢(隨機即讀取)。


ZooKeeper


一個分散式的高可用性的協調服務。 ZooKeeper提供分散式鎖之類的基本服務,用於構建分散式應用。


Sqoop


在資料庫和HDFS之間高效資料傳輸工具。


Oozie


Oozie是Hadoop提供的一個工作流系統。


Hadoop家族主要成員關係

相關文章