Hadoop是什麼?
適合大資料的分散式儲存和計算平臺,作者Doug Cutting ,受google三篇大資料論文啟發。 Google File System中文版 Google MapReduce中文版 Google Bigtable中文版
Hadoop生態系統
Hadoop的核心專案
HDFS: hadoop distributed file system 分散式檔案系統 MapReduce: 平行計算框架,基於檔案系統進行資料計算。
HDFS的架構
主從結構 主節點只有一個:namenode,從節點有很多個:datanodes. namenode負責接收使用者操作請求,維護檔案系統的目錄結構。管理檔案與block之間的關係,block與datanode之間的關係。 datanode負責儲存檔案,檔案被分割成block儲存在磁碟上。為保證資料安全,檔案會有多個副本。