分散式Hadoop1.2.1叢集的安裝

freshairpeng發表於2014-03-20
安裝其實很簡單,把下載下來的Hadoop檔案拷貝到相應的目錄下,然後接壓縮即可,關鍵是先要安裝好JDK,前期的Linux要配置好。
下面我把我的操作過程記錄如下,供大家參考:

登入到HadoopSrv01機器上,進行如下操作:
1: su - grid
2: tar -xvf hadoop-1.2.1-bin.tar.gz
3: 解壓縮後,會在/home/grid目錄下 增加一個hadoop-1.2.1 目錄
4: cd hadoop-1.2.1 建立tmp目錄 mkdir tmp
5: cd conf目錄,對hadoop-env.sh, core-site.xml, hdfs-site.xml,mapred-site.xml ,masters,slaves檔案進行配置

6:修改hadoop-env.sh 檔案,只需要設定 export JAVA_HOME=/usr/java/jdk1.8.0 即可,其他不需要修改。
7:修改core-site.xml 檔案,增加以下內容

fs.default.name
hdfs://HadoopSrv01:9000


hadoop.tmp.dir
/home/grid/hadoop-1.2.1/tmp



8:修改hdfs-site.xml,根據你自己的datanode節點數,設定複製因子。


dfs.replication
2



9:修改mapred-site.xml檔案

mapred.job.tracker
HadoopSrv01:9001


10:修改masters,slaves 增加namenode,datanode節點配置。
masters:
HadoopSrv01
slaves:
HadoopSrv02
HadoopSrv03

以上操作完畢後,就可以對Hadoop叢集進行格式化,格式化的命令如下:

11: bin/hadoop namenode -format  記得要看清楚是否格式化成功

12:啟動叢集 bin/start-all.sh

13:檢查各個節點 後臺程式是否OK /usr/java/jdk1.8.0/bin/jps  正常應該包括以下後臺程式:

NameNode,JobTracker,DataNode,TaskTracker

如果以上都能看到,就說明Hadoop分散式環境已經搭建OK。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/14766526/viewspace-1125679/,如需轉載,請註明出處,否則將追究法律責任。

相關文章