Linux下安裝Hadoop 詳解及WordCount執行
單機配置環境如下:
Hadoop(3.1.1)安裝包
JDK1.8.0_231安裝包
Centos -Linux系統環境
使用ssh進行本地免密登入
ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys
chmod 755 ~/.ssh/authorized_key
登入成功:
安裝並配置JDK
tar -zxvf jdk-8u231-linux-x64.tar.gz
mkdir /usr/loca/java
cp jdk1.8.0_231 /usr/local/java/
vim /etc/profile
export JAVA_HOME=/usr/local/java/jdk1.8.0_231/
export PATH=$JAVA_HOME/bin:$PATH
java -version
解壓縮Hadoop安裝包
tar -zxvf FusionInsight-Hadoop-3.1.1.tar.gz
解壓縮後出現hadoop的資料夾
配置Hadoop環境變數
export HADOOP_HOME=/home/lhh/hive/hadoop/
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
建立機器名字
vim /etc/hostname
vim /etc/hosts
hostname hadoop-01
重啟伺服器,修改生效
配置Hadoop中的相應檔案
./hadoop/etc/hadoop/hadoop-env.sh、core-site.xml、mapred-site.xml、hdfs-site.xml、yarn-site.xml
./hadoop/sbin/start-dfs.sh、stop-dfs.sh、start-yarn.sh、stop-yarn.sh
新建hadoop-env.sh配置如下:
export JAVA_HOME=/usr/local/java/jdk1.8.0_231/
注意:hadoop-3.1.1版本需要手動建立該檔案
core-site.xml配置如下:
<configuration> <property> <name>hadoop.tmp.dir</name> <value>/home/lhh/hive/tmp</value> <description>Abase for other temporary directories.</description> </property> <property> <name>fs.defaultFS</name> <value>hdfs://hadoop-01:9000</value> </property> <property> <name>hadoop.proxyuser.root.hosts</name> <value>*</value> </property> <property> <name>hadoop.proxyuser.root.groups</name> <value>*</value> </property> </configuration>
mapred-site.xml配置如下:
<configuration> <property> <name>mapred.job.tracker</name> <value>hadoop-1:9001</value> </property> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
hdfs-site.xml配置如下:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/home/lhh/hive/tmp/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/home/lhh/hive/tmp/dfs/data</value> </property> </configuration>
yarn-site.xml配置檔案如下:
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>hadoop-01</value> </property> <property> <name>yarn.nodemanager.env-whitelist</name> <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME,HADOOP_HOME,PATH,LANG,TZ</value> </property> </configuration>
8.執行Hadoop
在解壓後的hadoop目錄下使用如下命令:
./bin/hdfs namenode -format
開啟NameNode、DataNode等守護程式
./sbin/start-all.sh
./sbin/mr-jobhistory-daemon.sh start historyserver
檢視程式資訊
檢視Web UI
lsof -i:9870
檢視埠是否被監聽,在網頁輸入如下網址:
9.執行WordCount
1)本地建立test.txt檔案
2)在HDFS新建一個資料夾,用於上傳測試檔案
./bin/hdfs dfs -mkdir /test
3)將本地text.txt上傳到test目錄中
./bin/hdfs dfs -put /home/lhh/hive/test.txt /test
4)執行WordCount
./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.1-hw-ei-302005.jar wordcount /test/test.txt /test/out
5)檢視結果
./bin/hadoop fs -cat /test/out/part-r-00000
9.hadoop2.x/3.x常用埠號覽表
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69978904/viewspace-2733652/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Linux下安裝hive 詳解及HiveSQL執行LinuxHiveSQL
- hadoop 0.20.2偽分散式安裝詳解Hadoop分散式
- Hadoop-2.6.0-cdh5.7.0安裝詳解HadoopH5
- linux(centos 7)下安裝JDK,Tomcat,mysql 執行Maven 專案(最詳細)LinuxCentOSJDKTomcatMySqlMaven
- Linux下安裝java及配置(yum安裝)LinuxJava
- 詳解Linux(Centos)之安裝Nginx及注意事項LinuxCentOSNginx
- hadoop學習筆記:執行wordcount對檔案字串進行統計案例Hadoop筆記字串
- 【轉載】Linux下徹底解除安裝mysql詳解LinuxMySql
- 使用MapReduce執行WordCount案例
- 簡單安裝PHP在Linux下的執行環境PHPLinux
- linux 安裝dotnet 8.0執行時Linux
- JMeter:Linux上安裝&執行JMeterJMeterLinux
- windows下安裝部署 hadoopWindowsHadoop
- python juypter 安裝及執行.ipynbPython
- Linux下的crontab定時執行任務命令詳解Linux
- 零基礎入門Hadoop:IntelliJ IDEA遠端連線伺服器中Hadoop執行WordCountHadoopIntelliJIdea伺服器
- Docker介紹及安裝詳解Docker
- Apache官網下載ant軟體包及安裝詳解Apache
- Fedora下FCITX輸入法安裝及問題排查解決詳解
- Docker的安裝配置及使用詳解Docker
- Intellij IDEA 安裝lombok及使用詳解IntelliJIdeaLombok
- Linux下安裝JDK及環境設定LinuxJDK
- .Net for Spark 實現 WordCount 應用及除錯入坑詳解Spark除錯
- centos7 (阿里雲、linux) 單機spark的安裝與配置詳解(jdk安裝與配置,scala安裝與配置,hadoop安裝與配置,spark安裝與配置)CentOS阿里LinuxSparkJDKHadoop
- Linux下nginx編譯安裝教程和編譯引數詳解LinuxNginx編譯
- 如何在LInux上安裝並執行JenkinsLinuxJenkins
- Windows 10下Hadoop 3.2.2 安裝指南WindowsHadoop
- Hadoop一鍵下載安裝包Hadoop
- Ubuntu下 hadoop的安裝與配置UbuntuHadoop
- Linux下安裝與使用MySQL詳細介紹LinuxMySql
- 詳解Linux下Nginx+Tomcat整合的安裝與配置的步驟LinuxNginxTomcat
- AWS Cloud9 下安裝執行 LaravelCloudLaravel
- linux下安裝snap安裝工具Linux
- linux虛擬機器執行機必安裝Linux虛擬機
- 自學linux——1.VMware的安裝及VM下centos的安裝LinuxCentOS
- 大資料學習筆記之Hadoop安裝步驟詳解大資料筆記Hadoop
- .NET程式執行原理及基本概念詳解
- Java—執行緒的生命週期及執行緒控制方法詳解Java執行緒