hadoop window 遠端提交job到叢集並執行

我就是曹總發表於2019-05-11

原文網址 : http://80iter.com/blog/1450700068151583

1.複製Hadoop的4個配置檔案放到src目錄下面：core-site.xml,hdfs-site.xml,log4j.properties,mapred-site.xml,yarn-site.xml

2.配置mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapred.remote.os</name>
        <value>Linux</value>
    </property>
    <property>
        <name>mapreduce.app-submission.cross-platform</name>
        <value>true</value>
    </property>
    <property>
    <name>mapreduce.application.classpath</name>
    <value>
        /opt/hadoop-2.6.0/etc/hadoop,
        /opt/hadoop-2.6.0/share/hadoop/common/*,
        /opt/hadoop-2.6.0/share/hadoop/common/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/hdfs/*,
        /opt/hadoop-2.6.0/share/hadoop/hdfs/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/mapreduce/*,
        /opt/hadoop-2.6.0/share/hadoop/mapreduce/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/yarn/*,
        /opt/hadoop-2.6.0/share/hadoop/yarn/lib/*
    </value>
</property>    
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>master:10020</value>
    </property>
       <property>
                <name>mapreduce.jobhistory.webapp.address</name>
                <value>master:19888</value>
        </property>
</configuration>

注意mapreduce.application.classpath一定是絕對路徑，不要搞什麼$HADOOP_HOME,我這裡反正是報錯的

3：修改yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
  <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>master:8032</value>
    </property>
<property>
    <name>yarn.application.classpath</name>
    <value>
        /opt/hadoop-2.6.0/etc/hadoop,
        /opt/hadoop-2.6.0/share/hadoop/common/*,
        /opt/hadoop-2.6.0/share/hadoop/common/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/hdfs/*,
        /opt/hadoop-2.6.0/share/hadoop/hdfs/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/mapreduce/*,
        /opt/hadoop-2.6.0/share/hadoop/mapreduce/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/yarn/*,
        /opt/hadoop-2.6.0/share/hadoop/yarn/lib/*
    </value>
  </property>
</configuration>

注意yarn.application.classpath一定是絕對路徑，不要搞什麼$HADOOP_HOME

4:看下我的程式碼

package com.gaoxing.hadoop;

import java.io.IOException;
import java.security.PrivilegedExceptionAction;
import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.security.UserGroupInformation;
import org.apache.hadoop.util.GenericOptionsParser;

public class WordCount {
    //繼承mapper介面，設定map的輸入型別為<Object,Text>
    //輸出型別為<Text,IntWritable>
    public static class Map extends Mapper<Object,Text,Text,IntWritable>{
        //one表示單詞出現一次
        private static IntWritable one = new IntWritable(1);
        //word儲存切下的單詞
        private Text word = new Text();
        public void map(Object key,Text value,Context context) throws IOException,InterruptedException{
            //對輸入的行切詞
            StringTokenizer st = new StringTokenizer(value.toString());
            while(st.hasMoreTokens()){
                word.set(st.nextToken());//切下的單詞存入word
                context.write(word, one);
            }
        }
    }
    //繼承reducer介面，設定reduce的輸入型別<Text,IntWritable>
    //輸出型別為<Text,IntWritable>
    public static class Reduce extends Reducer<Text,IntWritable,Text,IntWritable>{
        //result記錄單詞的頻數
        private static IntWritable result = new IntWritable();
        public void reduce(Text key,Iterable<IntWritable> values,Context context) throws IOException,InterruptedException{
            int sum = 0;
            //對獲取的<key,value-list>計算value的和
            for(IntWritable val:values){
                sum += val.get();
            }
            //將頻數設定到result
            result.set(sum);
            //收集結果
            context.write(key, result);
        }
    }
    /**
     * @param args
     */
    public static void main(String[] args) throws Exception{
        Configuration conf = new Configuration();
       // conf.set("mapred.remote.os","Linux");
       // conf.set("yarn.resourcemanager.address","master:8032");
       // conf.set("mapreduce.framework.name","yarn");
        conf.set("mapred.jar","D:\\IdeaProjects\\hadooplearn\\out\\artifacts\\hadoo.jar");
        //conf.set("mapreduce.app-submission.cross-platform","true");
        Job job = Job.getInstance(conf);
        job.setJobName("test");
        //配置作業各個類
        job.setJarByClass(WordCount.class);
        job.setMapperClass(Map.class);
        job.setCombinerClass(Reduce.class);
        job.setReducerClass(Reduce.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        FileInputFormat.addInputPath(job, new Path("hdfs://master:9000/tmp/hbase-env.sh"));
        FileOutputFormat.setOutputPath(job, new Path("hdfs://master:9000/tmp/out11"));
        System.exit(job.waitForCompletion(true) ? 0 : 1);
    }

}

conf.set("mapred.jar","D:\\IdeaProjects\\hadooplearn\\out\\artifacts\\hadoo.jar");這是最重要的一句，不然會報上面第4個問題

由我就是曹總最後編輯於：4年前

內容均為作者獨立觀點，不代表八零IT人立場，如涉及侵權，請及時告知。

Hadoop-叢集執行
2022-04-04
Hadoop
Docker中提交任務到Spark叢集
2020-07-03
DockerSpark
IDEA本地執行hadoop程式成功，叢集執行找不到自定義的Mapper類
2020-12-30
IdeaHadoopAPP
利用遠端桌面管理winserver叢集
2020-11-11
Server
Hadoop搭建叢集
2018-06-26
Hadoop
Hadoop叢集搭建
2023-02-21
Hadoop
idea配置dashboard並原始碼啟動叢集執行nacos
2020-12-21
Idea原始碼
4.4 Hadoop叢集搭建
2018-11-15
Hadoop
Hadoop叢集搭建（一）
2020-10-02
Hadoop
五行命令使用docker搭建hadoop叢集
2018-10-26
DockerHadoop
window遠端開機
2024-03-21
ClusterShell：一個在叢集節點上並行執行命令的好工具
2019-07-26
並行
使用docker部署hadoop叢集
2020-09-04
DockerHadoop
Hadoop叢集面試題
2021-12-23
Hadoop面試題
hadoop分散式叢集搭建
2021-03-04
Hadoop分散式
零基礎入門Hadoop：IntelliJ IDEA遠端連線伺服器中Hadoop執行WordCount
2024-11-16
HadoopIntelliJIdea伺服器
[20221018]本地執行與遠端執行.txt
2022-10-20
job任務均不執行，手工執行報job now running
2024-01-17
Meterpreter生成被控端並進行遠端控制
2024-10-29
xcall叢集執行命令指令碼
2018-11-04
指令碼
Spark叢集和任務執行
2020-11-06
Spark
Jmeter(四十四) - 從入門到精通高階篇 - Jmeter遠端啟動（本地執行+遠端執行）（詳解教程）
2021-05-21
JMeter
Go實現ssh執行遠端命令及遠端終端
2020-12-20
Go
Hadoop分散式叢集搭建_1
2018-05-17
Hadoop分散式
hadoop叢集配置和啟動
2024-05-11
Hadoop
Hadoop叢集常用命令
2019-02-20
Hadoop
Linux部署hadoop2.7.7叢集
2022-08-15
LinuxHadoop
Hadoop完全分散式叢集配置
2021-05-01
Hadoop分散式
Hadoop HA叢集簡單搭建
2020-12-26
Hadoop
window遠端桌面出現CredSSP
2024-07-03
安裝 Hadoop：設定單節點 Hadoop 叢集
2021-12-29
Hadoop
2. TeraSort在Hadoop分散式叢集中的執行
2020-06-11
Hadoop分散式
Pycharm連線遠端伺服器並編寫、執行python程式碼
2020-11-19
PyCharm伺服器Python
ThinkPHP遠端程式碼執行漏洞
2019-09-12
PHP
Apache SSI 遠端命令執行漏洞
2020-10-05
Apache
phpunit 遠端程式碼執行漏洞
2020-10-16
PHP
eclipse配置遠端執行環境
2018-03-05
Eclipse
大資料7.1 - hadoop叢集搭建
2018-04-09
大資料Hadoop

hadoop window 遠端提交job到叢集並執行

相關文章