mapreduce練習12 流量使用前10

@陌小軍發表於2020-10-07

1.FlowBean

import org.apache.hadoop.io.WritableComparable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

public class FlowBean implements WritableComparable<FlowBean> {
    private long upFlow;
    private long downFlow;
    private long sumFlow;

    @Override
    public String toString() {
        return upFlow + "\t" + downFlow + "\t" + sumFlow;
    }

    public long getUpFlow() {
        return upFlow;
    }

    public void setUpFlow(long upFlow) {
        this.upFlow = upFlow;
    }

    public long getDownFlow() {
        return downFlow;
    }

    public void setDownFlow(long downFlow) {
        this.downFlow = downFlow;
    }

    public long getSumFlow() {
        return sumFlow;
    }

    public void setSumFlow(long sumFlow) {
        this.sumFlow = sumFlow;
    }

    @Override
    public int compareTo(FlowBean o) { //比較  逆序,按照降序排列
        return Long.compare(o.sumFlow, this.sumFlow);
    }

    @Override
    public void write(DataOutput out) throws IOException {
        out.writeLong(upFlow);
        out.writeLong(downFlow);
        out.writeLong(sumFlow);
    }

    @Override
    public void readFields(DataInput in) throws IOException {
        this.upFlow = in.readLong();
        this.downFlow = in.readLong();
        this.sumFlow = in.readLong();
    }
}

2.FlowGroupingComparator

import org.apache.hadoop.io.WritableComparable;
import org.apache.hadoop.io.WritableComparator;

public class FlowGroupingComparator extends WritableComparator {
    protected FlowGroupingComparator() {
        super(FlowBean.class, true);
    }

    @Override
    public int compare(WritableComparable a, WritableComparable b) {
        return 0;  //返回0,讓所有資料都相等
    }
}

3.FlowMapper

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

public class FlowMapper extends Mapper<LongWritable, Text, FlowBean, Text> {

    private FlowBean k = new FlowBean();
    private Text v = new Text();

    //ctrl + o 重寫方法
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String[] fields = value.toString().split("\t");  //按照/t進行切分
        v.set(fields[0]);
        k.setUpFlow(Long.parseLong(fields[1]));
        k.setDownFlow(Long.parseLong(fields[2]));
        k.setSumFlow(Long.parseLong(fields[3]));

        context.write(k, v);
    }
}

4.FlowReducer

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;
import java.util.Iterator;

public class FlowReducer extends Reducer<FlowBean, Text, Text, FlowBean> {//輸入k,v,輸出k,v

    @Override
    protected void reduce(FlowBean key, Iterable<Text> values, Context context) throws IOException, InterruptedException {
        //獲取迭代器
        Iterator<Text> iterator = values.iterator();
        //取前十
        for (int i = 0; i < 10; i++) {
            context.write(iterator.next(), key);
        }
    }
}

5.FlowDriver

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;
import java.net.URI;

public class FlowDriver {
    public static void main(String[] args) throws Exception, ClassNotFoundException, InterruptedException {
        // 1 獲取配置資訊，或者job物件例項
        String int_path = "hdfs://gjh:9000/1702240034/output/part-r-00000";
        String out_path = "hdfs://gjh:9000/1702240034/output_top10";
        Configuration conf = new Configuration();
        FileSystem fs = FileSystem.get(new URI(int_path), conf);
        if (fs.exists(new Path(out_path))) {
            fs.delete(new Path(out_path), true);
        }
        Job job = Job.getInstance(conf);

        //指定本程式的jar包所在的本地路徑
        job.setJarByClass(FlowDriver.class);
        //指定本業務job要使用的mapper/Reducer業務類
        job.setMapperClass(FlowMapper.class);
        job.setReducerClass(FlowReducer.class);

        job.setGroupingComparatorClass(FlowGroupingComparator.class);
        //指定mapper輸出資料的kv型別
        job.setMapOutputKeyClass(FlowBean.class);
        job.setMapOutputValueClass(Text.class);
        //指定最終輸出的資料的kv型別
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(FlowBean.class);
        //指定job的輸入原始檔案所在目錄
        FileInputFormat.setInputPaths(job, new Path(int_path));
        FileOutputFormat.setOutputPath(job, new Path(out_path));
        //將job中配置的相關引數,以及job所用的java類所在的jar包,提交給yarn去執行
        boolean b = job.waitForCompletion(true);
        System.exit(b ? 0 : 1);
    }
}

6.

在這裡插入圖片描述

mapreduce練習11 倒排索引
2020-10-07
索引
2020/12/12練習
2020-12-12
mapreduce 練習13 找出部落格共同好友
2020-10-07
markdown 使用練習練習
2021-09-09
(前++) 和 (後++)的練習題
2024-05-06
Hadoop學習——MapReduce
2019-04-06
Hadoop
U7-11課綜合練習+12課階段測評練習——複習練習題目
2024-07-12
python練習 2020/10/13
2020-10-13
Python
笨辦法學C 練習12：If，Else If，Else
2019-05-10
2020-12-21 練習中的錯誤
2020-12-21
MapReduce框架-Join的使用
2021-08-13
框架
使用MapReduce執行WordCount案例
2020-07-15
javascript學習筆記--元字元使用練習
2018-11-20
JavaScript筆記字元
[Hive]呼叫本地模式，避免使用MapReduce
2018-08-14
Hive模式
Hadoop學習（二）——MapReduce\Yarn架構
2019-02-20
HadoopYarn架構
10. 建立管理表課後練習
2024-05-29
新手練習：Python練習題目
2019-04-11
Python
第 10 節：複合型別小練習！
2019-12-03
型別
使用者及使用者組管理使用的練習
2018-03-18
12項提高自我意識的練習並附有美好解決方案
2018-12-13
12.第四章直言三段論練習題
2024-09-09
MYSQL練習1: DQL查詢練習
2024-03-09
MySql
網站流量前SEO需要思考哪些問題？
2020-09-28
網站
Hadoop 學習系列（四）之 MapReduce 原理講解
2019-03-04
Hadoop
如何在MapReduce中使用SequenceFile資料格式？
2018-09-19
如何在MapReduce中使用Avro資料格式？
2018-09-21
VR
牛客小白月賽95 (賽前的練習之我是小菜雞)
2024-05-31
野生前端的資料結構練習（12）貪心演算法
2021-09-09
前端資料結構演算法
實驗12-使用keras預訓練模型完成貓狗識別
2024-04-27
Keras模型
MapReduce理解
2024-11-02
Google News被爆大肆消耗流量使用者一覺睡醒用了12GB
2018-10-24
Go
python練習
2018-09-25
Python
MySQL練習
2024-04-30
MySql
ddl練習
2024-05-26
latex練習
2024-10-18
MySQ練習
2024-06-08
openGauss練習
2024-11-01
Hadoop學習第四天--MapReduce提交過程
2024-08-10
Hadoop

mapreduce練習12 流量使用前10

1.FlowBean

2.FlowGroupingComparator

3.FlowMapper

4.FlowReducer

5.FlowDriver

6.

相關文章