SparkSQL---開窗函式（java）

Star-Technology發表於2017-08-11

package com.spark.sparksql.save;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.sql.DataFrame;
import org.apache.spark.sql.hive.HiveContext;

/*
 * 開窗函式
 */

public class RowNumberWindowFunction {

    public static void main(String[] args) {
        SparkConf conf = new SparkConf().setAppName("RowNumberWindowFunction");
        JavaSparkContext sc = new JavaSparkContext(conf);
        HiveContext hiveContext = new HiveContext(sc.sc());

        // 建立銷售額表，sales表
        hiveContext.sql("DROP TABLE IF EXISTS sales");
        hiveContext.sql("CREATE TABLE IF NOT EXISTS sales ("
                + "product STRING," + "category STRING," + "revenue BIGINT)");
        hiveContext.sql("LOAD DATA LOCAL INPATH '/usr/hadoopsoft/spark-1.6.0-bin-hadoop2.4/project/sales.txt' INTO TABLE sales");

        // 先說明一下，row_number()開窗函式，它的作用是什麼？
        // 其實，就是給每個分組的資料，按照其排序順序，打上一個分組內的行號！！！！
        // 比如說，有一個分組date=20160706，裡面看有3資料，11211，11212，11213
        // 那麼對這個分組的每一行使用row_number()開窗函式以後，這個三行會打上一個組內的行號！！！
        // 行號是從1開始遞增！！！ 比如最後結果就是 11211 1, 11212 2, 11213 3

        DataFrame top3SalesDF = hiveContext.sql("SELECT product, category, revenue "
                + "FROM ("
                + "SELECT "
                + "product, "
                + "category , "
                + "revenue, "
                + "row_number() OVER (PARTITION BY category ORDER BY revenue DESC) rank "
                + "FROM sales "
                + ") tmp_sales "
                + "WHERE rank <= 3");

        // 將每組排名前3的資料，儲存到一個表中
        hiveContext.sql("DROP TABLE IF EXISTS top3_sales");
        top3SalesDF.saveAsTable("top3_sales");

        sc.close();
    }
}

SparkSQL 開窗函式
2019-11-15
SparkSQL函式
Spark 開窗函式
2019-07-31
Spark函式
SparkSQL開窗函式
2018-07-30
SparkSQL函式
Spark SQL 開窗函式
2020-03-23
SparkSQL函式
SparkSql 06 開窗函式
2019-12-31
SparkSQL函式
Spark操作開窗函式
2019-09-02
Spark函式
開窗函式彙總
2024-08-29
函式
oracle的分析函式over 及開窗函式
2010-08-25
Oracle函式
mysql實現開窗函式
2016-08-06
MySql函式
Oracle分析函式之開窗函式over()詳解
2019-03-15
Oracle函式
常用分析函式開窗講解
2018-06-13
函式
[clickhouse] Clickhouse之開窗函式篇
2024-05-24
函式
oracle的分析函式over(Partition by...) 及開窗函式
2013-08-20
Oracle函式
視窗函式
2007-04-23
函式
Spark Streaming--開窗函式over()
2019-01-02
Spark函式
語法:OVER(PARTITION BY)及開窗函式
2014-06-30
函式
開窗函式的另外一種方式
2024-08-18
函式
Oracle分析函式與視窗函式
2018-05-29
Oracle函式
PostgreSQL：視窗函式
2020-12-01
SQL函式
SQL 視窗函式
2022-03-28
SQL函式
Mysql視窗函式
2020-10-14
MySql函式
Hive視窗函式
2020-10-07
Hive函式
SparkSQL介紹並實現開窗函式
2020-04-12
SparkSQL函式
【函式】oracle視窗函式over()的理解
2012-04-25
函式Oracle
hive視窗函式使用
2020-09-24
Hive函式
Spark SQL學習——UDF、UDAF和開窗函式
2019-04-05
SparkSQL函式
mysql視窗函式中的滑動視窗
2020-11-21
MySql函式
hive視窗分析函式使用詳解系列二之分組排序視窗函式
2024-04-13
Hive函式排序
(轉)Oracle語法之OVER(PARTITION BY)及開窗函式
2009-11-24
Oracle函式
leetcode 1082典型題，開窗函式
2024-08-20
LeetCode函式
與SQL視窗函式相同
2018-12-03
SQL函式
PostgreSQL>視窗函式的用法
2018-07-22
SQL函式
MySQL視窗函式彙總
2024-09-27
MySql函式
hive05_視窗函式
2024-08-08
Hive函式
Oracle 語法之 OVER (PARTITION BY ..) 及開窗函式轉載
2011-09-09
Oracle函式
GROUPBY 和開窗函式執行順序的問題
2024-09-13
函式
SQL視窗分析函式使用詳解系列三之偏移量類視窗函式
2024-04-26
SQL函式
MySQL 8.0 視窗函式-筆記
2020-04-29
MySql函式筆記

SparkSQL---開窗函式（java）

相關文章