SparkSql 06 開窗函式
row_number()
row_number() 開窗函式是按照某個欄位分組,然後取另一欄位的前幾個的值,相當於 分組取topN
開窗函式格式:
row_number() over (partitin by xxx order by xxx )
java程式碼示例:
SparkSession sparkSession = SparkSession
.builder()
.appName("window")
.master("local")
//開啟hive的支援,接下來就可以操作hive表了
// 前提需要是需要開啟hive metastore 服務
.enableHiveSupport()
.getOrCreate();
sparkSession.sql("use spark");
sparkSession.sql("drop table if exists sales");
sparkSession.sql("create table if not exists sales (riqi string,leibie string,jine Int) "
+ "row format delimited fields terminated by '\t'");
sparkSession.sql("load data local inpath '/root/test/sales' into table sales");
/**
* 開窗函式格式:
* 【 rou_number() over (partitin by XXX order by XXX) 】
*/
Dataset<Row> result = sparkSession.sql("select riqi,leibie,jine "
+ "from ("
+ "select riqi,leibie,jine,"
+ "row_number() over (partition by leibie order by jine desc) rank "
+ "from sales) t "
+ "where t.rank<=3");
result.show();
sparkSession.stop();
相關文章
- SparkSQL 開窗函式SparkSQL函式
- SparkSQL開窗函式SparkSQL函式
- SparkSQL介紹並實現開窗函式SparkSQL函式
- Spark 開窗函式Spark函式
- 【Spark篇】---SparkSql之UDF函式和UDAF函式SparkSQL函式
- 06 python開發之函式Python函式
- 開窗函式彙總函式
- Spark SQL 開窗函式SparkSQL函式
- Spark操作開窗函式Spark函式
- 06.函式函式
- 06函式宣告函式
- Oracle分析函式之開窗函式over()詳解Oracle函式
- SparkSQL -- 02 【SparkSQL檔案的讀取與落地,和Hive的整合,內建函式,自定義函式】SparkSQLHive函式
- leetcode 1082典型題 ,開窗函式LeetCode函式
- [clickhouse] Clickhouse之開窗函式篇函式
- Spark Streaming--開窗函式over()Spark函式
- 常用分析函式開窗講解函式
- 開窗函式的另外一種方式函式
- Oracle分析函式與視窗函式Oracle函式
- SQL 視窗函式SQL函式
- Mysql視窗函式MySql函式
- Hive視窗函式Hive函式
- PostgreSQL:視窗函式SQL函式
- hive視窗函式使用Hive函式
- Spark SQL學習——UDF、UDAF和開窗函式SparkSQL函式
- hive視窗分析函式使用詳解系列二之分組排序視窗函式Hive函式排序
- spark2.4.3 sparkSQL 使用者自定義函式筆記SparkSQL函式筆記
- MySQL視窗函式彙總MySql函式
- hive05_視窗函式Hive函式
- 與SQL視窗函式相同SQL函式
- PostgreSQL>視窗函式的用法SQL函式
- mysql視窗函式中的滑動視窗MySql函式
- Oracle OCP(06):通用函式和條件表示式Oracle函式
- SQL視窗分析函式使用詳解系列三之偏移量類視窗函式SQL函式
- GROUPBY 和開窗函式執行順序的問題函式
- MySQL視窗函式用法總結MySql函式
- MySQL 8.0 視窗函式-筆記MySql函式筆記
- Hive視窗函式保姆級教程Hive函式