Spark 開窗函式
row_number() 開窗函式是按照某個欄位分組,然後取另一欄位的前幾個的值,相當於 分組取topN
如果SQL語句裡面使用到了開窗函式,那麼這個SQL語句必須使用HiveContext來執行,HiveContext預設情況下在本地無法建立。在MySql8之後也增加了開窗函式。
開窗函式格式:
row_number() over (partitin by XXX order by XXX)
val spark = SparkSession.builder()
.appName("window")
.enableHiveSupport()
.getOrCreate()
spark.sql("use spark")//使用spark庫
//建立sales表
spark.sql("create table if not exists sales(date String,type String,price Int) row format delimited fields terminated by '\t'")
//載入本地資料到sales表中
spark.sql("load data local inpath '/root/sales' into table sales")
//按照type分組,按照價格排序
val result = spark.sql("select date,type,price from (select date,type,price,row_number() over (partition by type order by price desc) rank from sales) t where t.rank<=3")
result.write.mode(SaveMode.Append).saveAsTable("salesResult")
result.show(100)
相關文章
- Spark SQL 開窗函式SparkSQL函式
- Spark操作開窗函式Spark函式
- Spark Streaming--開窗函式over()Spark函式
- Spark SQL學習——UDF、UDAF和開窗函式SparkSQL函式
- SparkSQL 開窗函式SparkSQL函式
- SparkSQL開窗函式SparkSQL函式
- SparkSql 06 開窗函式SparkSQL函式
- 開窗函式彙總函式
- 【Spark篇】---SparkSQL中自定義UDF和UDAF,開窗函式的應用SparkSQL函式
- oracle的分析函式over 及開窗函式Oracle函式
- mysql實現開窗函式MySql函式
- SparkSQL---開窗函式(java)SparkSQL函式Java
- Oracle分析函式之開窗函式over()詳解Oracle函式
- 常用分析函式開窗講解函式
- [clickhouse] Clickhouse之開窗函式篇函式
- oracle的分析函式over(Partition by...) 及開窗函式Oracle函式
- 視窗函式函式
- Spark Graphx常用函式Spark函式
- Spark Sql 函式使用SparkSQL函式
- 語法:OVER(PARTITION BY)及開窗函式函式
- 開窗函式的另外一種方式函式
- Oracle分析函式與視窗函式Oracle函式
- PostgreSQL:視窗函式SQL函式
- SQL 視窗函式SQL函式
- Mysql視窗函式MySql函式
- Hive視窗函式Hive函式
- SparkSQL介紹並實現開窗函式SparkSQL函式
- spark aggregate函式Spark函式
- 【函式】oracle視窗函式over()的理解函式Oracle
- 【Spark篇】---SparkSql之UDF函式和UDAF函式SparkSQL函式
- hive視窗函式使用Hive函式
- Spark 系列(十一)—— Spark SQL 聚合函式 AggregationsSparkSQL函式
- Spark aggregateByKey函式Spark函式
- mysql視窗函式中的滑動視窗MySql函式
- hive視窗分析函式使用詳解系列二之分組排序視窗函式Hive函式排序
- (轉)Oracle語法之OVER(PARTITION BY)及開窗函式Oracle函式
- leetcode 1082典型題 ,開窗函式LeetCode函式
- 與SQL視窗函式相同SQL函式