SparkSQL 開窗函式

kieron_wei發表於2019-11-15

好用到不行的 [Spark] SQL開窗函式

To use window functions, users need to mark that a function is used as a window function by either
Adding an OVER clause after a supported function in SQL, e.g. avg(revenue) OVER (…); or
(SparkSQL) Calling the over method on a supported function in the DataFrame API, e.g. rank().over(…).

如: rank() over( partition by ... order by ... ) ranks

Ranking：

	rank -- 跳躍排序
	dense_rank -- 連續排序
	row_number
	percent_rank
	ntile 
	
	ntile(expr) over([partition_clause] order_by_clause) 
		可以看成是：它把有序的資料集合平均分配到指定的數量（expr）個桶中,將桶號分配給每一行。
		如果不能平均分配，則較小桶號的桶分配額外的行，並且各個桶中能放的行數最多相差1。
	
	使用rank() over()時，用nulls last將null值(null最大,避免在前面有null值)排在最後面。		  
		rank over(partition by empno order by sales desc nulls last)

aggregate：

	count
    max
    min
    sum
    avg
    
	少資料量時，如直接計算各部門當前月及累計銷售額：
	  select distinct 
	  		empno,month
	  		,sum(sales) over(partition by empno,month) sum_sales
	  		,sum(sales) over(partition by empno order by month) acc_sum_sales 
	  from Table

analytic：

	cume_dist
    first_value
    last_value
    lag
    lead

參考資料：

Introducing Window Functions in Spark SQL 可見連結: https://databricks.com/blog/2015/07/15/introducing-window-functions-in-spark-sql.html
[Oracle查詢優化改寫 技巧與案例 有教無類落落著]

SparkSQL開窗函式
2018-07-30
SparkSQL函式
SparkSql 06 開窗函式
2019-12-31
SparkSQL函式
SparkSQL介紹並實現開窗函式
2020-04-12
SparkSQL函式
Spark 開窗函式
2019-07-31
Spark函式
【Spark篇】---SparkSql之UDF函式和UDAF函式
2018-03-07
SparkSQL函式
Spark SQL 開窗函式
2020-03-23
SparkSQL函式
Spark操作開窗函式
2019-09-02
Spark函式
開窗函式彙總
2024-08-29
函式
Oracle分析函式之開窗函式over()詳解
2019-03-15
Oracle函式
SparkSQL -- 02 【SparkSQL檔案的讀取與落地，和Hive的整合，內建函式，自定義函式】
2020-11-25
SparkSQLHive函式
常用分析函式開窗講解
2018-06-13
函式
[clickhouse] Clickhouse之開窗函式篇
2024-05-24
函式
Spark Streaming--開窗函式over()
2019-01-02
Spark函式
leetcode 1082典型題，開窗函式
2024-08-20
LeetCode函式
開窗函式的另外一種方式
2024-08-18
函式
Oracle分析函式與視窗函式
2018-05-29
Oracle函式
Mysql視窗函式
2020-10-14
MySql函式
Hive視窗函式
2020-10-07
Hive函式
SQL 視窗函式
2022-03-28
SQL函式
PostgreSQL：視窗函式
2020-12-01
SQL函式
hive視窗函式使用
2020-09-24
Hive函式
Spark SQL學習——UDF、UDAF和開窗函式
2019-04-05
SparkSQL函式
hive視窗分析函式使用詳解系列二之分組排序視窗函式
2024-04-13
Hive函式排序
spark2.4.3 sparkSQL 使用者自定義函式筆記
2019-05-21
SparkSQL函式筆記
與SQL視窗函式相同
2018-12-03
SQL函式
PostgreSQL>視窗函式的用法
2018-07-22
SQL函式
MySQL視窗函式彙總
2024-09-27
MySql函式
hive05_視窗函式
2024-08-08
Hive函式
mysql視窗函式中的滑動視窗
2020-11-21
MySql函式
SQL視窗分析函式使用詳解系列三之偏移量類視窗函式
2024-04-26
SQL函式
GROUPBY 和開窗函式執行順序的問題
2024-09-13
函式
MySQL視窗函式用法總結
2024-05-14
MySql函式
MySQL 8.0 視窗函式-筆記
2020-04-29
MySql函式筆記
Hive視窗函式保姆級教程
2021-06-15
Hive函式
PostgreSQL 視窗函式 ( Window Functions ) 如何使用？
2019-07-17
SQL函式Function
詳解SQL操作的視窗函式
2022-05-27
SQL函式
通俗易懂：視窗函式 | 全是案例
2022-04-20
函式
MySQL視窗函式的具體使用TOCS
2022-03-01
MySql函式

SparkSQL 開窗函式

Ranking：

aggregate：

analytic：

相關文章