SparkSQL 開窗函式
好用到不行的 [Spark] SQL開窗函式
-
To use window functions, users need to mark that a function is used as a window function by either
Adding an OVER clause after a supported function in SQL, e.g. avg(revenue) OVER (…); or
(SparkSQL) Calling the over method on a supported function in the DataFrame API, e.g. rank().over(…).如:
rank() over( partition by ... order by ... ) ranks
Ranking:
rank -- 跳躍排序
dense_rank -- 連續排序
row_number
percent_rank
ntile
ntile(expr) over([partition_clause] order_by_clause)
可以看成是:它把有序的資料集合平均分配到指定的數量(expr)個桶中,將桶號分配給每一行。
如果不能平均分配,則較小桶號的桶分配額外的行,並且各個桶中能放的行數最多相差1。
使用rank() over()時,用nulls last將null值(null最大,避免在前面有null值)排在最後面。
rank over(partition by empno order by sales desc nulls last)
aggregate:
count
max
min
sum
avg
少資料量時,如直接計算各部門當前月及累計銷售額:
select distinct
empno,month
,sum(sales) over(partition by empno,month) sum_sales
,sum(sales) over(partition by empno order by month) acc_sum_sales
from Table
analytic:
cume_dist
first_value
last_value
lag
lead
參考資料:
- Introducing Window Functions in Spark SQL 可見連結: https://databricks.com/blog/2015/07/15/introducing-window-functions-in-spark-sql.html
- [Oracle查詢優化改寫 技巧與案例 有教無類 落落 著]
相關文章
- SparkSQL開窗函式SparkSQL函式
- SparkSql 06 開窗函式SparkSQL函式
- SparkSQL---開窗函式(java)SparkSQL函式Java
- SparkSQL介紹並實現開窗函式SparkSQL函式
- 【Spark篇】---SparkSQL中自定義UDF和UDAF,開窗函式的應用SparkSQL函式
- Spark 開窗函式Spark函式
- 【Spark篇】---SparkSql之UDF函式和UDAF函式SparkSQL函式
- Spark SQL 開窗函式SparkSQL函式
- Spark操作開窗函式Spark函式
- 開窗函式彙總函式
- oracle的分析函式over 及開窗函式Oracle函式
- mysql實現開窗函式MySql函式
- SparkSQL -- 02 【SparkSQL檔案的讀取與落地,和Hive的整合,內建函式,自定義函式】SparkSQLHive函式
- Oracle分析函式之開窗函式over()詳解Oracle函式
- 常用分析函式開窗講解函式
- [clickhouse] Clickhouse之開窗函式篇函式
- oracle的分析函式over(Partition by...) 及開窗函式Oracle函式
- 視窗函式函式
- Spark Streaming--開窗函式over()Spark函式
- 語法:OVER(PARTITION BY)及開窗函式函式
- 開窗函式的另外一種方式函式
- Oracle分析函式與視窗函式Oracle函式
- PostgreSQL:視窗函式SQL函式
- SQL 視窗函式SQL函式
- Mysql視窗函式MySql函式
- Hive視窗函式Hive函式
- 【函式】oracle視窗函式over()的理解函式Oracle
- hive視窗函式使用Hive函式
- Spark SQL學習——UDF、UDAF和開窗函式SparkSQL函式
- mysql視窗函式中的滑動視窗MySql函式
- spark2.4.3 sparkSQL 使用者自定義函式筆記SparkSQL函式筆記
- hive視窗分析函式使用詳解系列二之分組排序視窗函式Hive函式排序
- (轉)Oracle語法之OVER(PARTITION BY)及開窗函式Oracle函式
- leetcode 1082典型題 ,開窗函式LeetCode函式
- 與SQL視窗函式相同SQL函式
- PostgreSQL>視窗函式的用法SQL函式
- MySQL視窗函式彙總MySql函式
- hive05_視窗函式Hive函式