SparkSQL開窗函式
row_number()開窗函式
其實就是給每個分組的資料,按照其排序的順序,打上一個分組內的行號
比如說,有一個分組date = 20151001,裡面有三條資料,1122,1121,1124,
那麼對這個分組的每一行使用row_number()開窗函式以後,三行,依次會獲得組內的行號
行號從1開始遞增,比如1122 1,1121 2,1123 3
row_number()開窗函式的語法說明
首先可以,在SELECT查詢時,使用row_number函式,其次,row_number()函式後面先跟上OVER關鍵字
然後括號中,是PARTITION BY,也就是說根據哪個欄位進行分組
其次是可以用ORDER BY 進行組內排序,
然後row_number()就可以給每個組內的行,一個組內行號
row_number() OVER (PARTITION BY category ORDER BY revenue DESC) rank
DataFrame saleDF = hiveContext.sql("" + "SELECT product,category,revenue" + "FORM (" + "SELECT" + "project," + "category," + "revenue," + "row_number() OVER (PARTITION BY category ORDER BY revenue DESC) rank" + "FROM slaes" + ") tmp_sales" + "WHERE rank <=3");
//開窗函式的作用,其實就是,給每個分組的資料,按照排序順序,打上分組內的行號
相關文章
- SparkSQL 開窗函式SparkSQL函式
- SparkSql 06 開窗函式SparkSQL函式
- SparkSQL介紹並實現開窗函式SparkSQL函式
- Spark 開窗函式Spark函式
- 【Spark篇】---SparkSql之UDF函式和UDAF函式SparkSQL函式
- 開窗函式彙總函式
- Spark SQL 開窗函式SparkSQL函式
- Spark操作開窗函式Spark函式
- Oracle分析函式之開窗函式over()詳解Oracle函式
- SparkSQL -- 02 【SparkSQL檔案的讀取與落地,和Hive的整合,內建函式,自定義函式】SparkSQLHive函式
- leetcode 1082典型題 ,開窗函式LeetCode函式
- [clickhouse] Clickhouse之開窗函式篇函式
- Spark Streaming--開窗函式over()Spark函式
- 常用分析函式開窗講解函式
- 開窗函式的另外一種方式函式
- Oracle分析函式與視窗函式Oracle函式
- SQL 視窗函式SQL函式
- Mysql視窗函式MySql函式
- Hive視窗函式Hive函式
- PostgreSQL:視窗函式SQL函式
- hive視窗函式使用Hive函式
- Spark SQL學習——UDF、UDAF和開窗函式SparkSQL函式
- hive視窗分析函式使用詳解系列二之分組排序視窗函式Hive函式排序
- spark2.4.3 sparkSQL 使用者自定義函式筆記SparkSQL函式筆記
- MySQL視窗函式彙總MySql函式
- hive05_視窗函式Hive函式
- 與SQL視窗函式相同SQL函式
- PostgreSQL>視窗函式的用法SQL函式
- mysql視窗函式中的滑動視窗MySql函式
- SQL視窗分析函式使用詳解系列三之偏移量類視窗函式SQL函式
- GROUPBY 和開窗函式執行順序的問題函式
- MySQL視窗函式用法總結MySql函式
- MySQL 8.0 視窗函式-筆記MySql函式筆記
- Hive視窗函式保姆級教程Hive函式
- 詳解SQL操作的視窗函式SQL函式
- 通俗易懂:視窗函式 | 全是案例函式
- PostgreSQL 視窗函式 ( Window Functions ) 如何使用?SQL函式Function
- SQL輕鬆入門(5):視窗函式SQL函式