chatgpt生成的所有分析函式，感覺很好.

萌哥-爱学习發表於2024-09-05

原文網址 : https://www.cnblogs.com/mengbin0546/p/18399290

好的，我會列出Hive的主要分析函式，然後建立一個表並插入10條資料來演示這些函式的效果。

Hive的主要分析函式：

ROW_NUMBER()
RANK()
DENSE_RANK()
CUME_DIST()
PERCENT_RANK()
NTILE()
LAG()
LEAD()
FIRST_VALUE()
LAST_VALUE()

現在，讓我們建立一個表並插入資料：

-- 建立表
CREATE TABLE employees (
  id INT,
  name STRING,
  department STRING,
  salary INT
);

-- 插入資料
INSERT INTO employees VALUES 
  (1, 'Alice', 'HR', 50000),
  (2, 'Bob', 'Sales', 60000),
  (3, 'Charlie', 'Marketing', 55000),
  (4, 'David', 'IT', 65000),
  (5, 'Eve', 'HR', 52000),
  (6, 'Frank', 'Sales', 61000),
  (7, 'Grace', 'Marketing', 58000),
  (8, 'Henry', 'IT', 67000),
  (9, 'Ivy', 'HR', 53000),
  (10, 'Jack', 'Sales', 62000);

-- 使用分析函式的查詢
SELECT 
  id,
  name,
  department,
  salary,
  ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) as row_num,
  RANK() OVER (PARTITION BY department ORDER BY salary DESC) as rank,
  DENSE_RANK() OVER (PARTITION BY department ORDER BY salary DESC) as dense_rank,
  CUME_DIST() OVER (PARTITION BY department ORDER BY salary DESC) as cume_dist,
  PERCENT_RANK() OVER (PARTITION BY department ORDER BY salary DESC) as percent_rank,
  NTILE(2) OVER (PARTITION BY department ORDER BY salary DESC) as ntile,
  LAG(salary) OVER (PARTITION BY department ORDER BY salary DESC) as prev_salary,
  LEAD(salary) OVER (PARTITION BY department ORDER BY salary DESC) as next_salary,
  FIRST_VALUE(salary) OVER (PARTITION BY department ORDER BY salary DESC) as highest_salary,
  LAST_VALUE(salary) OVER (PARTITION BY department ORDER BY salary DESC 
    ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) as lowest_salary
FROM employees;

當然，我會為您展示查詢結果。請注意，這是一個模擬的結果，因為我無法實際執行Hive查詢。但這個結果準確反映了各個分析函式的預期行為。

```
id | name    | department | salary | row_num | rank | dense_rank | cume_dist | percent_rank | ntile | prev_salary | next_salary | highest_salary | lowest_salary
---+---------+------------+--------+---------+------+------------+-----------+--------------+-------+-------------+-------------+----------------+--------------
1  | Alice   | HR         | 50000  | 3       | 3    | 3          | 1.0       | 1.0          | 2     | 52000       | NULL        | 53000          | 50000
5  | Eve     | HR         | 52000  | 2       | 2    | 2          | 0.6667    | 0.5          | 1     | 53000       | 50000       | 53000          | 50000
9  | Ivy     | HR         | 53000  | 1       | 1    | 1          | 0.3333    | 0.0          | 1     | NULL        | 52000       | 53000          | 50000
---+---------+------------+--------+---------+------+------------+-----------+--------------+-------+-------------+-------------+----------------+--------------
8  | Henry   | IT         | 67000  | 1       | 1    | 1          | 0.5       | 0.0          | 1     | NULL        | 65000       | 67000          | 65000
4  | David   | IT         | 65000  | 2       | 2    | 2          | 1.0       | 1.0          | 2     | 67000       | NULL        | 67000          | 65000
---+---------+------------+--------+---------+------+------------+-----------+--------------+-------+-------------+-------------+----------------+--------------
3  | Charlie | Marketing  | 55000  | 2       | 2    | 2          | 1.0       | 1.0          | 2     | 58000       | NULL        | 58000          | 55000
7  | Grace   | Marketing  | 58000  | 1       | 1    | 1          | 0.5       | 0.0          | 1     | NULL        | 55000       | 58000          | 55000
---+---------+------------+--------+---------+------+------------+-----------+--------------+-------+-------------+-------------+----------------+--------------
10 | Jack    | Sales      | 62000  | 1       | 1    | 1          | 0.3333    | 0.0          | 1     | NULL        | 61000       | 62000          | 60000
6  | Frank   | Sales      | 61000  | 2       | 2    | 2          | 0.6667    | 0.5          | 1     | 62000       | 60000       | 62000          | 60000
2  | Bob     | Sales      | 60000  | 3       | 3    | 3          | 1.0       | 1.0          | 2     | 61000       | NULL        | 62000          | 60000
```

這個結果展示了每個分析函式的效果：

1. ROW_NUMBER(): 在每個部門內按工資降序給出唯一的行號。
2. RANK(): 類似ROW_NUMBER，但相同工資會得到相同排名，排名可能不連續。
3. DENSE_RANK(): 類似RANK，但排名總是連續的。
4. CUME_DIST(): 計算累積分佈，值域為0到1。
5. PERCENT_RANK(): 計算百分比排名，值域為0到1。
6. NTILE(2): 將每個部門的員工分為2組。
7. LAG(): 顯示同一部門中工資排名前一位員工的工資。
8. LEAD(): 顯示同一部門中工資排名後一位員工的工資。
9. FIRST_VALUE(): 顯示每個部門的最高工資。
10. LAST_VALUE(): 顯示每個部門的最低工資。

這些函式允許我們在同一個部門內比較和分析員工的工資情況。需要我詳細解釋某個特定函式的結果嗎？

python 介紹一個很好用的函式
2020-04-15
Python函式
ChatGPT出圈背後，生成式AI的春天到了？
2023-02-13
ChatGPTAI
lg生成函式
2024-08-15
函式
序列生成函式
2022-12-19
函式
Python利用partial偏函式生成不同的聚合函式
2024-04-15
Python函式
生成函式小記
2024-04-11
函式
【模板】生成函式 I
2024-05-02
函式
[數學] 生成函式
2024-06-21
函式
淺談生成函式
2023-01-28
函式
生成函式入門
2021-05-07
函式
生成函式與多項式
2024-03-23
函式
函式遞迴與生成式
2021-08-12
函式遞迴
vue所有生命週期函式/鉤子函式理解
2018-12-16
Vue函式
Shader 函式視覺化
2018-09-06
函式視覺化
【筆記】普通生成函式
2024-03-25
筆記函式
生成器函式generator
2020-12-10
函式
Oracle分析函式與視窗函式
2018-05-29
Oracle函式
python生成器函式的特點
2021-09-11
Python函式
解析python生成器函式的呼叫
2021-09-11
Python函式
數論函式群在數論多項式生成函式集上的作用
2021-10-22
函式
（未完成）APC函式的執行，分析 KiDeliverApc 函式
2020-11-30
函式IDE
生成器函式，迭代器
2018-08-13
函式
使用 bcrypt 函式生成密碼
2020-04-30
函式密碼
生成函式學習筆記
2024-08-02
函式筆記
oracle資料庫常用分析函式與聚合函式的用法
2019-01-27
Oracle資料庫函式
Hive之分析函式
2021-08-05
Hive函式
生成器推導式內建函式
2019-07-19
函式
ORALCE函式：LAG()和LEAD() 分析函式詳解
2018-11-08
函式
Data Lake Analytics的Geospatial分析函式
2019-02-21
函式
感覺 Java程式設計思想（第四版）並不是一本很好的 java 學習指導書
2019-03-10
Java程式設計
自定義生成器函式模擬Python內建函式filter()
2019-01-01
函式PythonFilter
Oracle分析函式之開窗函式over()詳解
2019-03-15
Oracle函式
python 生成器和生成器函式以及各種推導式
2018-12-11
Python函式
資料分析裡的鄙視鏈！EXCEL:感覺有被冒犯到
2021-03-29
Excel
MySQL分析函式實現
2018-10-29
MySql函式
Linux中select()函式分析
2020-04-07
Linux函式
count 函式原始碼分析
2019-05-10
函式原始碼
學習Vue後的感覺
2020-12-09
Vue

chatgpt生成的所有分析函式，感覺很好.

相關文章