pg distinct 改寫遞迴最佳化（德哥的思路）

小至尖尖發表於2024-03-11

原文網址 : https://www.cnblogs.com/yuzhijian/p/18067341

德哥的最佳化思路巨牛逼，這種遞迴思維真的太吊了，我目前就缺遞迴思路。

下面SQL1000W行資料，列的選擇性很低，只有兩個值（'1'和'11'）都是字串型別，'1'只有一條資料，'11'有9999999行資料。

慢SQL：

select distinct col from tt;

                                                      QUERY PLAN                                                      
----------------------------------------------------------------------------------------------------------------------
 HashAggregate  (cost=169247.11..169247.12 rows=1 width=3) (actual time=5082.733..5082.735 rows=2 loops=1)
   Group Key: col
   ->  Seq Scan on tt  (cost=0.00..144247.29 rows=9999929 width=3) (actual time=0.005..275.906 rows=10000000 loops=1)
 Planning Time: 0.365 ms
 Execution Time: 5082.772 ms
(5 行記錄)

CTE遞迴最佳化：

WITH RECURSIVE t AS (
   (SELECT col FROM tt ORDER BY col LIMIT 1)  
   UNION ALL
   SELECT (SELECT col FROM tt WHERE col > t.col ORDER BY col LIMIT 1)
   FROM t
   WHERE t.col IS NOT NULL
   )
SELECT col FROM t WHERE col IS NOT NULL;

                                                                        QUERY PLAN                                                                        
----------------------------------------------------------------------------------------------------------------------------------------------------------
 CTE Scan on t  (cost=50.84..52.86 rows=100 width=38) (actual time=0.024..0.079 rows=2 loops=1)
   Filter: (col IS NOT NULL)
   Rows Removed by Filter: 1
   CTE t
     ->  Recursive Union  (cost=0.43..50.84 rows=101 width=38) (actual time=0.022..0.076 rows=3 loops=1)
           ->  Limit  (cost=0.43..0.46 rows=1 width=3) (actual time=0.021..0.021 rows=1 loops=1)
                 ->  Index Only Scan using idx_1_2_tt on tt tt_1  (cost=0.43..260443.37 rows=9999929 width=3) (actual time=0.020..0.020 rows=1 loops=1)
                       Heap Fetches: 0
           ->  WorkTable Scan on t t_1  (cost=0.00..4.84 rows=10 width=38) (actual time=0.017..0.017 rows=1 loops=3)
                 Filter: (col IS NOT NULL)
                 Rows Removed by Filter: 0
                 SubPlan 1
                   ->  Limit  (cost=0.43..0.46 rows=1 width=3) (actual time=0.024..0.024 rows=0 loops=2)
                         ->  Index Only Scan using idx_1_2_tt on tt  (cost=0.43..95149.36 rows=3333310 width=3) (actual time=0.024..0.024 rows=0 loops=2)
                               Index Cond: (col > (t_1.col)::text)
                               Heap Fetches: 0
 Planning Time: 0.096 ms
 Execution Time: 0.096 ms
(18 行記錄)

裡面的邏輯是：

(SELECT col FROM tt ORDER BY col LIMIT 1)

　　根節點透過order by 升序找到最小的一條資料作為起點。

遞迴查詢:

SELECT (SELECT col FROM tt WHERE col > t.col ORDER BY col LIMIT 1)
FROM t
WHERE t.col IS NOT NULL

　　在第一次迭代中，CTE t 包含值'1'。這個查詢將在tt表中尋找col大於'1'的最小值。在資料集中，這將是'11'。

　　在第二次迭代，CTE t 將包含'11'。此時，查詢將嘗試找到大於'11'的最小值，但沒有這樣的值，所以返回NULL。

遞迴結束:
　　當遞迴查詢返回NULL時，遞迴結束。這時，CTE t 將包含'1'和'11'，返回和distinct 一樣邏輯的資料。

理解了整個邏輯後我都嚇尿了，就一道演算法題，確實要跟巨佬學習才行，加深遞迴思維。

kingbase SQL最佳化案例 ( union遞迴改 cte遞迴 )
2023-12-07
SQL遞迴
最新情報：所有的遞迴都可以改寫成非遞迴？
2020-08-12
遞迴
阿里開發者們的第二個感悟：PG大V德哥的使命感與開放心態
2018-12-21
阿里
遞迴和尾遞迴
2024-03-18
遞迴
PG double buffering的最佳化
2024-02-04
什麼是遞迴?遞迴和迴圈的異同
2020-12-25
遞迴
快速排序【遞迴】【非遞迴】
2018-06-04
排序遞迴
二叉樹的非遞迴遍歷寫法
2020-12-07
二叉樹遞迴
編寫函式：遞迴求逆序 (Append Code) ★
2024-11-11
函式遞迴APP
java讀取excel層級結構的遞迴寫法
2020-09-25
JavaExcel遞迴
遞迴
2024-08-25
遞迴
徹底理解遞迴，從遞迴的本質說起！
2019-06-26
遞迴
JavaScript中的遞迴
2019-03-04
JavaScript遞迴
函式的遞迴
2020-06-17
函式遞迴
Java jdk8實現部門樹的遞迴編寫
2020-11-18
JavaJDK遞迴
OceanBase 金融專案最佳化案例(union all 改寫)
2024-07-17
python-動態規劃的遞迴、非遞迴實現
2019-02-16
Python動態規劃遞迴
揹包問題的遞迴與非遞迴演算法
2018-11-12
遞迴演算法
Vue3.0的遞迴監聽和非遞迴監聽
2020-10-28
Vue遞迴
go 遞迴
2019-03-25
Go遞迴
JavaScript遞迴
2019-04-03
JavaScript遞迴
分而治之-遞迴
2018-07-03
遞迴
理解遞迴
2019-03-14
遞迴
遍歷二叉樹-------遞迴&非遞迴
2018-04-10
二叉樹遞迴
遞迴和非遞迴分別實現求n的階乘
2018-11-29
遞迴
二叉樹的四種遍歷（遞迴與非遞迴）
2021-10-06
二叉樹遞迴
Java - 13 方法的遞迴
2024-10-06
Java遞迴
瞭解 JavaScript 的遞迴
2018-03-28
JavaScript遞迴
Vue中元件的遞迴
2022-03-07
Vue元件遞迴
SQL中的遞迴用法
2021-11-06
SQL遞迴
遞迴函式的理解
2021-06-07
遞迴函式
遞迴和遞推總結
2019-01-24
遞迴
演算法小專欄：遞迴與尾遞迴
2019-04-01
演算法遞迴
迭代與遞迴--你被遞迴搞暈過嗎？
2024-06-07
遞迴
Android遍歷所有控制元件的遞迴和非遞迴實現
2018-09-30
Android控制元件遞迴
PAT-B 1002 寫出這個數【字串+遞迴列印】
2019-02-15
字串遞迴
遞迴呼叫 VS 迴圈呼叫
2019-01-19
遞迴
遞迴-*快速排序
2019-03-30
遞迴排序

pg distinct 改寫遞迴最佳化（德哥的思路）

相關文章