LightDB23.1新特性支援Oracle hint增強

哎呀我的天吶發表於2023-02-17

unnest和no_unnest

Oracle中,子查詢非巢狀(Subquery Unnesting):當where子查詢中有in,not in,exists,not exists等,CBO會嘗試將子查詢展開(unnest),從而消除FILTER,這個過程就叫做子查詢非巢狀。
LightDB從23.1開始支援此最佳化器特性

建立測試表emp和dept,預設的執行計劃如下,兩個表走hash join

test@test=> explain analyze test@test-> select ename, deptno  
test@test-> from emptest@test-> where deptno in (select deptno from dept where dname = 'CHICAGO');
                                                 QUERY PLAN                                                 
------------------------------------------------------------------------------------------------------------
 Hash Join  (cost=19.80..35.11 rows=2 width=44) (actual time=0.047..0.053 rows=0 loops=1)
   Hash Cond: (emp.deptno = dept.deptno)
   ->  Seq Scan on emp  (cost=0.00..14.20 rows=420 width=44) (actual time=0.012..0.013 rows=1 loops=1)
   ->  Hash  (cost=19.75..19.75 rows=4 width=12) (actual time=0.013..0.015 rows=0 loops=1)
         Buckets: 1024  Batches: 1  Memory Usage: 8kB
         ->  Seq Scan on dept  (cost=0.00..19.75 rows=4 width=12) (actual time=0.011..0.012 rows=0 loops=1)
               Filter: ((dname)::text = 'CHICAGO'::text)
               Rows Removed by Filter: 4
 Planning Time: 0.210 ms
 Execution Time: 0.115 ms
(10 rows)

指定hint no_unnest 讓執行計劃走filter

test@test-> where deptno in (select /*+ no_unnest */ deptno from dept where dname = 'CHICAGO');
                                                   QUERY PLAN                                                   
----------------------------------------------------------------------------------------------------------------
 Seq Scan on emp @"lt#1"  (cost=19.76..35.01 rows=210 width=44) (actual time=0.033..0.035 rows=0 loops=1)
   Filter: (hashed SubPlan 1)
   Rows Removed by Filter: 14
   SubPlan 1
     ->  Seq Scan on dept @"lt#0"  (cost=0.00..19.75 rows=4 width=12) (actual time=0.006..0.007 rows=0 loops=1)
           Filter: ((dname)::text = 'CHICAGO'::text)
           Rows Removed by Filter: 4
 Planning Time: 0.153 ms
 Execution Time: 0.087 ms
(9 rows)

同樣只用unnest hint,可以實現非filter的執行計劃

test@test=> explain analyze test@test-> select ename, deptno  
test@test-> from emptest@test-> where deptno in (select /*+ unnest */ deptno from dept where dname = 'CHICAGO');
                                                     QUERY PLAN                                                     
--------------------------------------------------------------------------------------------------------------------
 Hash Join  (cost=19.80..35.11 rows=2 width=44) (actual time=0.027..0.032 rows=0 loops=1)
   Hash Cond: (emp.deptno = dept.deptno)
   ->  Seq Scan on emp @"lt#1"  (cost=0.00..14.20 rows=420 width=44) (actual time=0.009..0.010 rows=1 loops=1)
   ->  Hash  (cost=19.75..19.75 rows=4 width=12) (actual time=0.010..0.011 rows=0 loops=1)
         Buckets: 1024  Batches: 1  Memory Usage: 8kB
         ->  Seq Scan on dept @"lt#0"  (cost=0.00..19.75 rows=4 width=12) (actual time=0.008..0.009 rows=0 loops=1)
               Filter: ((dname)::text = 'CHICAGO'::text)
               Rows Removed by Filter: 4
 Planning Time: 0.217 ms
 Execution Time: 0.065 ms
(10 rows)

push_pred

謂詞推入(Pushing Predicate):當SQL語句中包含有不能合併的檢視,並且檢視有謂詞過濾(也就是where過濾條件),CBO會將謂詞過濾條件推入檢視中,這個過程就叫做謂詞推入。謂詞推入的主要目的就是讓Oracle儘可能早的過濾掉無用的資料,從而提升查詢效能。

create table test as select * from pg_class;create table test1 as select * from pg_class;create or replace view v_pushpredicate as
     select  * from test
     union all
     select  * from test1;create index i_test_id on test(oid);create index i_test1_id on test1(oid);

執行下面語句

test@test=> explain analyze select /*+push_pred(v)*/* from v_pushpredicate v where oid = 19787;
                                                        QUERY PLAN                                                        
--------------------------------------------------------------------------------------------------------------------------
 Append  (cost=0.28..4.59 rows=2 width=265) (actual time=0.051..0.091 rows=2 loops=1)
   ->  Index Scan using i_test_id on test  (cost=0.28..2.29 rows=1 width=265) (actual time=0.049..0.051 rows=1 loops=1)
         Index Cond: (oid = '19787'::oid)
   ->  Index Scan using i_test1_id on test1  (cost=0.28..2.29 rows=1 width=265) (actual time=0.031..0.032 rows=1 loops=1)
         Index Cond: (oid = '19787'::oid)
 Planning Time: 1.080 ms
 Execution Time: 0.137 ms
(7 rows)

並行相關hint

Oracle並行的生產者和消費者模型中,Table Queue: 生產者和消費者之間的資料分發. 常見的資料並行分發方式有broadcast, hash. 12c引入多種新的資料分發, 比如replicate, 更加智慧的adaptive分發.
在 oracle 中 pq_distribute 用來控制並行連線的方式,LightDB 的語法與oracle相同, 具體如下所示:
image.png
但是 LightDB 只支援 none,broadcast 和 hash,hash 組合,其中 hash,hash 只支援語法。其他模式待後續支援。

test@test=> explain analyze selecttest@test->   /*+ use_hash(a,b) pq_distribute(a none,broadcast) leading(b a)*/ test@test->  * from test a,  test1 b where a.oid = b.oid;
                                                             QUERY PLAN                                                              
-------------------------------------------------------------------------------------------------------------------------------------
 Gather  (cost=37.05..62.87 rows=758 width=530) (actual time=1.942..12.191 rows=758 loops=1)
   Workers Planned: 3
   Workers Launched: 2
   ->  Hash Join  (cost=37.05..62.87 rows=245 width=530) (actual time=0.477..1.342 rows=253 loops=3)
         Hash Cond: (b.oid = a.oid)
         ->  Parallel Seq Scan on test1 b @"lt#0"  (cost=0.00..22.45 rows=245 width=265) (actual time=0.005..0.218 rows=254 loops=3)
         ->  Hash  (cost=27.58..27.58 rows=758 width=265) (actual time=1.387..1.390 rows=758 loops=1)
               Buckets: 1024  Batches: 1  Memory Usage: 163kB
               ->  Seq Scan on test a @"lt#0"  (cost=0.00..27.58 rows=758 width=265) (actual time=0.005..0.595 rows=758 loops=1)
 Planning Time: 0.282 ms
 Execution Time: 12.724 ms
(11 rows)

使用pq_distribute(b hash,hash)執行計劃如下
LightDB 只支援 none,broadcast 和 hash,hash 組合,其中 hash,hash 只支援語法(因為LightDB 不支援此模式)。其他模式待後續支援

test@test=> explain analyze selecttest@test->   /*+ use_hash(a,b) pq_distribute(a none,broadcast) */ test@test->  * from test a,  test1 b where a.oid = b.oid;
                                                                QUERY PLAN                                                                 
-------------------------------------------------------------------------------------------------------------------------------------------
 Gather  (cost=25.52..49.67 rows=758 width=530) (actual time=2.451..12.746 rows=758 loops=1)
   Workers Planned: 3
   Workers Launched: 2
   ->  Parallel Hash Join  (cost=25.52..49.67 rows=245 width=530) (actual time=0.766..1.678 rows=253 loops=3)
         Hash Cond: (a.oid = b.oid)
         ->  Parallel Seq Scan on test a @"lt#0"  (cost=0.00..22.45 rows=245 width=265) (actual time=0.005..0.665 rows=758 loops=1)
         ->  Parallel Hash  (cost=22.45..22.45 rows=245 width=265) (actual time=0.502..0.503 rows=254 loops=3)
               Buckets: 1024  Batches: 1  Memory Usage: 200kB
               ->  Parallel Seq Scan on test1 b @"lt#0"  (cost=0.00..22.45 rows=245 width=265) (actual time=0.013..0.635 rows=761 loops=1)
 Planning Time: 0.273 ms
 Execution Time: 13.294 ms
(11 rows)


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29990276/viewspace-2935750/,如需轉載,請註明出處,否則將追究法律責任。

相關文章