從語句繁簡和效能優化想到的......

cow977發表於2011-04-20

原文網址 : http://blog.itpub.net/81227/viewspace-692953/

原文：http://www.itpub.net/viewthread.php?tid=1376537

http://www.cnblogs.com/killkill/archive/2011/04/11/2013044.html

select a.*,b.object_name from TEST_OBJECT a, TEST_OBJ1 b
where substr(a.object_name,1,length(b.object_name))=b.object_name;

一句簡單的語句，join的演算法註定只能走Nested Loop，執行計劃如下：

55546 rows selected.

Elapsed: 00:09:28.48

----------------------------------------------------------------------------------
| Id | Operation          | Name        | Rows | Bytes | Cost (%CPU)| Time |
----------------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |             |   213K|    29M| 3310K (2)| 11:02:09 |
|   1 | NESTED LOOPS      |             |   213K|    29M| 3310K (2)| 11:02:09 |
|   2 |   TABLE ACCESS FULL| TEST_OBJECT | 50806 | 6350K|   159   (3)| 00:00:02 |
|* 3 |   TABLE ACCESS FULL| TEST_OBJ1   |     4 |    68 |    65   (2)| 00:00:01 |
----------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------
3 - filter("B"."OBJECT_NAME"=SUBSTR("A"."OBJECT_NAME",1,LENGTH("B"."OBJ
ECT_NAME")))

Statistics
----------------------------------------------------------
          0 recursive calls
          0 db block gets
   14055414 consistent gets
          0 physical reads
          0 redo size
    2126831 bytes sent via SQL*Net to client
      41133 bytes received via SQL*Net from client
       3705 SQL*Net roundtrips to/from client
          0 sorts (memory)
          0 sorts (disk)
      55546 rows processed

網友anlinew提供了一種看似不可思義的非常精妙的優化方法，將語句改寫成：

select a.*, b.object_name
from TEST_OBJECT a, TEST_OBJ1 b
where substr(a.object_name, 1, length(b.object_name)) = b.object_name
   and substr(a.object_name, 1, 4) = substr(b.object_name, 1, 4)
   and length(b.object_name) > 3
union all
select a.*, b.object_name
from TEST_OBJECT a, TEST_OBJ1 b
where substr(a.object_name, 1, length(b.object_name)) = b.object_name
   and length(b.object_name) < 4;

將資料進行了切片，語句複雜了，但效能卻大幅提高。

優化的核心思想是將資料“分片”，該例子中分片的依據是多少位首字母（這裡是4），其中“大頭”由Hash Join處理，而“小頭”走Nested Loop，這種“抓大放小”的做法直接就從複雜度上進行了優化。

執行計劃如下：

55546 rows selected.

Elapsed: 00:00:09.59

-----------------------------------------------------------------------------------
| Id | Operation           | Name        | Rows | Bytes | Cost (%CPU)| Time |
-----------------------------------------------------------------------------------
|   0 | SELECT STATEMENT    |             | 2827 |   400K| 12224 (99)| 00:02:27 |
|   1 | UNION-ALL          |             |       |       |            | |
|* 2 |   HASH JOIN         |             | 2128 |   301K|   391 (44)| 00:00:05 |
|* 3 |    TABLE ACCESS FULL| TEST_OBJ1   | 22731 |   377K|    67   (2)| 00:00:01 |
|   4 |    TABLE ACCESS FULL| TEST_OBJECT | 50806 | 6350K|   159   (3)| 00:00:02 |
|   5 |   NESTED LOOPS      |             |   699 |    98K| 11833   (3)| 00:02:22 |
|* 6 |    TABLE ACCESS FULL| TEST_OBJ1   |    75 | 1275 |    67   (2)| 00:00:01 |
|* 7 |    TABLE ACCESS FULL| TEST_OBJECT |     9 | 1152 |   157   (3)| 00:00:02 |
-----------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------
   2 - access(SUBSTR("A"."OBJECT_NAME",1,4)=SUBSTR("B"."OBJECT_NAME",1,4))
       filter("B"."OBJECT_NAME"=SUBSTR("A"."OBJECT_NAME",1,LENGTH("B"."OBJECT_NAME")))
   3 - filter(LENGTH("B"."OBJECT_NAME")>3)
   6 - filter(LENGTH("B"."OBJECT_NAME")<4)
   7 - filter("B"."OBJECT_NAME"=SUBSTR("A"."OBJECT_NAME",1,LENGTH("B"."OBJECT_NAME")))

Statistics
----------------------------------------------------------
          0 recursive calls
          0 db block gets
      39190 consistent gets
          0 physical reads
          0 redo size
    2216003 bytes sent via SQL*Net to client
      41133 bytes received via SQL*Net from client
       3705 SQL*Net roundtrips to/from client
          0 sorts (memory)
          0 sorts (disk)
      55546 rows processed

按照anlinew的思路，試了下：

select a.*, b.object_name
from TEST_OBJECT a, TEST_OBJ1 b
where substr(a.object_name, 1, length(b.object_name)) = b.object_name
and substr(a.object_name, 1, 1) = substr(b.object_name, 1, 1);
55546 rows selected.

Elapsed: 00:01:30.57

----------------------------------------------------------------------------------
| Id | Operation          | Name        | Rows | Bytes | Cost (%CPU)| Time |
----------------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |             | 2135 |   302K|   391 (44)| 00:00:05 |
|* 1 | HASH JOIN         |             | 2135 |   302K|   391 (44)| 00:00:05 |
|   2 |   TABLE ACCESS FULL| TEST_OBJ1   | 22806 |   378K|    67   (2)| 00:00:01 |
|   3 |   TABLE ACCESS FULL| TEST_OBJECT | 50806 | 6350K|   159   (3)| 00:00:02 |
----------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------
1 - access(SUBSTR("A"."OBJECT_NAME",1,1)=SUBSTR("B"."OBJECT_NAME",1,1))
filter("B"."OBJECT_NAME"=SUBSTR("A"."OBJECT_NAME",1,LENGTH("B"."OBJECT_NAME")))

Statistics
----------------------------------------------------------
          7 recursive calls
          0 db block gets
       4706 consistent gets
          0 physical reads
          0 redo size
    2136652 bytes sent via SQL*Net to client
      41133 bytes received via SQL*Net from client
       3705 SQL*Net roundtrips to/from client
          1 sorts (memory)
          0 sorts (disk)
      55546 rows processed

select a.*, b.object_name
from TEST_OBJECT a, TEST_OBJ1 b
where substr(a.object_name, 1, length(b.object_name)) = b.object_name
   and substr(a.object_name, 1, N) = substr(b.object_name, 1, N)
   and length(b.object_name) >= N
union all
select a.*, b.object_name
from TEST_OBJECT a, TEST_OBJ1 b
where substr(a.object_name, 1, length(b.object_name)) = b.object_name
   and length(b.object_name) < N;

N=1：Elapsed: 00:01:30.91

N=2：Elapsed: 00:00:16.76

N=3：Elapsed: 00:00:09.75
N=4：Elapsed: 00:00:09.63

N=5：Elapsed: 00:00:07.17

N=6：Elapsed: 00:00:06.97

N=7：Elapsed: 00:00:11.01

N=8：Elapsed: 00:00:19.21

當N=1時，第二個分片可以去掉，從執行計劃看，也是HashJoin，但效率不是最高，從實驗結果看，N=6是最佳分片。

SQL> select avg(length(object_name)) from test_obj1;

AVG(LENGTH(OBJECT_NAME))
------------------------
17.2789778

SQL> select length(object_name),count(*) from test_obj1 group by length(object_name) order by 1;

LENGTH(OBJECT_NAME)   COUNT(*)
------------------- ----------
                  1          2
                  2          7
                  3         41
                  4         66
                  5        102
                  6        209
                  7        429
                  8        569
                  9        442
                 10        569
                 11        729

                 12        728
                 13        935
                 14        947
                 15       1010
                 16       1268
                 17       1428
                 18       1594
                 19       1864
                 20       1877
                 21       2185
                 22       2260

23 2497

23 rows selected.

效能的優化，是經驗的積累，但也要靠實驗來驗證，因為資料是基礎，基礎改變了，結論也就變了。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/81227/viewspace-692953/，如需轉載，請註明出處，否則將追究法律責任。

sql語句效能優化
2021-01-03
SQL優化
SQL語句優化
2019-05-08
SQL優化
sql語句執行順序與效能優化（1）
2018-10-14
SQL優化
Mysql 52條SQL語句效能優化策略彙總
2020-12-23
MySql優化
MySQL——優化ORDER BY語句
2018-10-31
MySql優化
MYSQL SQL語句優化
2019-02-22
MySql優化
MySQL 52個SQL效能優化策略SQL語句彙總
2022-01-17
MySql優化
優化 SQL 語句的步驟
2021-08-23
優化SQL
MySql和簡單的sql語句
2024-10-16
MySql
MySQL之SQL語句優化
2022-05-25
MySql優化
[20201210]sql語句優化.txt
2020-12-10
SQL優化
[20200320]SQL語句優化的困惑.txt
2020-03-20
SQL優化
MySQL系列6 - join語句的優化
2021-03-17
MySql優化
Oracle優化案例-單表分頁語句的優化（八）
2018-11-21
Oracle優化
SQL優化案例-單表分頁語句的優化（八）
2018-11-28
SQL優化
PostgreSQL 原始碼解讀（35）- 查詢語句#20（查詢優化-簡化Having和Grou...
2018-09-06
SQL原始碼優化
[20181114]一條sql語句的優化.txt
2018-11-14
SQL優化
從一次效能優化看https的效能
2019-03-24
優化HTTP
soar-PHP - SQL 語句優化器和重寫器的 PHP 擴充套件包、方便框架中 SQL 語句調優
2019-07-09
PHPSQL優化套件框架
Go語言效能優化- For Range 效能研究
2018-10-22
Go優化
Sql語句本身的優化-定位慢查詢
2018-10-11
SQL優化
[20200324]SQL語句優化的困惑2.txt
2020-03-24
SQL優化
優化 JS 條件語句的 5 個技巧
2019-03-22
優化JS
SQL語句優化的原則與方法QO
2022-03-21
SQL優化
一次Oracle優化所想到的
2022-05-02
Oracle優化
Shiro效能優化：解決Session頻繁讀寫問題
2020-09-24
優化Session
《MySQL慢查詢優化》之SQL語句及索引優化
2020-12-06
MySql優化索引
淺析MySQL語句優化中的explain引數
2019-03-03
MySql優化AI
144.從拼多多優惠券事件想到的
2019-01-21
事件
從 React render 談談效能優化
2019-02-23
React優化
實現語音社交原始碼介面效能優化，從索引入手
2021-12-23
原始碼優化索引
Event loop的化繁為簡（一）
2018-03-23
OOP
Event loop的化繁為簡（二）
2018-03-23
OOP
中文簡繁體轉化
2018-09-07
[20211229]toad下優化sql語句注意的問題.txt
2021-12-30
優化SQL
MySQL-效能優化-索引和查詢優化
2018-06-03
MySql優化索引
測量、基線和效能優化之三：基於測量、基線和變化的效能優化
2018-10-12
優化
分支語句和迴圈語句
2020-11-07
課時34：豐富的else語句以及簡潔的with語句
2018-08-21

從語句繁簡和效能優化想到的......

相關文章