運算子最佳化

IN 運算子
用IN寫出來的SQL的優點是比較容易寫及清晰易懂，這比較適合現代軟體開發的風格。

但是用IN的SQL效能總是比較低的，從ORACLE執行的步驟來分析用IN的SQL與不用IN的SQL有以下區別：

ORACLE試圖將其轉換成多個表的連線，如果轉換不成功則先執行IN裡面的子查詢，再查詢外層的表記錄，如果轉換成功則直接採用多個表的連線方式查詢。由此可見用IN的SQL至少多了一個轉換的過程。一般的SQL都可以轉換成功，但對於含有分組統計等方面的SQL就不能轉換了。

推薦方案：在業務密集的SQL當中儘量不採用IN運算子。
/*******************************************************/

NOT IN運算子

此操作是強列推薦不使用的，因為它不能應用表的索引。

推薦方案：用NOT EXISTS 或（外連線+判斷為空）方案代替

/*******************************************************/

<> 運算子（不等於）

不等於運算子是永遠不會用到索引的，因此對它的處理只會產生全表掃描。

推薦方案：用其它相同功能的操作運算代替，如

a<>0 改為 a>0 or a<0

a<>’’ 改為 a>’’

/********************************************************/

IS NULL 或IS NOT NULL操作（判斷欄位是否為空）

判斷欄位是否為空一般是不會應用索引的，因為B樹索引是不索引空值的。

推薦方案：

用其它相同功能的操作運算代替，如

a is not null 改為 a>0 或a>’’等。

不允許欄位為空，而用一個預設值代替空值，如業擴申請中狀態欄位不允許為空，預設為申請。

建立點陣圖索引（有分割槽的表不能建，點陣圖索引比較難控制，如欄位值太多索引會使效能下降，多人更新操作會增加資料塊鎖的現象）

/********************************************************/

> 及 < 運算子（大於或小於運算子）

大於或小於運算子一般情況下是不用調整的，因為它有索引就會採用索引查詢，但有的情況下可以對它進行最佳化，如一個表有100萬記錄，一個數值型欄位A，30萬記錄的A=0，30萬記錄的A=1，39萬記錄的A=2，1萬記錄的A=3。那麼執行A>2與A>=3的效果就有很大的區別了，因為A>2時ORACLE會先找出為2的記錄索引再進行比較，而A>=3時ORACLE則直接找到=3的記錄索引。

/********************************************************/

LIKE運算子

LIKE運算子可以應用萬用字元查詢，裡面的萬用字元組合可能達到幾乎是任意的查詢，但是如果用得不好則會產生效能上的問題，如LIKE ‘%5400%’ 這種查詢不會引用索引，而LIKE ‘X5400%’則會引用範圍索引。一個實際例子：用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編號 YY_BH LIKE ‘%5400%’ 這個條件會產生全表掃描，如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進行兩個範圍的查詢，效能肯定大大提高。

/********************************************************/

UNION運算子

UNION在進行錶連結後會篩選掉重複的記錄，所以在錶連結後會對所產生的結果集進行排序運算，刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄，最常見的是過程表與歷史表UNION。如：

select * from gc_dfys

union

select * from ls_jg_dfys

這個SQL在執行時先取出兩個表的結果，再用排序空間進行排序刪除重複的記錄，最後返回結果集，如果表資料量大的話可能會導致用磁碟進行排序。

推薦方案：採用UNION ALL運算子替代UNION，因為UNION ALL操作只是簡單的將兩個結果合併後就返回。

select * from gc_dfys

union all

select * from ls_jg_dfys

/********************************************************/

SQL書寫的影響

同一功能同一效能不同寫法SQL的影響

如一個SQL在A程式設計師寫的為

Select * from zl_yhjbqk

B程式設計師寫的為

Select * from dlyx.zl_yhjbqk（帶表所有者的字首）

C程式設計師寫的為

Select * from DLYX.ZLYHJBQK（大寫表名）

D程式設計師寫的為

Select * from DLYX.ZLYHJBQK（中間多了空格）

以上四個SQL在ORACLE分析整理之後產生的結果及執行的時間是一樣的，但是從ORACLE共享記憶體SGA的原理，可以得出ORACLE對每個SQL 都會對其進行一次分析，並且佔用共享記憶體，如果將SQL的字串及格式寫得完全相同則ORACLE只會分析一次，共享記憶體也只會留下一次的分析結果，這不僅可以減少分析SQL的時間，而且可以減少共享記憶體重複的資訊，ORACLE也可以準確統計SQL的執行頻率。

/********************************************************/

WHERE後面的條件順序影響

WHERE子句後面的條件順序對大資料量表的查詢會產生直接的影響，如

Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1

Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下'

以上兩個SQL中dy_dj（電壓等級）及xh_bz（銷戶標誌）兩個欄位都沒進行索引，所以執行的時候都是全表掃描，第一條SQL的dy_dj = '1KV以下'條件在記錄集內比率為99%，而xh_bz=1的比率只為0.5%，在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較，而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較，以此可以得出第二條SQL的CPU佔用率明顯比第一條低。

/********************************************************/

查詢表順序的影響

在FROM後面的表中的列表順序會對SQL執行效能影響，在沒有索引及ORACLE沒有對錶進行統計分析的情況下ORACLE會按表出現的順序進行連結，由此因為表的順序不對會產生十分耗伺服器資源的資料交叉。（注：如果對錶進行了統計分析，ORACLE會自動先進小表的連結，再進行大表的連結）

/********************************************************/

SQL語句索引的利用

對運算子的最佳化（見上節）

對條件欄位的一些最佳化

採用函式處理的欄位不能利用索引，如：

substr(hbs_bh,1,4)=’5400’，最佳化處理：hbs_bh like ‘5400%’

trunc(sk_rq)=trunc(sysdate)，最佳化處理：

sk_rq>=trunc(sysdate) and sk_rq

/********************************************************/

進行了顯式或隱式的運算的欄位不能進行索引，如：

ss_df+20>50，最佳化處理：ss_df>30

‘X’||hbs_bh>’X5400021452’，最佳化處理：hbs_bh>’5400021542’

sk_rq+5=sysdate，最佳化處理：sk_rq=sysdate-5

hbs_bh=5401002554，最佳化處理：hbs_bh=’ 5401002554’，注：此條件對hbs_bh 進行隱式的to_number轉換，因為hbs_bh欄位是字元型。

/********************************************************/

條件內包括了多個本表的欄位運算時不能進行索引，如：

ys_df>cx_df，無法進行最佳化

qc_bh||kh_bh=’5400250000’，最佳化處理：qc_bh=’5400’ and kh_bh=’250000’

/********************************************************/

應用ORACLE的HINT（提示）處理

提示處理是在ORACLE產生的SQL分析執行路徑不滿意的情況下要用到的。它可以對SQL進行以下方面的提示

目標方面的提示：

COST（按成本最佳化）

RULE（按規則最佳化）

CHOOSE（預設）（ORACLE自動選擇成本或規則進行最佳化）

ALL_ROWS（所有的行儘快返回）

FIRST_ROWS（第一行資料儘快返回）

執行方法的提示：

USE_NL（使用NESTED LOOPS方式聯合）

USE_MERGE（使用MERGE JOIN方式聯合）

USE_HASH（使用HASH JOIN方式聯合）

索引提示：

INDEX（TABLE INDEX）（使用提示的表索引進行查詢）

其它高階提示（如並行處理等等）

ORACLE的提示功能是比較強的功能，也是比較複雜的應用，並且提示只是給ORACLE執行的一個建議，有時如果出於成本方面的考慮ORACLE也可能不會按提示進行。根據實踐應用，一般不建議開發人員應用ORACLE提示，因為各個資料庫及伺服器效能情況不一樣，很可能一個地方效能提升了，但另一個地方卻下降了，ORACLE在SQL執行分析方面已經比較成熟，如果分析執行的路徑不對首先應在資料庫結構（主要是索引）、伺服器當前效能（共享記憶體、磁碟檔案碎片）、資料庫物件（表、索引）統計資訊是否正確這幾方面分析。

[@more@]

SQL語句最佳化技術分析

相關文章