oracle優化:避免全表掃描

xjg396發表於2012-11-28
1. 對返回的行無任何限定條件,即沒有where 子句


2. 未對資料表與任何索引主列相對應的行限定條件
例如:在City-State-Zip列建立了三列複合索引,那麼僅對State列限定條件不能使用這個索引,因為State不是索引的主列。

3. 對索引的主列有限定條件,但是在條件表示式裡使用以下表示式則會使索引失效,造成全表掃描:
(1)where子句中對欄位進行函式、表示式操作,這將導致引擎放棄使用索引而進行全表掃描,
Demo:
where upper(city)='TokYo' 或 City || 'X' like 'TOKYO%',
select id from t where num/2=100 應改為: select id from t where num=100*2
select * from emp where to_char(hire_date,'yyyymmdd')='20080411' (不使用)
select * from emp where hire_date = to_char('20080411','yyyymmdd') (使用)

(2)查詢欄位is null時索引失效,引起全表掃描。
where City is null 或 ,where City is not null,
解決方法:SQL語法中使用NULL會有很多麻煩,最好索引列都是NOT NULL的;對於is null,可以建立組合索引,nvl(欄位,0),對錶和索引analyse後,is null查詢時可以重新啟用索引查詢,但是效率還不是值得肯定;is not null 時永遠不會使用索引。一般資料量大的表不要用is null查詢。
select id from t where num is null
可以在num上設定預設值0,確保表中num列沒有null值,然後這樣查詢:
select id from t where num=0

(3)查詢條件中使用了不等於操作符(<>、!=)會限制索引、引起全表掃描
Where city!='TOKYO'.
解決方法:通過把不等於操作符改成or,可以使用索引,避免全表掃描。例如,把column<>’aaa’,改成column<’aaa’ or column>’aaa’,就可以使用索引了。

(4)對索引的主列有限定條件,但是條件使用like操作以及值以‘%’開始或者值是一個賦值變數。例如:
where City like '%YOK%'
where City like: City_bind_Variable xl_rao
select * from emp where name like '%A' (不使用索引)
select * from emp where name like 'A%' (使用索引)
解決辦法:首先儘量避免模糊查詢,如果因為業務需要一定要使用模糊查詢,則至少保證不要使用全模糊查詢,對於右模糊查詢,即like ‘…%’,是會使用索引的;左模糊like ‘%...’無法直接使用索引,但可以利用reverse + function index 的形式,變化成 like ‘…%’;全模糊是無法優化的,一定要的話考慮用搜尋引擎。出於降低資料庫伺服器的負載考慮,儘可能地減少資料庫模糊查詢。
4. or語句使用不當會引起全表掃描
原因:where子句中比較的兩個條件,一個有索引,一個沒索引,使用or則會引起全表掃描。例如:where A=:1 or B=:2,A上有索引,B上沒索引,則比較B=:2時會重新開始全表掃描


5.模糊查詢效率很低:
  原因:like本身效率就比較低,應該儘量避免查詢條件使用like;對於like‘%...%’(全模糊)這樣的條件,是無法使用索引的,全表掃描自然效率很低;另外,由於匹配演算法的關係,模糊查詢的欄位長度越大,模糊查詢效率越低。
  解決辦法:首先儘量避免模糊查詢,如果因為業務需要一定要使用模糊查詢,則至少保證不要使用全模糊查詢,對於右模糊查詢,即like‘…%’,是會使用索引的;左模糊like
  ‘%...’無法直接使用索引,但可以利用reverse + function index的形式,變化成like‘…%’;全模糊是無法優化的,一定要的話考慮用搜尋引擎。出於降低資料庫伺服器的負載考慮,儘可能地減少資料庫模糊查詢。

6.查詢條件中含有is null的select語句執行慢
  原因:Oracle 中,查詢欄位is null時單索引失效,引起全表掃描。
  解決方法:SQL語法中使用NULL會有很多麻煩,最好索引列都是NOT NULL的;對於is null,可以建立組合索引,nvl(欄位,0),對錶和索引analyse後,is null查詢時可以重新啟用索引查詢,但是效率還不是值得肯定;is not null時永遠不會使用索引。一般資料量大的表不要用is null查詢。

7.查詢條件中使用了不等於操作符(<>、!=)的select語句執行慢
  原因:SQL中,不等於操作符會限制索引,引起全表掃描,即使比較的欄位上有索引
 解決方法:通過把不等於操作符改成or,可以使用索引,避免全表掃描。例如,把column<>’aaa’,改成column<’aaa’or column>’aaa’,就可以使用索引了。

8.使用組合索引,如果查詢條件中沒有前導列,那麼索引不起作用,會引起全表掃描;但是從Oracle9i開始,引入了索引跳躍式掃描的特性,可以允許優化器使用組合索引,即便索引的前導列沒有出現在WHERE子句中。例如:create index skip1 on emp5(job,empno); 全索引掃描select count(*) from emp5 where empno=7900; 索引跳躍式掃描select /*+ index(emp5 skip1)*/ count(*) from emp5 where empno=7900;前一種是全表掃描,後一種則會使用組合索引。
9. or語句使用不當會引起全表掃描
  原因:where子句中比較的兩個條件,一個有索引,一個沒索引,使用or則會引起全表掃描。例如:where A=:1 or B=:2,A上有索引,B上沒索引,則比較B=:2時會重新開始全表掃描。
10.組合索引,排序時應按照組合索引中各列的順序進行排序,即使索引中只有一個列是要排序的,否則排序效能會比較差。例如:create index skip1 on emp5(job,empno,date); select job,empno from emp5 where job=’manager’and empno=’10’order by job,empno,date desc;實際上只是查詢出符合job=’manager’and empno=’10’條件的記錄並按date降序排列,但是寫成order by date desc效能較差。

11.Update語句,如果只更改1、2個欄位,不要Update全部欄位,否則頻繁呼叫會引起明顯的效能消耗,同時帶來大量日誌。
 12.對於多張大資料量的表JOIN,要先分頁再JOIN,否則邏輯讀會很高,效能很差。

 13.select count(*) from table;這樣不帶任何條件的count會引起全表掃描,並且沒有任何業務意義,是一定要杜絕的。
14.sql的where條件要繫結變數,比如where column=:1,不要寫成where column=‘aaa’,這樣會導致每次執行時都會重新分析,浪費CPU和記憶體資源。

15.不要使用in操作符,這樣資料庫會進行全表掃描,
推薦方案:在業務密集的SQL當中儘量不採用IN操作符

16.not in 使用not in也不會走索引
推薦方案:用not exists或者(外聯結+判斷為空)來代替


17.> 及 < 操作符(大於或小於操作符)

大於或小於操作符一般情況下是不用調整的,因為它有索引就會採用索引查詢,但有的情況下可以對它進行優化,如一個表有100萬記錄,一個數值型欄位 A,30萬記錄的A=0,30萬記錄的A=1,39萬記錄的A=2,1萬記錄的A=3。那麼執行A>2與A>=3的效果就有很大的區別了,因為A>2時ORACLE會先找出為2的記錄索引再進行比較,而A>=3時ORACLE則直接找到=3的記錄索引。


18.UNION操作符

UNION在進行錶連結後會篩選掉重複的記錄,所以在錶連結後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最常見的是過程表與歷史表UNION。如:
select * from gc_dfys

union

select * from ls_jg_dfys

這個SQL在執行時先取出兩個表的結果,再用排序空間進行排序刪除重複的記錄,最後返回結果集,如果表資料量大的話可能會導致用磁碟進行排序。

推薦方案:採用UNION ALL操作符替代UNION,因為UNION ALL操作只是簡單的將兩個結果合併後就返回。

19.WHERE後面的條件順序影響

WHERE子句後面的條件順序對大資料量表的查詢會產生直接的影響,如

Select * from zl_yhjbqk where dy_dj = '1K以下' and xh_bz=1

Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1K以下'

以上兩個SQL中dy_dj及xh_bz兩個欄位都沒進行索引,所以執行的時候都是全表掃描,第一條SQL的dy_dj = '1KV以下'條件在記錄集內比率為99%,而xh_bz=1的比率只為0.5%,在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較,而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較,以此可以得出第二條SQL的CPU佔用率明顯比第一條低。

20.查詢表順序的影響

在FROM後面的表中的列表順序會對SQL執行效能影響,在沒有索引及ORACLE沒有對錶進行統計分析的情況下ORACLE會按表出現的順序進行連結,由此因為表的順序不對會產生十分耗伺服器資源的資料交叉。(注:如果對錶進行了統計分析,ORACLE會自動先進小表的連結,再進行大表的連結)


轉自: http://blog.csdn.net/onetree2010/article/details/6098259

相關文章