ORACLE優化SQL語句,提高效率(2)

fengzj發表於2009-11-19
索引是表的一個概念部分,用來提高檢索資料的效率,Oracle使用了一個複雜的自平衡B-tree結構。通常,通過索引查詢資料比全表掃描要快。當 Oracle找出執行查詢和Update語句的最好路徑時, Oracle優化器將使用索引。同樣在聯結多個表時使用索引也能夠提高效率。另一個使用索引的好處是,他提供了主鍵(primary key)的唯一性驗證。那些LONG或LONG RAW資料型別, 您能夠索引幾乎任何的列。通常, 在大型表中使用索引特別有效. 當然,您也會發現, 在掃描小表時,使用索引同樣能提高效率。雖然使用索引能得到查詢效率的提高,但是我們也必須注意到他的代價。索引需要空間來儲存,也需要定期維護, 每當有記錄在表中增減或索引列被修改時, 索引本身也會被修改。這意味著每條記錄的INSERT,DELETE , UPDATE將為此多付出4、 5次的磁碟I/O 。因為索引需要額外的儲存空間和處理,那些不必要的索引反而會使查詢反應時間變慢。定期的重構索引是有必要的:

  ALTER INDEX REBUILD

  (18)用EXISTS替換DISTINCT:

  當提交一個包含一對多表資訊(比如部門表和僱員表)的查詢時,避免在SELECT子句中使用DISTINCT。一般能夠考慮用EXIST替換, EXISTS 使查詢更為迅速,因為RDBMS核心模組將在子查詢的條件一旦滿足後,立即返回結果。例子:

  (低效): SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D , EMP E WHERE D.DEPT_NO = E.DEPT_NO (高效): SELECT DEPT_NO,DEPT_NAME FROM DEPT D WHERE EXISTS ( SELECT ‘X' FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);

  (19)SQL語句用大寫的;因為Oracle總是先解析SQL語句,把小寫的字母轉換成大寫的再執行。

  (20)在Java程式碼中儘量少用連線符“+”連線字串。

  (21)避免在索引列上使用NOT通常,我們要避免在索引列上使用NOT, NOT會產生在和在索引列上使用函式相同的影響。當Oracle“碰到”NOT,他就會停止使用索引轉而執行全表掃描。

  (22)避免在索引列上使用計算。WHERE子句中,假如索引列是函式的一部分。優化器將不使用索引而使用全表掃描。

  舉例:

  低效: SELECT … FROM DEPT WHERE SAL * 12 > 25000; 高效: SELECT … FROM DEPT WHERE SAL > 25000/12;

  (23)用>=替代>:

  高效:SELECT * FROM EMP WHERE DEPTNO >=4 低效: SELECT * FROM EMP WHERE DEPTNO >3

  兩者的區別在於,前者DBMS將直接跳到第一個DEPT等於4的記錄而後者將首先定位到DEPTNO=3的記錄並且向前掃描到第一個DEPT大於3的記錄。

  (24)用UNION替換OR (適用於索引列):

  通常情況下,用UNION替換WHERE子句中的OR將會起到較好的效果。對索引列使用OR將造成全表掃描。注意,以上規則只針對多個索引列有效。假如有column沒有被索引,查詢效率可能會因為您沒有選擇OR而降低。在下面的例子中,LOC_ID 和REGION上都建有索引。

  高效:SELECT LOC_ID 。 LOC_DESC ,REGION FROM LOCATION WHERE LOC_ID = 10 UNION SELECT LOC_ID ,LOC_DESC ,REGION FROM LOCATION WHERE REGION = “MELBOURNE”

  低效: SELECT LOC_ID ,LOC_DESC ,REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = “MELBOURNE”

  (25)用IN來替換OR:

  這是一條簡單易記的規則,但是實際的執行效果還須檢驗,在Oracle8i下,兩者的執行路徑似乎是相同的:

  低效:

  SELECT…. FROM LOCATION WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30

  高效:

  SELECT… FROM LOCATION WHERE LOC_IN IN (10,20,30);

  (26)避免在索引列上使用IS NULL和IS NOT NULL:

  避免在索引中使用任何能夠為空的列,Oracle將無法使用該索引。對於單列索引,假如列包含空值,索引中將不存在此記錄。對於複合索引,假如每個列都為空,索引中同樣不存在此記錄。假如至少有一個列不為空,則記錄存在於索引中。舉例:假如唯一性索引建立在表的A列和B列上,並且表中存在一條記錄的 A,B值為(123,null), Oracle將不接受下一條具備相同A,B值(123,null)的記錄(插入)。然而假如任何的索引列都為空,Oracle將認為整個鍵值為空而空不等於空。因此您能夠插入1000 條具備相同鍵值的記錄,當然他們都是空! 因為空值不存在於索引列中,所以WHERE子句中對索引列進行空值比較將使ORACLE停用該索引。

  低效: (索引失效)

  SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;

  高效:(索引有效)

  SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0;

  (27)總是使用索引的第一個列:

  假如索引是建立在多個列上,只有在他的第一個列(leading column)被where子句引用時,優化器才會選擇使用該索引。這也是一條簡單而重要的規則,當僅引用索引的第二個列時,優化器使用了全表掃描而忽略了索引。

  (28)用UNION-ALL 替換UNION ( 假如有可能的話):

  當SQL語句需要UNION兩個查詢結果集合時,這兩個結果集合會以UNION-ALL的方式被合併,然後在輸出最終結果前進行排序。假如用 UNION ALL替代UNION,這樣排序就不是必要了。效率就會因此得到提高。需要注意的是,UNION ALL 將重複輸出兩個結果集合中相同記錄。因此各位還是要從業務需求分析使用UNION ALL的可行性。 UNION 將對結果集合排序,這個操作會使用到SORT_AREA_SIZE這塊記憶體。對於這塊記憶體的優化也是相當重要的。下面的SQL能夠用來查詢排序的消耗量:

  低效: SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95' UNION SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95' 高效: SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95' UNION ALL SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95'

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/219982/viewspace-620027/,如需轉載,請註明出處,否則將追究法律責任。

相關文章