.選用適合的ORACLE優化器

fengzj發表於2008-11-19
【IT168 技術文件】

    1.選用適合的ORACLE優化器

    ORACLE的優化器共有3種:

    1.RULE(基於規則) 2.COST(基於成本) 3.CHOOSE(選擇性)

    設定預設的優化器,可以通過對init.ora檔案中OPTIMIZER_MODE引數的各種宣告,如RULE,COST,CHOOSE,ALL_ROWS,FIRST_ROWS . 你當然也在SQL句級或是會話(session)級對其進行覆蓋.

    為了使用基於成本的優化器(CBO, Cost-Based Optimizer) , 你必須經常執行analyze 命令,以增加資料庫中的物件統計資訊(object statistics)的準確性.

    如果資料庫的優化器模式設定為選擇性(CHOOSE),那麼實際的優化器模式將和是否執行過analyze命令有關. 如果table已經被analyze過, 優化器模式將自動成為CBO , 反之,資料庫將採用RULE形式的優化器.

    在預設情況下,ORACLE採用CHOOSE優化器, 為了避免那些不必要的全表掃描(full table scan) , 你必須儘量避免使用CHOOSE優化器,而直接採用基於規則或者基於成本的優化器.

    2.訪問Table的方式

    ORACLE 採用兩種訪問表中記錄的方式:

    1.全表掃描

    全表掃描就是順序地訪問表中每條記錄. ORACLE採用一次讀入多個資料塊(database block)的方式優化全表掃描.

    2.通過ROWID訪問表

    你可以採用基於ROWID的訪問方式情況,提高訪問表的效率, , ROWID包含了表中記錄的物理位置資訊..ORACLE採用索引(INDEX)實現了資料和存放資料的物理位置(ROWID)之間的聯絡. 通常索引提供了快速訪問ROWID的方法,因此那些基於索引列的查詢就可以得到效能上的提高.

    3.共享SQL語句

    為了不重複解析相同的SQL語句,在第一次解析之後, ORACLE將SQL語句存放在記憶體中.這塊位於系統全域性區域SGA(system global area)的共享池(shared buffer pool)中的記憶體可以被所有的資料庫使用者共享. 因此,當你執行一個SQL語句(有時被稱為一個遊標)時,如果它和之前的執行過的語句完全相同, ORACLE就能很快獲得已經被解析的語句以及最好的執行路徑. ORACLE的這個功能大大地提高了SQL的執行效能並節省了記憶體的使用.

    可惜的是ORACLE只對簡單的表提供高速緩衝(cache buffering) ,這個功能並不適用於多表連線查詢.

    資料庫管理員必須在init.ora中為這個區域設定合適的引數,當這個記憶體區域越大,就可以保留更多的語句,當然被共享的可能性也就越大了.

    當你向ORACLE 提交一個SQL語句,ORACLE會首先在這塊記憶體中查詢相同的語句.

    這裡需要註明的是,ORACLE對兩者採取的是一種嚴格匹配,要達成共享,SQL語句必須完全相同(包括空格,換行等).

    共享的語句必須滿足三個條件:

    A.字元級的比較:

    當前被執行的語句和共享池中的語句必須完全相同. 例如:

    SELECT * FROM EMP;

    和下列每一個都不同

    SELECT * from EMP;

    Select * From Emp;

    SELECT * FROM EMP;

    B.兩個語句所指的物件必須完全相同,例如:

使用者 物件名 如何訪問
Jack sal_limit private synonym
  Work_city public synonym
  Plant_detail public synonym
Jill sal_limit private synonym
  Work_city public synonym
  Plant_detail table owner

    考慮一下下列SQL語句能否在這兩個使用者之間共享.

 SQL 能否共享 原因
select max(sal_cap) from sal_limit; 不能 每個使用者都有一個private synonym - sal_limit , 它們是不同的物件
select count(*0 from work_city where sdesc like 'NEW%'; 兩個使用者訪問相同的物件public synonym - work_city
select a.sdesc,b.location from work_city a , plant_detail b where a.city_id = b.city_id 不能 使用者jack 通過private synonym訪問plant_detail 而jill 是表的所有者,物件不同

    C.兩個SQL語句中必須使用相同的名字的繫結變數(bind variables) ,例如:

    第一組的兩個SQL語句是相同的(可以共享),而第二組中的兩個語句是不同的(即使在執行時,賦於不同的繫結變數相同的值)

    a.

    select pin , name from people where pin = :blk1.pin;

    select pin , name from people where pin = :blk1.pin;

    b.

    select pin , name from people where pin = :blk1.ot_ind;

    select pin , name from people where pin = :blk1.ov_ind;

 

4. 選擇最有效率的表名順序(只在基於規則的優化器中有效)

  ORACLE的解析器按照從右到左的順序處理FROM子句中的表名,因此FROM子句中寫在最後的表(基礎表 driving table)將被最先處理。 在FROM子句中包含多個表的情況下,你必須選擇記錄條數最少的表作為基礎表。當ORACLE處理多個表時, 會運用排序及合併的方式連線它們。首先,掃描第一個表(FROM子句中最後的那個表)並對記錄進行派序,然後掃描第二個表(FROM子句中最後第二個表),最後將所有從第二個表中檢索出的記錄與第一個表中合適記錄進行合併。

  例如:

  表 TAB1 16,384 條記錄

  表 TAB2 1 條記錄

  選擇TAB2作為基礎表 (最好的方法)

  select count(*) from tab1,tab2 執行時間0.96秒

  選擇TAB2作為基礎表 (不佳的方法)

  select count(*) from tab2,tab1 執行時間26.09秒

  如果有3個以上的表連線查詢, 那就需要選擇交叉表(intersection table)作為基礎表, 交叉表是指那個被其他表所引用的表。

  例如: EMP表描述了LOCATION表和CATEGORY表的交集。
  
   SELECT *
FROM LOCATION L ,
      CATEGORY C,
      EMP E
WHERE E.EMP_NO BETWEEN 1000 AND 2000
AND E.CAT_NO = C.CAT_NO
AND E.LOCN = L.LOCN
  
  將比下列 SQL 更有效率
  
  SELECT *
FROM EMP E ,
LOCATION L ,
      CATEGORY C
WHERE E.CAT_NO = C.CAT_NO
AND E.LOCN = L.LOCN
AND E.EMP_NO BETWEEN 1000 AND 2000
  

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/219982/viewspace-498043/,如需轉載,請註明出處,否則將追究法律責任。

相關文章