使用智慧最佳化器提高Oracle的效能極限

lishiran發表於2007-04-08
  消耗在準備新的SQL語句的時間是Oracle SQL語句執行時間的最重要的組成部分。但是透過理解Oracle內部產生執行計劃的機制,你能夠控制Oracle花費在評估連線順序的時間數量,並且能在大體上提高查詢效能。[@more@]   準備執行SQL語句
   當SQL語句進入Oracle的庫快取後,在該語句準備執行之前,將執行下列步驟:
  
  1) 語法檢查:檢查SQL語句拼寫是否正確和詞序。
  
  2) 語義分析:核實所有的與資料字典不一致的表和列的名字。
  
  3) 輪廓儲存檢查:檢查資料字典,以確定該SQL語句的輪廓是否已經存在。
  
  4) 生成執行計劃:使用基於成本的最佳化規則和資料字典中的統計表來決定最佳執行計劃。
  
  5) 建立二進位制程式碼:基於執行計劃,Oracle生成二進位制執行程式碼。
  
  一旦為執行準備好了SQL語句,以後的執行將很快發生,因為Oracle認可同一個SQL語句,並且重用那些語句的執行。然而,對於生成特殊的SQL語句,或嵌入了文字變數的SQL語句的系統,SQL執行計劃的生成時間就很重要了,並且前一個執行計劃通常不能夠被重用。對那些連線了很多表的查詢,Oracle需要花費大量的時間來檢測連線這些表的適當順序。
  
  評估表的連線順序
   在SQL語句的準備過程中,花費最多的步驟是生成執行計劃,特別是處理有多個表連線的查詢。當Oracle評估表的連線順序時,它必須考慮到表之間所有可能的連線。例如:六個表的之間連線有720(6的階乘,或6 * 5 * 4 * 3 * 2 * 1 = 720)種可能的連線線路。當一個查詢中含有超過10個表的連線時,排列的問題將變得更為顯著。對於15個表之間的連線,需要評估的可能查詢排列將超過1萬億(準確的數字是1,307,674,368,000)種。
  
  使用optimizer_search_limit引數來設定限制
   透過使用optimizer_search_limit引數,你能夠指定被最佳化器用來評估的最大的連線組合數量。使用這個引數,我們將能夠防止最佳化器消耗不定數量的時間來評估所有可能的連線組合。如果在查詢中表的數目小於optimizer_search_limit的值,最佳化器將檢查所有可能的連線組合。
  
   例如:有五個表連線的查詢將有120(5! = 5 * 4 * 3 * 2 * 1 = 120)種可能的連線組合,因此如果optimizer_search_limit等於5(預設值),則最佳化器將評估所有的120種可能。optimizer_search_limit引數也控制著呼叫帶星號的連線提示的閥值。當查詢中的表的數目比optimizer_search_limit小時,帶星號的提示將被優先考慮。
  
  另一個工具:引數optimizer_max_permutations
  初始化引數optimizer_max_permutations定義了最佳化器所考慮組合數目的上限,且依賴於初始引數optimizer_search_limit。optimizer_max_permutations的預設值是80,000。
  
  引數optimizer_search_limit和optimizer_max_permutations一起來確定最佳化器所考慮的組合數目的上限:除非(表或組合數目)超過引數optimizer_search_limit 或者 optimizer_max_permutations設定的值,否則最佳化器將生成所有可能的連線組合。一旦最佳化器停止評估表的連線組合,它將選擇成本最低的組合。
  
  使用ordered提示指定連線順序
   你能夠設定最佳化器所執行的評估數目的上限。但是即使採用有很高價值的排列評估,我們仍然擁有使最佳化器可以儘早地放棄複雜的查詢的重要機會。回想一下含有15個連線查詢的例子,它將有超過1萬億種的連線組合。如果最佳化器在評估了80,000個組合後停止,那麼它才僅僅評估了0.000006%的可能組合,而且或許還沒有為這個巨大的查詢找到最佳的連線順序。
  
   在Oracle SQL中解決此問題的最好的方法是手工指定表的連線順序。為了儘快建立最小的解決方案集,這裡所遵循的規則是將表結合起來,通常優先使用限制最嚴格的WHERE子句來連線表。
  
   下面的程式碼是一個查詢執行計劃的例子,該例子在emp表的關聯查詢上強制執行了巢狀的迴圈連線。注意,我已經使用了ordered提示來直接最最佳化表的評估順序,最終它們表現在WHERE子句上。
  
  select /*+ ordered use_nl(bonus) parallel(e, 4) */
  
   e.ename,
  
  hiredate,
  
  b.comm.
  
  from
  
   emp e,
  
   bonus b
  
  where
  
   e.ename = b.ename
  
   這個例子要求最佳化器按順序連線在SQL語句的FROM子句中指定的表,在FROM子句中的第一個表指定了驅動表。ordered提示通常被用來與其它的提示聯合起來來保證採用正確的順序連線多個表。它的用途更多的是在扭轉連線表數在四個以上的資料倉儲的查詢方面。
  
   另外一個例子,下面的查詢使用ordered提示按照指定的順序來連線表:emp、dept、sal,最後是bonus。我透過指定emp到dept使用雜湊連線和sal到bonus使用巢狀迴圈連線,來進一步精煉執行計劃。
  
  select /*+ ordered use_hash (emp, dept) use_nl (sal, bonus) */
  
  from
  
  emp,
  
   dept,
  
   sal,
  
   bonus
  
  where . . .
  
  實踐建議
   實際上,更有效率的做法是在產品環境中減小optimizer_max_permutations引數的大小,並且總是使用穩定的最佳化計劃或儲存輪廓來防止出現耗時的含有大量連線的查詢。一旦找到最佳的連線順序,您就可以透過增加ordered提示到當前的查詢中,並儲存它的儲存輪廓,來為這些表手工指定連線順序,從而使其持久化。
  
   當你打算使用最佳化器來穩定計劃,則可以照下面的方法使執行計劃持久化,臨時將optimizer_search_limit設定為查詢中的表的數目,從而允許最佳化器考慮所有可能的連線順序。然後,透過重新編排WHERE子句中表的名字,並使用ordered提示,與儲存輪廓一起使變更持久化,來調整查詢。在查詢中包含四個以上的表時,ordered提示和儲存輪廓將排除耗時的評估SQL連線順序解析的任務,從而提高查詢的速度。
  
   一旦檢測到最佳的連線順序,我們就可以使用ordered提示來過載optimizer_search_limit和optimizer_max_permutations引數。ordered提示要求表按照它們出現在FROM子句中的順序進行連線,所以最佳化器沒有加入描述。
  
   作為一個Oracle專業人員,你應該知道在SQL語句第一次進入庫快取時可能存在重大的啟動延遲。但是聰明的Oracle DBA和開發人員能夠改變表的搜尋限制引數或者使用ordered提示來手工指定表的連線順序,從而顯著地減少最佳化和執行新查詢所需的時間。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/9099175/viewspace-909316/,如需轉載,請註明出處,否則將追究法律責任。

相關文章