Oracle SQL的硬解析和軟解析

xz43發表於2010-12-17

    我們都知道在Oracle中,每條SQL語句在執行之前都需要經過解析,這裡面又分為軟解析硬解析。在Oracle中存在兩種型別的SQL語句,一類為 DDL語句(資料定義語言,例如CREATE,DROP,ALTER),他們是從來不會共享使用的,也就是每次執行都需要進行硬解析。還有一類就是DML語句(資料操縱語言,例如INSERT,UPDATE,DELETE,SELECT),他們會根據情況選擇要麼進行硬解析,要麼進行軟解析。

 

一、SQL 解析過程

 

Oracle對此SQL將進行幾個步驟的處理過程:

    1、語法檢查(syntax check)檢查此sql的拼寫是否語法。

    2、語義檢查(semantic check)諸如檢查sql語句中的訪問物件是否存在及該使用者是否具備相應的許可權。

    3、對sql語句進行解析(prase)利用內部演算法對sql進行解析,生成解析樹(parse tree)及執行計劃(execution plan)

    4、執行sql,返回結果(execute and return)。

 

二、解析過程詳解

 

2.1 語法檢測

判斷一條SQL語句的語法是否符合SQL的規範,比如執行:

SQL> selet * from test;

我們就可以看出由於Select關鍵字少了一個“c”,這條語句就無法透過語法檢驗的步驟了。

 

2.2 語義檢查

語法正確的SQL語句在解析的第二個步驟就是判斷該SQL語句所訪問的表及列是否準確?使用者是否有許可權訪問或更改相應的表或列? 比如如下語句:

SQL> select * from test;

select * from test

*

ERROR at line 1:

ORA-00942: table or view does not exist

由於查詢使用者沒有可供訪問的test物件,因此該SQL語句無法透過語義檢查。

 

2.3 解析(Parse)

  2.3.1 Parse主要分為三種:

    1Hard Parse (硬解析)

    2Soft Parse (軟解析)

    3Soft Soft Parse(好像有些資料中並沒有將這個算在其中)

 

   Hard Parse就是上面提到的對提交的Sql完全重新從頭進行解析(當在Shared Pool中找不到時候將會進行此操作),總共有以下5個執行步驟:

    1:語法分析

    2:許可權與物件檢查

    3在共享池中檢查是否有完全相同的之前完全解析好的。如果存在,直接跳過45,執行Sql此時算soft parse。

    4:選擇執行計劃

    5:產生執行計劃

 

注:建立解析樹、生成執行計劃對於sql的執行來說是開銷昂貴的動作,所以,應當極力避免硬解析,儘量使用軟解析。這就是在很多專案中,倡導開發設計人員對功能相同的程式碼要努力保持程式碼的一致性,以及要在程式中多使用繫結變數的原因。

 

Soft Parse如果在Shared Pool中找到了與之完全相同的Sql解析好的結果後,會跳過Hard Parse中的後面的兩個步驟。

 

    Soft Soft Parse實際上是當設定了session_cursor_cache這個引數之後,Cursor被直接Cache在當前SessionPGA中的,在解析的時候只需要對其語法分析、許可權物件分析之後就可以轉到PGA中查詢了,如果發現完全相同的Cursor,就可以直接去取結果了,也就是實現了Soft Soft Parse。

 

   2.3.2 解析的步驟可以分為兩個步驟:

 

         1) 驗證SQL語句是否完全一致。

在這個步驟中,Oracle將會對傳遞進來的SQL語句使用HASH函式運算得出HASH值,再與共享池中現有語句的HASH值進行比較看是否一一對應。現有資料庫中SQL語句的HASH值我們可以透過訪問v$sqlv$sqlareav$sqltext等資料字典中的HASH_VALUE列查詢得出。

如果SQL語句的HASH值一致,那麼ORACLE事實上還需要對SQL語句的語義進行再次檢測,以決定是否一致。那麼為什麼Oracle需要再次對語句文字進行檢測呢?不是SQL語句的HASH值已經對應上了?事實上就算是SQL語句的HASH值已經對應上了,並不能說明這兩條SQL語句就已經可以共享了。

 

例如:假如使用者SYS有自己的一張表EMP,他要執行查詢語句:select * from emp使用者SYSTEM也有一張EMP表,同樣要查詢select * from emp;這樣他們兩條語句在文字上是一模一樣的,他們的HASH值也會一樣,但是由於涉及到查詢的相關表不一樣,他們事實上是無法共享的

 

SQL> conn / as sysdba

已連線。

SQL> show user

USER 為 "SYS"

SQL>  create table emp ( x int ) ;

表已建立。

SQL> select * from emp;

未選定行

SQL> conn system/admin;

已連線。

SQL>  create table emp ( x int );

表已建立。

SQL> select * from emp;

未選定行

SQL> select address,hash_value, executions, sql_text from v$sql where upper(sql_text) like 'SELECT * FROM EMP%';

ADDRESS      HASH_VALUE  EXECUTIONS    SQL_TEXT                                                                

-----------------------  ---------------------------------------------------------

2769AE64    1745700775     1         select * from emp                                                                                                                         

2769AE64    1745700775     1         select * from emp                                                    

2 rows selected.

 

從結果可以看到這2個查詢的語句文字和HASH值都是一樣的,但是由於查詢的物件不同,是無法共享的,不同情況的語句還是需要硬解析的。因此在檢查共享池共同SQL語句的時候,是需要根據具體情況而定的。

 

    可以進一步查詢v$sql_shared_cursor以得知SQL為何不能共享的原因:

SQL>select address,auth_check_mismatch,translation_mismatch,optimizer_mismatch 

from v$sql_shared_cursor where address in ( 

select address from v$sql where upper(sql_text) like 'SELECT * FROM EMP%' )  

 

ADDRESS     A T O

----------------  ----- -- -- 

2769AE64     N N N

2769AE64     Y Y N

 

TRANSLATION_MISMATCH 表示SQL遊標涉及到的資料物件是不同的;

AUTH_CHECK_MISMATCH 表示對同樣一條SQL語句轉換是不匹配的。

optimizer_mismatch 表示會話的最佳化器環境是不同的。

 

         2)  驗證SQL語句執行環境是否相同

 

比如同樣一條SQL語句,一個查詢會話加了/*+ first_rows */HINT,另外一個使用者加/*+ all_rows */HINT,他們就會產生不同的執行計劃,儘管他們是查詢同樣的資料。

 

透過如上檢查以後,如果SQL語句是一致的,那麼就會重用原有SQL語句的執行計劃和最佳化方案,也就是我們通常所說的軟解析。如果SQL語句沒有找到同樣的副本,那麼就需要進行硬解析了。

 

Oracle根據提交的SQL語句再查詢相應的資料物件是否有統計資訊。如果有統計資訊的話,那麼CBO將會使用這些統計資訊產生所有可能的執行計劃(可能多達成千上萬個)和相應的Cost,最終選擇Cost最低的那個執行計劃。如果查詢的資料物件無統計資訊,則按RBO的預設規則選擇相應的執行計劃。這個步驟也是解析中最耗費資源的,因此我們應該極力避免硬解析的產生。至此,解析的步驟已經全部完成,Oracle將會根據解析產生的執行計劃執行SQL語句和提取相應的資料。 

 

   2.4  執行sql,返回結果(execute and return)

 

三、繫結變數

    

    使用了Bind Var能提高效能主要是因為這樣做可以儘量避免不必要的硬分析(Hard Parse)而節約了時間,同時節約了大量的CPU資源。

 

    當一個Client提交一條SqlOracle後,Oracle 首先會對其進行解析(Parse),然後將解析結果提交給最佳化器(Optimiser)來進行最佳化而取得Oracle認為的最優的Query Plan,然後再按照這個最優的Plan來執行這個Sql語句(當然在這之中如果只需要軟解析的話會少部分步驟)

 

但是,當Oracle接到 Client提交的Sql後會首先在共享池(Shared Pool)裡面去查詢是否有之前已經解析好的與剛接到的這一個Sql完全相同的Sql(注意這裡說的是完全相同,既要求語句上的字元級別的完全相同,又要求涉及的物件也必須完全相同)。當發現有相同的以後解析器就不再對新的Sql在此解析而直接用之前解析好的結果了。這裡就節約瞭解析時間以及解析時候消耗的CPU資源。尤其是在OLTP中執行著的大量的短小Sql,效果就會比較明顯了。因為一條兩條Sql的時間可能不會有多少感覺,但是當量大了以後就會有比較明顯的感覺了。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/9399028/viewspace-682052/,如需轉載,請註明出處,否則將追究法律責任。

相關文章