SQL語句執行順序

Davis_itpub發表於2018-06-27
sql語法的分析是從右到左

 

一、sql語句的執行步驟:

1)語法分析,分析語句的語法是否符合規範,衡量語句中各表示式的意義。

2)語義分析,檢查語句中涉及的所有資料庫物件是否存在,且使用者有相應的許可權。

3)檢視轉換,將涉及檢視的查詢語句轉換為相應的對基表查詢語句。

4)表示式轉換, 將複雜的 SQL 表示式轉換為較簡單的等效連線表示式。

5)選擇最佳化器,不同的最佳化器一般產生不同的“執行計劃”

6)選擇連線方式, ORACLE 有三種連線方式,對多表連線 ORACLE 可選擇適當的連線方式。

7)選擇連線順序, 對多表連線 ORACLE 選擇哪一對錶先連線,選擇這兩表中哪個表做為源資料表。

8)選擇資料的搜尋路徑,根據以上條件選擇合適的資料搜尋路徑,如是選用全表搜尋還是利用索引或是其他的方式。

9)執行“執行計劃”

 

 

二、oracle 共享原理:

     ORACLE將執行過的SQL語句存放在記憶體的共享池(shared buffer pool)中,可以被所有的資料庫使用者共享。

當你執行一個SQL語句(有時被稱為一個遊標)時,如果它和之前的執行過的語句完全相同,ORACLE就能很快獲得已經被解析的語句以及最好的執行路徑.。這個功能大大地提高了SQL的執行效能並節省了記憶體的使用。

 

三、oracle 語句提高查詢效率的方法:

1:where column in(select * from ... where ...);

2:... where exists (select 'X' from ...where ...);

 

第二種格式要遠比第一種格式的效率高。

 

在Oracle中可以幾乎將所有的IN運算子子查詢改寫為使用EXISTS的子查詢。

使用EXIST,Oracle系統會首先檢查主查詢,然後執行子查詢直到它找到第一個匹配項,

這就節省了時間Oracle系統在執行IN子查詢時,首先執行子查詢,並將獲得的結果列表存放在在一個加了索引的臨時表中。

 

避免使用having子句。HAVING 只會在檢索出所有記錄之後才對結果集進行過濾。

這個處理需要排序,總計等操作。如果能透過WHERE子句限制記錄的數目,那就能減少這方面的開銷。

 

四、SQL Select語句完整的執行順序: 

1、from子句組裝來自不同資料來源的資料;

2、where子句基於指定的條件對記錄行進行篩選;

3、group by子句將資料劃分為多個分組;

4、使用聚集函式進行計算;

5、使用having子句篩選分組;

6、計算所有的表示式;

7、select 的欄位;

8、使用order by對結果集進行排序。

SQL語言不同於其他程式語言的最明顯特徵是處理程式碼的順序。在大多資料庫語言中,程式碼按編碼順序被處理。但在SQL語句中,第一個被處理的子句式FROM,而不是第一齣現的SELECT。SQL查詢處理的步驟序號:

 

1  (8)SELECT  (9) DISTINCT (11) <TOP_specification> <select_list> 

2  (1)  FROM <left_table>  

3  (3) <join_type> JOIN <right_table> 

4  (2) ON <join_condition> 

5  (4) WHERE <where_condition> 

6  (5) GROUP BY <group_by_list> 

7  (6) WITH {CUBE | ROLLUP} 

8  (7) HAVING <having_condition> 

9 (10) ORDER BY <order_by_list>


以上每個步驟都會產生一個虛擬表,該虛擬表被用作下一個步驟的輸入。這些虛擬表對呼叫者(客戶端應用程式或者外部查詢)不可用。只有最後一步生成的表才會會給呼叫者。如果沒有在查詢中指定某一個子句,將跳過相應的步驟。

邏輯查詢處理階段簡介:

1、 FROM:對FROM子句中的前兩個表執行笛卡爾積(交叉聯接),生成虛擬表VT1。

2、 ON:對VT1應用ON篩選器,只有那些使為真才被插入到TV2。

3、 OUTER (JOIN):如果指定了OUTER JOIN(相對於CROSS JOIN或INNER JOIN),保留表中未找到匹配的行將作為外部行新增到VT2,生成TV3。如果FROM子句包含兩個以上的表,則對上一個聯接生成的結果表和下一個表重複執行步驟1到步驟3,直到處理完所有的表位置。

4、 WHERE:對TV3應用WHERE篩選器,只有使為true的行才插入TV4。

5、 GROUP BY:按GROUP BY子句中的列列表對TV4中的行進行分組,生成TV5。

6、 CUTE|ROLLUP:把超組插入VT5,生成VT6。

7、 HAVING:對VT6應用HAVING篩選器,只有使為true的組插入到VT7。

8、 SELECT:處理SELECT列表,產生VT8。

9、 DISTINCT:將重複的行從VT8中刪除,產品VT9。

10、ORDER BY:將VT9中的行按ORDER BY子句中的列列表順序,生成一個遊標(VC10)。

11、TOP:從VC10的開始處選擇指定數量或比例的行,生成表TV11,並返回給呼叫者。

 

Oracle中SQL語句執行過程中,Oracle內部解析原理如下:

  1、當一使用者第一次提交一個SQL表示式時,Oracle會將這SQL進行Hard parse,這過程有點像程式編譯,檢查語法、表名、欄位名等相關資訊(如下圖),這過程會花比較長的時間,因為它要分析語句的語法與語義。然後獲得最最佳化後的執行計劃(sql plan),並在記憶體中分配一定的空間儲存該語句與對應的執行計劃等資訊。

 

  2、當使用者第二次請求或多次請求時,Oracle會自動找到先前的語句與執行計劃,而不會進行Hard parse,而是直接進行Soft parse(把語句對應的執行計劃調出,然後執行),從而減少資料庫的分析時間。

 

  注意的是:Oracle中只能完全相同的語句,包大小寫、空格、換行都要求一樣時,才會重複使用以前的分析結果與執行計劃。

 

  分析過程如下圖:

SQL語句執行順序

 對於大量的、頻繁訪問的SQL語句,如果不採用Bind 變數的方式,哪Oracle會花費大量的Shared latch與CPU在做Hard parse處理,所以,要儘量提高語句的重用率,減少語句的分析時間,透過了解Oracle SQL語句的分析過程可以明白Oracle的內部處理邏輯,並在設計與實現上避免。

 

在用JDBC或其它持久化資料(如Hibernate,JDO等)操作時,儘量用佔位符(?)

 

ORACLE sql 的處理過程大致如下:

 1.運用HASH演算法,得到一個HASH值,這個值可以透過V$SQLAREA.HASH_VALUE 檢視

 2.到shared pool 中的 library cache 中查詢是否有相同的HASH值,如果存在,則無需硬解析,進行軟解析

 3.如果shared pool不存在此HASH值,則進行語法檢查,檢視是否有語法錯誤

 4.如果沒有語法錯誤,就進行語義檢查,檢查該SQL引用的物件是否存在,該使用者是否具有訪問該物件的許可權

 5.如果沒有語義錯誤,對該SQL進行解析,生成解析樹,執行計劃

 6.生成ORACLE能執行的二進位制程式碼,執行該程式碼並且返回結果給使用者

硬解析和軟解析都在第5步進行

硬解析通常是昂貴的操作,大約佔整個SQL執行的70%左右的時間,硬解析會生成執行樹,執行計劃,等等。

當再次執行同一條SQL語句的時候,由於發現library cache中有相同的HASH值,這個時候不會硬解析,而會軟解析,

那麼軟解析究竟是幹了什麼呢?其實軟解析就是跳過了生成解析樹,生成執行計劃這個耗時又耗CPU的操作,直接利用生成的執行計劃執行

該SQL語句。

下面摘抄eygle深入解析ORACLE 中關於SQL執行過程的描述

  1.首先獲得library cache latch,根據SQL的HASH_VALUE在library cache中查詢是否存在此HASH_VALUE,如果找到這個HASH_VALUE,稱之為軟解析,Server獲得改SQL執行計劃轉向第4步,如果找不到共享程式碼就進行硬解析。

  2.釋放library pool cache,獲得shared pool latch,查詢並鎖定自由空間(在bucket 中查詢chunk)。如果找不到,報ORA-04031錯誤。

  3.釋放shared pool latch,重新獲得library cache latch,將SQL執行計劃放入library cache中。

  4.釋放library cache latch,保持null模式的library cache pin/lock。

  5.開始執行。

Library cache latch可以理解為硬/軟解析的時候發生的,因為解析的時候會搜尋library cache,所以會產生library cache latch

Library cache pin 是在執行的階段發生的。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31520497/viewspace-2156893/,如需轉載,請註明出處,否則將追究法律責任。

相關文章