sql查詢過程表述

dingonet發表於2008-04-07
對效能最佳化比較具有參考價值[@more@]

一、交叉連線(CROSS JOIN)

交叉連線(CROSS JOIN):有兩種,顯式的和隱式的,不帶ON子句,返回的是兩表的乘積,也叫笛卡爾積。

例如:下面的語句1和語句2的結果是相同的。
語句1:隱式的交叉連線,沒有CROSS JOIN。
SELECT O.ID, O.ORDER_NUMBER, C.ID, C.NAME
FROM ORDERS O , CUSTOMERS C
WHERE O.ID=1;

語句2:顯式的交叉連線,使用CROSS JOIN。
SELECT O.ID,O.ORDER_NUMBER,C.ID,
C.NAME
FROM ORDERS O CROSS JOIN CUSTOMERS C
WHERE O.ID=1;
語句1和語句2的結果是相同的,查詢結果如下:



二、內連線(INNER JOIN)

內連線(INNER JOIN):有兩種,顯式的和隱式的,返回連線表中符合連線條件和查詢條件的資料行。(所謂的連結表就是資料庫在做查詢形成的中間表)。

例如:下面的語句3和語句4的結果是相同的。
語句3:隱式的內連線,沒有INNER JOIN,形成的中間表為兩個表的笛卡爾積。
SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME
FROM CUSTOMERS C,ORDERS O
WHERE C.ID=O.CUSTOMER_ID;

語句4:顯示的內連線,一般稱為內連線,有INNER JOIN,形成的中間表為兩個表經過ON條件過濾後的笛卡爾積。
SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME
FROM CUSTOMERS C INNER JOIN ORDERS O ON C.ID=O.CUSTOMER_ID;
語句3和語句4的查詢結果:


三、外連線(OUTER JOIN):外連不但返回符合連線和查詢條件的資料行,還返回不符合條件的一些行。外連線分三類:左外連線(LEFT OUTER JOIN)、右外連線(RIGHT OUTER JOIN)和全外連線(FULL OUTER JOIN)。
三者的共同點是都返回符合連線條件和查詢條件(即:內連線)的資料行。不同點如下:
左外連線還返回左表中不符合連線條件單符合查詢條件的資料行。
右外連線還返回右表中不符合連線條件單符合查詢條件的資料行。
全外連線還返回左表中不符合連線條件單符合查詢條件的資料行,並且還返回右表中不符合連線條件單符合查詢條件的資料行。全外連線實際是上左外連線和右外連線的數學合集(去掉重複),即“全外=左外 UNION 右外”。
說明:左表就是在“(LEFT OUTER JOIN)”關鍵字左邊的表。右表當然就是右邊的了。在三種型別的外連線中,OUTER 關鍵字是可省略的。
下面舉例說明:

語句5:左外連線(LEFT OUTER JOIN)
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;

語句6:右外連線(RIGHT OUTER JOIN)
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
注意:WHERE條件放在ON後面查詢的結果是不一樣的。例如:


語句7:WHERE條件獨立。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
WHERE O.ORDER_NUMBER<>'MIKE_ORDER001';


語句8:將語句7中的WHERE條件放到ON後面。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID AND O.ORDER_NUMBER<>'MIKE_ORDER001';


從語句7和語句8查詢的結果來看,顯然是不相同的,語句8顯示的結果是難以理解的。因此,推薦在寫連線查詢的時候,ON後面只跟連線條件,而對中間表限制的條件都寫到WHERE子句中。

語句9:全外連線(FULL OUTER JOIN)。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
注意:MySQL是不支援全外的連線的,這裡給出的寫法適合Oracle和DB2。但是可以透過左外和右外求合集來獲取全外連線的查詢結果。下圖是上面SQL在Oracle下執行的結果:

語句10:左外和右外的合集,實際上查詢結果和語句9是相同的。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
UNION
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;

語句9和語句10的查詢結果是相同的,如下:


四、聯合連線(UNION JOIN):這是一種很少見的連線方式。Oracle、MySQL均不支援,其作用是:找出全外連線和內連線之間差異的所有行。這在資料分析中排錯中比較常用。也可以利用資料庫的集合操作來實現此功能。
語句11:聯合查詢(UNION JOIN)例句,還沒有找到能執行的SQL環境。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O UNION JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID

語句12:語句11在DB2下的等價實現。還不知道DB2是否支援語句11呢!
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
EXCEPT
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O INNER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;

語句13:語句11在Oracle下的等價實現。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
MINUS
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O INNER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
查詢結果如下:


五、自然連線(NATURAL INNER JOIN):說真的,這種連線查詢沒有存在的價值,既然是SQL2標準中定義的,就給出個例子看看吧。自然連線無需指定連線列,SQL會檢查兩個表中是否相同名稱的列,且假設他們在連線條件中使用,並且在連線條件中僅包含一個連線列。不允許使用ON語句,不允許指定顯示列,顯示列只能用*表示(ORACLE環境下測試的)。對於每種連線型別(除了交叉連線外),均可指定NATURAL。下面給出幾個例子。
語句14:
SELECT *
FROM ORDERS O NATURAL INNER JOIN CUSTOMERS C;


語句15:
SELECT *
FROM ORDERS O NATURAL LEFT OUTER JOIN CUSTOMERS C;


語句16:
SELECT *
FROM ORDERS O NATURAL RIGHT OUTER JOIN CUSTOMERS C;


語句17:
SELECT *
FROM ORDERS O NATURAL FULL OUTER JOIN CUSTOMERS C;


六、SQL查詢的基本原理:兩種情況介紹。
第一、 單表查詢:根據WHERE條件過濾表中的記錄,形成中間表(這個中間表對使用者是不可見的);然後根據SELECT的選擇列選擇相應的列進行返回最終結果。
第二、 兩表連線查詢:對兩表求積(笛卡爾積)並用ON條件和連線連線型別進行過濾形成中間表;然後根據WHERE條件過濾中間表的記錄,並根據SELECT指定的列返回查詢結果。
第三、 多表連線查詢:先對第一個和第二個表按照兩表連線做查詢,然後用查詢結果和第三個表做連線查詢,以此類推,直到所有的表都連線上為止,最終形成一箇中間的結果表,然後根據WHERE條件過濾中間表的記錄,並根據SELECT指定的列返回查詢結果。
理解SQL查詢的過程是進行SQL最佳化的理論依據。

七、ON後面的條件(ON條件)和WHERE條件的區別:

ON條件:是過濾兩個連結表笛卡爾積形成中間表的約束條件。
WHERE條件:在有ON條件的SELECT語句中是過濾中間表的約束條件。在沒有ON的單表查詢中,是限制物理表或者中間查詢結果返回記錄的約束。在兩表或多表連線中是限制連線形成最終中間表的返回結果的約束。
從這裡可以看出,將WHERE條件移入ON後面是不恰當的。推薦的做法是:
ON只進行連線操作,WHERE只過濾中間表的記錄。

八、總結
連線查詢是SQL查詢的核心,連線查詢的連線型別選擇依據實際需求。如果選擇不當,非但不能提高查詢效率,反而會帶來一些邏輯錯誤或者效能低下。下面總結一下兩表連線查詢選擇方式的依據:


1、 查兩表關聯列相等的資料用內連線。
2、 Col_L是Col_R的子集時用右外連線。
3、 Col_R是Col_L的子集時用左外連線。
4、 Col_R和Col_L彼此有交集但彼此互不為子集時候用全外。
5、 求差操作的時候用聯合查詢。
多個表查詢的時候,這些不同的連線型別可以寫到一塊。例如:
SELECT T1.C1,T2.CX,T3.CY
FROM TAB1 T1
INNER JOIN TAB2 T2 ON (T1.C1=T2.C2)
INNER JOIN TAB3 T3 ON (T1.C1=T2.C3)
LEFT OUTER JOIN TAB4 ON(T2.C2=T3.C3);
WHERE T1.X >T3.Y;
上面這個SQL查詢是多表連線的一個示範。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/77544/viewspace-1001968/,如需轉載,請註明出處,否則將追究法律責任。

相關文章