深入理解SQL的四種連線-左外連線、右外連線、內連線、全連線

Roninwz發表於2017-09-22

1、內聯接(典型的聯接運算,使用像 =  或 <> 之類的比較運算子)。包括相等聯接和自然聯接。     
內聯接使用比較運算子根據每個表共有的列的值匹配兩個表中的行。例如,檢索 students和courses表中學生標識號相同的所有行。   
    
2、外聯接。
外聯接可以是左向外聯接、右向外聯接或完整外部聯接。     
在 FROM子句中指定外聯接時,可以由下列幾組關鍵字中的一組指定:     
1)LEFT  JOIN或LEFT OUTER JOIN     
左向外聯接的結果集包括  LEFT OUTER子句中指定的左表的所有行,而不僅僅是聯接列所匹配的行。如果左表的某行在右表中沒有匹配行,則在相關聯的結果集行中右表的所有選擇列表列均為空值。       
2)RIGHT  JOIN 或 RIGHT  OUTER  JOIN     
右向外聯接是左向外聯接的反向聯接。將返回右表的所有行。如果右表的某行在左表中沒有匹配行,則將為左表返回空值。       
3)FULL  JOIN 或 FULL OUTER JOIN
完整外部聯接返回左表和右表中的所有行。當某行在另一個表中沒有匹配行時,則另一個表的選擇列表列包含空值。如果表之間有匹配行,則整個結果集行包含基表的資料值。   

3、交叉聯接   
交叉聯接返回左表中的所有行,左表中的每一行與右表中的所有行組合。交叉聯接也稱作笛卡爾積。    
FROM 子句中的表或檢視可通過內聯接或完整外部聯接按任意順序指定;但是,用左或右向外聯接指定表或檢視時,表或檢視的順序很重要。有關使用左或右向外聯接排列表的更多資訊,請參見使用外聯接。     

例子:   
-------------------------------------------------
  a表     id   name     b表     id   job   parent_id   
              1   張3                   1     23     1   
              2   李四                 2     34     2   
              3   王武                 3     34     4       
  a.id同parent_id   存在關係   
--------------------------------------------------    
 1) 內連線   
  select   a.*,b.*   from   a   inner   join   b     on   a.id=b.parent_id       
  結果是     
  1   張3                   1     23     1   
  2   李四                  2     34     2   

  2)左連線   
  select   a.*,b.*   from   a   left   join   b     on   a.id=b.parent_id       
  結果是     
  1   張3                   1     23     1   
  2   李四                  2     34     2   
  3   王武                  null   

 3) 右連線   
  select   a.*,b.*   from   a   right   join   b     on   a.id=b.parent_id       
  結果是     
  1   張3                   1     23     1   
  2   李四                  2     34     2   
  null                       3     34     4   

 4) 完全連線   
  select   a.*,b.*   from   a   full   join   b     on   a.id=b.parent_id   
  結果是     
  1   張3                  1     23     1   
  2   李四                 2     34     2   
  null                   3     34     4   
  3   王武                 null
--------------------------------------------------------------------------------------------一、交叉連線(CROSS JOIN)
交叉連線(CROSS JOIN):有兩種,顯式的和隱式的,不帶ON子句,返回的是兩表的乘積,也叫笛卡爾積。
例如:下面的語句1和語句2的結果是相同的。

語句1:隱式的交叉連線,沒有CROSS JOIN。
SELECT O.ID, O.ORDER_NUMBER, C.ID, C.NAME
FROM ORDERS O , CUSTOMERS C
WHERE O.ID=1;

語句2:顯式的交叉連線,使用CROSS JOIN。
SELECT O.ID,O.ORDER_NUMBER,C.ID,
C.NAME
FROM ORDERS O CROSS JOIN CUSTOMERS C
WHERE O.ID=1;
語句1和語句2的結果是相同的,查詢結果如下:

二、內連線(INNER JOIN)
內連線(INNER JOIN):有兩種,顯式的和隱式的,返回連線表中符合連線條件和查詢條件的資料行。(所謂的連結表就是資料庫在做查詢形成的中間表)。
例如:下面的語句3和語句4的結果是相同的。

語句3:隱式的內連線,沒有INNER JOIN,形成的中間表為兩個表的笛卡爾積。
SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME
FROM CUSTOMERS C,ORDERS O
WHERE C.ID=O.CUSTOMER_ID;

語句4:顯示的內連線,一般稱為內連線,有INNER JOIN,形成的中間表為兩個表經過ON條件過濾後的笛卡爾積。
SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME
FROM CUSTOMERS C INNER JOIN ORDERS O ON C.ID=O.CUSTOMER_ID;
語句3和語句4的查詢結果:

三、外連線(OUTER JOIN):外連不但返回符合連線和查詢條件的資料行,還返回不符合條件的一些行。外連線分三類:左外連線(LEFT OUTER JOIN)、右外連線(RIGHT OUTER JOIN)和全外連線(FULL OUTER JOIN)。
三者的共同點是都返回符合連線條件和查詢條件(即:內連線)的資料行。不同點如下:
左外連線還返回左表中不符合連線條件單符合查詢條件的資料行。
右外連線還返回右表中不符合連線條件單符合查詢條件的資料行。
全外連線還返回左表中不符合連線條件單符合查詢條件的資料行,並且還返回右表中不符合連線條件單符合查詢條件的資料行。全外連線實際是上左外連線和右外連線的數學合集(去掉重複),即“全外=左外 UNION 右外”。
說明:左表就是在“(LEFT OUTER JOIN)”關鍵字左邊的表。右表當然就是右邊的了。在三種型別的外連線中,OUTER 關鍵字是可省略的。

下面舉例說明:
語句5:左外連線(LEFT OUTER JOIN)
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;

語句6:右外連線(RIGHT OUTER JOIN)
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
注意:WHERE條件放在ON後面查詢的結果是不一樣的。例如:

語句7:WHERE條件獨立。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
WHERE O.ORDER_NUMBER<>'MIKE_ORDER001';

語句8:將語句7中的WHERE條件放到ON後面。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID AND O.ORDER_NUMBER<>'MIKE_ORDER001';

從語句7和語句8查詢的結果來看,顯然是不相同的,語句8顯示的結果是難以理解的。因此,推薦在寫連線查詢的時候,ON後面只跟連線條件,而對中間表限制的條件都寫到WHERE子句中。

語句9:全外連線(FULL OUTER JOIN)。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
注意:MySQL是不支援全外的連線的,這裡給出的寫法適合Oracle和DB2。但是可以通過左外和右外求合集來獲取全外連線的查詢結果。下圖是上面SQL在Oracle下執行的結果:

語句10:左外和右外的合集,實際上查詢結果和語句9是相同的。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
UNION
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
語句9和語句10的查詢結果是相同的,如下:

四、聯合連線(UNION JOIN):這是一種很少見的連線方式。Oracle、MySQL均不支援,其作用是:找出全外連線和內連線之間差異的所有行。這在資料分析中排錯中比較常用。也可以利用資料庫的集合操作來實現此功能。
語句11:聯合查詢(UNION JOIN)例句,還沒有找到能執行的SQL環境。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O UNION JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID

語句12:語句11在DB2下的等價實現。還不知道DB2是否支援語句11呢!
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
EXCEPT
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O INNER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;

語句13:語句11在Oracle下的等價實現。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
MINUS
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O INNER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
查詢結果如下:

五、自然連線(NATURAL INNER JOIN):說真的,這種連線查詢沒有存在的價值,既然是SQL2標準中定義的,就給出個例子看看吧。自然連線無需指定連線列,SQL會檢查兩個表中是否相同名稱的列,且假設他們在連線條件中使用,並且在連線條件中僅包含一個連線列。不允許使用ON語句,不允許指定顯示列,顯示列只能用*表示(ORACLE環境下測試的)。對於每種連線型別(除了交叉連線外),均可指定NATURAL。下面給出幾個例子。
語句14:
SELECT *
FROM ORDERS O NATURAL INNER JOIN CUSTOMERS C;

語句15:
SELECT *
FROM ORDERS O NATURAL LEFT OUTER JOIN CUSTOMERS C;

語句16:
SELECT *
FROM ORDERS O NATURAL RIGHT OUTER JOIN CUSTOMERS C;

語句17:
SELECT *
FROM ORDERS O NATURAL FULL OUTER JOIN CUSTOMERS C;

六、SQL查詢的基本原理:兩種情況介紹。
第一、
單表查詢:根據WHERE條件過濾表中的記錄,形成中間表(這個中間表對使用者是不可見的);然後根據SELECT的選擇列選擇相應的列進行返回最終結果。

第二、兩表連線查詢:對兩表求積(笛卡爾積)並用ON條件和連線連線型別進行過濾形成中間表;然後根據WHERE條件過濾中間表的記錄,並根據SELECT指定的列返回查詢結果。

第三、
多表連線查詢:先對第一個和第二個表按照兩表連線做查詢,然後用查詢結果和第三個表做連線查詢,以此類推,直到所有的表都連線上為止,最終形成一箇中間的結果表,然後根據WHERE條件過濾中間表的記錄,並根據SELECT指定的列返回查詢結果。
理解SQL查詢的過程是進行SQL優化的理論依據。

七、ON後面的條件(ON條件)和WHERE條件的區別:
ON條件:是過濾兩個連結表笛卡爾積形成中間表的約束條件。
WHERE條件:在有ON條件的SELECT語句中是過濾中間表的約束條件。在沒有ON的單表查詢中,是限制物理表或者中間查詢結果返回記錄的約束。在兩表或多表連線中是限制連線形成最終中間表的返回結果的約束。
從這裡可以看出,將WHERE條件移入ON後面是不恰當的。推薦的做法是:
ON只進行連線操作,WHERE只過濾中間表的記錄。

八、總結
連線查詢是SQL查詢的核心,連線查詢的連線型別選擇依據實際需求。如果選擇不當,非但不能提高查詢效率,反而會帶來一些邏輯錯誤或者效能低下。下面總結一下兩表連線查詢選擇方式的依據:
1、 查兩表關聯列相等的資料用內連線。
2、 Col_L是Col_R的子集時用右外連線。
3、 Col_R是Col_L的子集時用左外連線。
4、 Col_R和Col_L彼此有交集但彼此互不為子集時候用全外。
5、 求差操作的時候用聯合查詢。
多個表查詢的時候,這些不同的連線型別可以寫到一塊。例如:
SELECT T1.C1,T2.CX,T3.CY
FROM TAB1 T1
       INNER JOIN TAB2 T2 ON (T1.C1=T2.C2)
       INNER JOIN TAB3 T3 ON (T1.C1=T2.C3)
       LEFT OUTER JOIN TAB4 ON(T2.C2=T3.C3);
WHERE T1.X >T3.Y;

上面這個SQL查詢是多表連線的一個示範。


轉載來自:http://www.jb51.net/article/39432.htm

相關文章