在SQL Server中,關於with as使用介紹

andy4319發表於2012-02-02
一.WITH AS的含義
    WITH AS短語,也叫做子查詢部分(subquery factoring),可以讓你做很多事情,定義一個SQL片斷,該SQL片斷會被整個SQL語句所用到。有的時候,是為了讓SQL語句的可讀性更高些,也有可能是在UNION ALL的不同部分,作為提供資料的部分。
特別對於UNION ALL比較有用。因為UNION ALL的每個部分可能相同,但是如果每個部分都去執行一遍的話,則成本太高,所以可以使用WITH AS短語,則只要執行一遍即可。如果WITH AS短語所定義的表名被呼叫兩次以上,則優化器會自動將WITH AS短語所獲取的資料放入一個TEMP表裡,如果只是被呼叫一次,則不會。而提示materialize則是強制將WITH AS短語裡的資料放入一個全域性臨時表裡。很多查詢通過這種方法都可以提高速度。
二.使用方法
先看下面一個巢狀的查詢語句:

select * from person.StateProvince where CountryRegionCode in
         (select CountryRegionCode from person.CountryRegion where Name like 'C%')

    上面的查詢語句使用了一個子查詢。雖然這條SQL語句並不複雜,但如果巢狀的層次過多,會使SQL語句非常難以閱讀和維護。因此,也可以使用表變數的方式來解決這個問題,SQL語句如下:

declare @t table(CountryRegionCode nvarchar(3))
insert into @t(CountryRegionCode) (select CountryRegionCode from person.CountryRegion where Name like 'C%')

select * from person.StateProvince where CountryRegionCode
                     in (select * from @t)


    雖然上面的SQL語句要比第一種方式更復雜,但卻將子查詢放在了表變數@t中,這樣做將使SQL語句更容易維護,但又會帶來另一個問題,就是效能的損失。由於表變數實際上使用了臨時表,從而增加了額外的I/O開銷,因此,表變數的方式並不太適合資料量大且頻繁查詢的情況。為此,在SQL Server 2005中提供了另外一種解決方案,這就是公用表表示式(CTE),使用CTE,可以使SQL語句的可維護性,同時,CTE要比表變數的效率高得多。

    下面是CTE的語法:

[ WITH <common_table_expression> [ ,n ] ]
<common_table_expression>::=
        expression_name [ ( column_name [ ,n ] ) ]
    AS
        ( CTE_query_definition )

    現在使用CTE來解決上面的問題,SQL語句如下:


with
cr as
(
    select CountryRegionCode from person.CountryRegion where Name like 'C%'
)

select * from person.StateProvince where CountryRegionCode in (select * from cr)

    其中cr是一個公用表表示式,該表示式在使用上與表變數類似,只是SQL Server 2005在處理公用表表示式的方式上有所不同。

    在使用CTE時應注意如下幾點:
1. CTE後面必須直接跟使用CTE的SQL語句(如select、insert、update等),否則,CTE將失效。如下面的SQL語句將無法正常使用CTE:


with
cr as
(
    select CountryRegionCode from person.CountryRegion where Name like 'C%'
)
select * from person.CountryRegion -- 應將這條SQL語句去掉
-- 使用CTE的SQL語句應緊跟在相關的CTE後面 --
select * from person.StateProvince where CountryRegionCode in (select * from cr)


2. CTE後面也可以跟其他的CTE,但只能使用一個with,多個CTE中間用逗號(,)分隔,如下面的SQL語句所示:


with
cte1 as
(
    select * from table1 where name like 'abc%'
),
cte2 as
(
    select * from table2 where id > 20
),
cte3 as
(
    select * from table3 where price < 100
)
select a.* from cte1 a, cte2 b, cte3 c where a.id = b.id and a.id = c.id

3. 如果CTE的表示式名稱與某個資料表或檢視重名,則緊跟在該CTE後面的SQL語句使用的仍然是CTE,當然,後面的SQL語句使用的就是資料表或檢視了,如下面的SQL語句所示:


-- table1是一個實際存在的表

with
table1 as
(
    select * from persons where age < 30
)
select * from table1 -- 使用了名為table1的公共表表示式
select * from table1 -- 使用了名為table1的資料表

4. CTE 可以引用自身,也可以引用在同一 WITH 子句中預先定義的 CTE。不允許前向引用。

5. 不能在 CTE_query_definition 中使用以下子句:

(1)COMPUTE 或 COMPUTE BY

(2)ORDER BY(除非指定了 TOP 子句)

(3)INTO

(4)帶有查詢提示的 OPTION 子句

(5)FOR XML

(6)FOR BROWSE

6. 如果將 CTE 用在屬於批處理的一部分的語句中,那麼在它之前的語句必須以分號結尾,如下面的SQL所示:

declare @s nvarchar(3)
set @s = 'C%'
; -- 必須加分號
with
t_tree as
(
    select CountryRegionCode from person.CountryRegion where Name like @s
)
select * from person.StateProvince where CountryRegionCode in (select * from t_tree)

    CTE除了可以簡化巢狀SQL語句外,還可以進行遞迴呼叫,關於這一部分的內容將在下一篇文章中介紹。

先看如下一個資料表(t_tree):

    上圖顯示了一個表中的資料,這個表有三個欄位:id、node_name、parent_id。實際上,這個表中儲存了一個樹型結構,分三層:省、市、區。其中id表示當前省、市或區的id號、node_name表示名稱、parent_id表示節點的父節點的id。
    現在有一個需求,要查詢出某個省下面的所有市和區(查詢結果包含省)。如果只使用SQL語句來實現,需要使用到遊標、臨時表等技術。但在SQL Server2005中還可以使用CTE來實現。

    從這個需求來看屬於遞迴呼叫,也就是說先查出滿足調價的省的記錄,在本例子中的要查“遼寧省”的記錄,如下:

id   node_name   parent_id

1     遼寧省        0

    然後再查所有parent_id欄位值為1的記錄,如下:

id   node_name   parent_id

2      瀋陽市       1

3      大連市       1

    最後再查parent_id欄位值為2或3的記錄,如下:

id    node_name    parent_id

4       大東區        2

5       瀋河區        2

6       鐵西區        2

    將上面三個結果集合並起來就是最終結果集。

    上述的查詢過程也可以按遞迴的過程進行理解,即先查指定的省的記錄(遼寧省),得到這條記錄後,就有了相應的id值,然後就進入了的遞迴過程,如下圖所示。



    從上面可以看出,遞迴的過程就是使用union all合併查詢結果集的過程,也就是相當於下面的遞迴公式:

    resultset(n) = resultset(n-1) union all current_resultset

    其中resultset(n)表示最終的結果集,resultset(n - 1)表示倒數第二個結果集,current_resultset表示當前查出來的結果集,而最開始查詢出“遼寧省”的記錄集相當於遞迴的初始條件。而遞迴的結束條件是current_resultset為空。下面是這個遞迴過程的虛擬碼:


public resultset getResultSet(resultset)
{
    if(resultset is null)
     {
         current_resultset =第一個結果集(包含省的記錄集)
         將結果集的id儲存在集合中
         getResultSet(current_resultset)
     }
     current_resultset = 根據id集合中的id值查出當前結果集
    if(current_result is null) return resultset
     將當前結果集的id儲存在集合中
    return   getResultSet(resultset union all current_resultset)
}

// 獲得最終結果集
resultset = getResultSet(null)


    從上面的過程可以看出,這一遞迴過程實現起來比較複雜,然而CTE為我們提供了簡單的語法來簡化這一過程。
    實現遞迴的CTE語法如下:



[ WITH <common_table_expression> [ ,n ] ]
<common_table_expression>::=
         expression_name [ ( column_name [ ,n ] ) ]
    AS (
        CTE_query_definition1  --   定位點成員(也就是初始值或第一個結果集)
       union all
        CTE_query_definition2  --   遞迴成員
     )

   



with
district as
(
    --   獲得第一個結果集,並更新最終結果集
    select * from t_tree where node_name= N'遼寧省'
    union all
    --   下面的select語句首先會根據從上一個查詢結果集中獲得的id值來查詢parent_id        
    --   欄位的值,然後district就會變當前的查詢結果集,並繼續執行下面的select 語句
    --   如果結果集不為null,則與最終的查詢結果合併,同時用合併的結果更新最終的查
    --   詢結果;否則停止執行。最後district的結果集就是最終結果集。
    select a.* from t_tree a, district b
               where a.parent_id = b.id
)
select * from district






with
district as
(
    select * from t_tree where node_name= N'遼寧省'
    union all
    select a.* from t_tree a, district b
               where a.parent_id = b.id
),
district1 as
(
    select a.* from district a where a.id in (select parent_id from district)   
)
select * from district1


  



    注:只有“遼寧省”和“瀋陽市”有下子節點。

    在定義和使用遞迴CTE時應注意如下幾點:

1. 遞迴 CTE 定義至少必須包含兩個 CTE 查詢定義,一個定位點成員和一個遞迴成員。可以定義多個定位點成員和遞迴成員;但必須將所有定位點成員查詢定義置於第一個遞迴成員定義之前。所有 CTE 查詢定義都是定位點成員,但它們引用 CTE 本身時除外。
2. 定位點成員必須與以下集合運算子之一結合使用:UNION ALL、UNION、INTERSECT 或 EXCEPT。在最後一個定位點成員和第一個遞迴成員之間,以及組合多個遞迴成員時,只能使用 UNION ALL 集合運算子。
3. 定位點成員和遞迴成員中的列數必須一致。
4. 遞迴成員中列的資料型別必須與定位點成員中相應列的資料型別一致。
5. 遞迴成員的 FROM 子句只能引用一次 CTE expression_name。
6. 在遞迴成員的 CTE_query_definition 中不允許出現下列項:

(1)SELECT DISTINCT

(2)GROUP BY

(3)HAVING

(4)標量聚合

(5)TOP

(6)LEFT、RIGHT、OUTER JOIN(允許出現 INNER JOIN)

(7)子查詢

(8)應用於對 CTE_query_definition 中的 CTE 的遞迴引用的提示。

7. 無論參與的 SELECT 語句返回的列的為空性如何,遞迴 CTE 返回的全部列都可以為空。
8. 如果遞迴 CTE 組合不正確,可能會導致無限迴圈。例如,如果遞迴成員查詢定義對父列和子列返回相同的值,則會造成無限迴圈。可以使用 MAXRECURSION 提示以及在 INSERT、UPDATE、DELETE 或 SELECT 語句的 OPTION 子句中的一個 0 到 32,767 之間的值,來限制特定語句所允許的遞迴級數,以防止出現無限迴圈。這樣就能夠在解決產生迴圈的程式碼問題之前控制語句的執行。伺服器範圍內的預設值是 100。如果指定 0,則沒有限制。每一個語句只能指定一個 MAXRECURSION 值。
9. 不能使用包含遞迴公用表表示式的檢視來更新資料。
10. 可以使用 CTE 在查詢上定義遊標。遞迴 CTE 只允許使用快速只進遊標和靜態(快照)遊標。如果在遞迴 CTE 中指定了其他遊標型別,則該型別將轉換為靜態遊標型別。
11. 可以在 CTE 中引用遠端伺服器中的表。如果在 CTE 的遞迴成員中引用了遠端伺服器,那麼將為每個遠端表建立一個假離線,這樣就可以在本地反覆訪問這些表。

相關文章