前言
對於一些原理性文章園中已有大量的文章尤其是關於索引這一塊,我也是花費大量時間去學習,對於瞭解索引原理對於後續理解查詢計劃和效能調優有很大的幫助,而我們只是一些內容進行概括和總結,這一節我們開始正式步入學習SQL中簡單的查詢語句,簡短的內容,深入的理解,Always to review the basics。
簡單查詢語句
所有複雜的語句都是由簡單的語句組成基本都是由SELECT、FROM、WHERE、GROUP BY、HAVING、ORDER BY等組成,當然還包括一些謂詞等等。比如當我們要查詢某表中所有資料時我們會像如下進行。
SELECT * FROM TABLE
到這裡是不是查詢就是從SELECT開始呢?我們應該從實際生活舉例,如我們需要到菜市場買菜,我們想買芹菜,我們應該是到有芹菜的攤位上去買,也就是從哪裡去買,到這裡我們會發現上述查詢資料的順序應該是先FROM然後是SELECT。在SQL 2012基礎教程中列出子句是按照以下順序進行邏輯處理。
1 FROM 2 WHERE 3 GROUP BY 4 HAVING 5 SELECT 6 ORDER BY
比如我們要查詢篩選客戶71下的訂單,我們會進行如下查詢。
SELECT empid, YEAR(orderdate) AS orderyear, COUNT(*) AS numbers FROM Sales.Orders WHERE custid = '71' GROUP BY empid, YEAR(orderdate) HAVING COUNT(*) > 1 ORDER BY empid, orderyear
但是實際上按照我們上述所說的順序,其邏輯化的子句是這樣的。
FROM Sales.Orders WHERE custid = 71 GROUP BY empid, YEAR(orderdate) HAVING COUNT(*) > 1 SELECT empid, YEAR(orderdate) AS orderyear, COUNT(*) AS numberorders ORDER BY empid, orderyear
對於博主的SQL系列並非會將SELECT、HAVING等語句單獨拿來講,針對的是有了一定基礎的人群,後續內容也是如此,所以到了這裡我們算是將簡單查詢語句敘述完畢。但是我一直強調的是簡短的內容,深入的理解,所以接下來看看有些需要注意的地方。
我們看到過很多文章一直在講SQL效能問題,比如在查詢所有資料時要列出所有列而非SELECT *,所以在本系列中,我也會在適當的去講效能問題,比如本節要講的SELECT 1和SELECT *的效能問題。
SELECT 1和SELECT *效能探討
在資料庫中檢視執行計劃時我們通常會點選【顯示估計的執行計劃】快捷鍵是Ctrl+L,這裡我們可以看到它已經表明顯示的只是估計的執行計劃,所以是不準確的,所以為了顯示實際的執行計劃,我們應該啟動【包括實際的執行計劃】,快捷鍵是Ctrl+M,這樣才能得到比較準確的執行計劃,如下
查詢方式一(整表查詢)
USE TSQL2012 GO IF EXISTS( SELECT 1 FROM Sales.Orders) SELECT 'SELECT 1' GO IF EXISTS( SELECT * FROM Sales.Orders) SELECT 'SELECT *' GO
此時檢視執行計劃是相同的,如下:
查詢方式二(在索引列上條件查詢)
我們對某一列建立索引
CREATE INDEX ix_shipname
ON Sales.Orders(shipname)
接下來繼續檢視其執行計劃。
此時顯示查詢計劃依然一樣。我們再來看看其他查詢方式。
查詢方式三(使用聚合函式)
USE TSQL2012 GO IF ( SELECT 1 FROM Sales.Orders WHERE shipname = 'Ship to 85-B') = 1 SELECT 'SELECT 1' GO IF ( SELECT COUNT(*) FROM Sales.Orders WHERE shipname = 'Ship to 85-B') = 1 SELECT 'SELECT *' GO
我們看到查詢計劃依然一樣。
查詢方式四(使用聚合函式Count在非索引列上查詢)
USE TSQL2012 GO IF ( SELECT COUNT(1) FROM Sales.Orders WHERE freight = '41.3400') = 1 SELECT 'SELECT 1' GO IF ( SELECT COUNT(*) FROM Sales.Orders WHERE freight = '41.3400') = 1 SELECT 'SELECT *' GO
我們看到執行計劃還是一樣。
查詢方式五(子查詢)
我們看看在子查詢中二者效能如何
USE TSQL2012 SELECT custid, companyname FROM Sales.Customers AS C WHERE country = N'USA' AND EXISTS (SELECT * FROM Sales.Orders AS O WHERE O.custid = C.custid) GO SELECT custid, companyname FROM Sales.Customers AS C WHERE country = N'USA' AND EXISTS (SELECT 1 FROM Sales.Orders AS O WHERE O.custid = C.custid)
此時結果二者檢視執行計劃還是一樣
查詢方式六(在檢視中查詢)
我們建立檢視繼續來比較SELECT 1和SELECT *的效能
USE TSQL2012 Go CREATE VIEW SaleOdersView AS SELECT shipaddress,shipname,(SELECT unitprice FROM Sales.OrderDetails AS sod where sod.orderid = so.orderid) as tc3 FROM Sales.Orders AS so GO
進行檢視查詢
USE TSQL2012 SELECT 1 FROM dbo.SaleOdersView go SELECT * FROM dbo.SaleOdersView go
結果執行計劃如下:
此時我們通過上述圖發現利用檢視查詢時,SELECT *的效能是如此低下佔有97%,而SELECT 1才3%,這是為何呢?不明白其中原因,希望有清楚其中原因的園友能夠留下你們的評論給出合理的解釋。
SELECT 所有列和SELECT *效能探討
一直以來所有教程都在講SELECT *效能比SELECT 所有列效能低,同時也給出了合理的理由,我也一直這樣認為,但是在查資料學習過程中,發現如下一段話。
I don’t think there is any difference, as long as the SELECT 1/* is inside EXISTS, which really doesn’t return any rows – it just returns boolean as soon as condition of the WHERE is checked. I’m quite sure that the SQL Server Query Optimizer is smart enough not to search for the unneeded meta data in the case of EXISTS. I agree that in all the other situations SELECT * shouldn’t be used for the reasons Simon mentioned. Also, index usage wouldn’t be optimal etc. For me EXISTS (SELECT * ..) is the only place where I allow myself to write SELECT * in production code ;)
最後一句表明SELECT *使用的唯一場景是在EXISTS中,看到這裡顛覆我以往看的教程的想法,不太明確,真的是這樣嗎?
總結
通過以上對SELECT 1和SELECT *效能的探討,在檢視中利用SELECT *效能更加低下,同時也結合SELECT *儘量避免用,我是不是可以下結論我可以更傾向於用SELECT 1呢?第二點是看到上述所給的資料SELECT *在Exist中的效能是不是和一定SELECT 所有列一樣呢?這是我存在疑問的兩個問題,是不是我所疑問的兩個問題,沒有具體的答案,需要看應用場景呢?那應用場景又是在哪裡?畢竟不是專業的DBA,同時對SQL也研究不深,所以希望看到此文的讀者,能給出精彩的回答,同時也讓我學習學習。