在SQL Server中Count(*)或者Count(1)或者Count([列])或許是最常用的聚合函式。很多人其實對這三者之間是區分不清的。本文會闡述這三者的作用，關係以及背後的原理。

往常我經常會看到一些所謂的最佳化建議不使用Count(* )而是使用Count（1），從而可以提升效能，給出的理由是Count( *)會帶來全表掃描。而實際上如何寫Count並沒有區別。

Count(1)和Count(*)實際上的意思是，評估Count（）中的表示式是否為NULL，如果為NULL則不計數，而非NULL則會計數。比如我們看程式碼1所示，在Count中指定NULL（最佳化器不允許顯式指定NULL，因此需要賦值給變數才能指定）。

DECLARE @xx INT
SET @xx=NULL
 
SELECT COUNT(@xx) FROM [AdventureWorks2012].[Sales].[SalesOrderHeader]

由於所有行都為NULL，則結果全不計數為0，結果如圖1所示。

圖1.顯而易見，結果為0

因此當你指定Count(*）或者Count（1）或者無論Count(‘anything’)時結果都會一樣，因為這些值都不為NULL，如圖2所示。

圖2.只要在Count中指定非NULL表示式，結果沒有任何區別

那Count列呢？

對於Count（列）來說，同樣適用於上面規則，評估列中每一行的值是否為NULL，如果為NULL則不計數，不為NULL則計數。因此Count（列）會計算列或這列的組合不為空的計數。

那Count（*）具體如何執行？

前面提到Count( )有不為NULL的值時，在SQL Server中只需要找出具體表中不為NULL的行數即可，也就是所有行（如果一行值全為NULL則該行相當於不存在）。那麼最簡單的執行辦法是找一列NOT NULL的列，如果該列有索引，則使用該索引，當然，為了效能，SQL Server會選擇最窄的索引以減少IO。

我們在Adventureworks2012示例資料庫的[Person].[Address]表上刪除所有的非聚集索引，在ModifyDate這個資料型別為DateTime的列上建立索引，我們看執行計劃，如圖3所示：

圖3.使用了CreateDate的索引

我們繼續在StateProvinceID列上建立索引，該列為INT列，佔4位元組，相比之前8位元組 DateTime型別的列更短，因此SQL Server選擇了StateProvinceID索引。如圖4所示。

圖4.選擇了更短的StateProvinceID索引

因此，如果某個表上Count（*)用的比較多時，考慮在一個最短的列建立一個單列索引，會極大的提升效能。

SQL Server中count(*)和Count(1)的區別

那Count列呢？

那Count（*）具體如何執行？

相關文章