MySQL的COUNT語句--count(*)、 count(常量)、 count(列名)

lhrbest發表於2019-10-21

MySQL的COUNT語句--count(*)、 count(常量)、 count(列名)

資料庫查詢相信很多人都不陌生,所有經常有人調侃程式設計師就是CRUD專員,這所謂的CRUD指的就是資料庫的增刪改查。

在資料庫的增刪改查操作中,使用最頻繁的就是查詢操作。 而在所有查詢操作中,統計數量操作更是經常被用到。

關於資料庫中行數統計,無論是MySQL還是Oracle,都有一個函式可以使用,那就是COUNT

但是,就是這個常用的COUNT函式,卻暗藏著很多玄機,尤其是在面試的時候,一不小心就會被虐。 不信的話請嘗試回答下以下問題:

1、COUNT有幾種用法?

2、COUNT(欄位名)和COUNT(*)的查詢結果有什麼不同?

3、COUNT(1)和COUNT(*)之間有什麼不同?

4、COUNT(1)和COUNT(*)之間的效率哪個更高?

5、為什麼《阿里巴巴Java開發手冊》建議使用COUNT(*)

6、MySQL的MyISAM引擎對COUNT(*)做了哪些優化?

7、MySQL的InnoDB引擎對COUNT(*)做了哪些優化?

8、上面提到的MySQL對COUNT(*)做的優化,有一個關鍵的前提是什麼?

9、SELECT COUNT(*) 的時候,加不加where條件有差別嗎?

10、COUNT(*)、COUNT(1)和COUNT(欄位名)的執行過程是怎樣的?

以上10道題,如果您可以全部準確無誤的回答的話,那說明你真的很瞭解COUNT函式了,如果有哪些知識點是不瞭解的,那麼本文正好可以幫你答疑解惑。

1、認識COUNT

關於COUNT函式,在MySQL官網中有詳細介紹:

MySQL的COUNT語句--count(*)、 count(常量)、 count(列名)

簡單翻譯一下:

1、COUNT(expr) ,返回SELECT語句檢索的行中expr的值不為NULL的數量。 結果是一個BIGINT值。

2、如果查詢結果沒有命中任何記錄,則返回0

3、但是,值得注意的是, COUNT(*)  的統計結果中,會包含值為NULL的行數。

create table t_count(id int,id2 int);
insert into t_count values(null,null);
insert into t_count values(1,null);
insert into t_count values(null,1);
insert into t_count values(1,null);
insert into t_count values(null,1);
insert into t_count values(1,null);
insert into t_count values(null,null);
select count(*),count(id),count(id2),count(1) from t_count;


即以下表記錄

root@localhost[lhrdb]> create table t_count(id int,id2 int);

Query OK, 0 rows affected (0.36 sec)


root@localhost[lhrdb]> 

root@localhost[lhrdb]> insert into t_count values(null,null);

Query OK, 1 row affected (0.07 sec)


root@localhost[lhrdb]> insert into t_count values(1,null);

Query OK, 1 row affected (0.06 sec)


root@localhost[lhrdb]> insert into t_count values(null,1);

Query OK, 1 row affected (0.08 sec)


root@localhost[lhrdb]> insert into t_count values(1,null);

Query OK, 1 row affected (0.03 sec)


root@localhost[lhrdb]> insert into t_count values(null,1);

Query OK, 1 row affected (0.05 sec)


root@localhost[lhrdb]> insert into t_count values(1,null);

Query OK, 1 row affected (0.03 sec)


root@localhost[lhrdb]> insert into t_count values(null,null);

Query OK, 1 row affected (0.08 sec)


root@localhost[lhrdb]> 

root@localhost[lhrdb]> select * from t_count;

+------+------+

| id   | id2  |

+------+------+

| NULL | NULL |

|    1 | NULL |

| NULL |    1 |

|    1 | NULL |

| NULL |    1 |

|    1 | NULL |

| NULL | NULL |

+------+------+

7 rows in set (0.00 sec)



使用語句count(*),count(id),count(id2)查詢結果如下:

root@localhost[lhrdb]> select count(*),count(id),count(id2),count(1),count(2) from t_count;

+----------+-----------+------------+----------+----------+

| count(*) | count(id) | count(id2) | count(1) | count(2) |

+----------+-----------+------------+----------+----------+

|        7 |         3 |          2 |        7 |        7 |

+----------+-----------+------------+----------+----------+

1 row in set (0.00 sec)



除了 COUNT(id) COUNT(*) 以外,還可以使用 COUNT(常量) (如 COUNT(1) )來統計行數,那麼這三條SQL語句有什麼區別呢? 到底哪種效率更高呢? 為什麼《阿里巴巴Java開發手冊》中強制要求不讓使用  COUNT(列名) 或  COUNT(常量) 來替代  COUNT(*) 呢?

MySQL的COUNT語句--count(*)、 count(常量)、 count(列名)



COUNT(列名)、COUNT(常量)和COUNT(*)之間的區別

前面我們提到過 COUNT(expr) 用於做行數統計,統計的是expr不為NULL的行數,那麼 COUNT(列名) 、  COUNT(常量)  和  COUNT(*) 這三種語法中,expr分別是 列名 、  常量  和 *

那麼 列名 、  常量  和  * 這三個條件中, 常量  是一個固定值,肯定不為NULL。 * 可以理解為查詢整行,所以肯定也不為NULL,那麼就只有 列名 的查詢結果有可能是NULL了。

所以,  COUNT(常量) 和  COUNT(*)表示的是直接查詢符合條件的資料庫表的行數。而 COUNT(列名)表示的是查詢符合條件的列的值不為NULL的行數。

除了查詢得到結果集有區別之外, COUNT(*) 相比 COUNT(常量)  和  COUNT(列名) 來講, COUNT(*)是SQL92定義的標準統計行數的語法,因為他是標準語法,所以MySQL資料庫對他進行過很多優化。

SQL92,是資料庫的一個ANSI/ISO標準。它定義了一種語言(SQL)以及資料庫的行為(事務、隔離級別等)。


COUNT(*)的優化

前面提到了 COUNT(*) 是SQL92定義的標準統計行數的語法,所以MySQL資料庫對他進行過很多優化。 那麼,具體都做過哪些事情呢?

這裡的介紹要區分不同的執行引擎。 MySQL中比較常用的執行引擎就是InnoDB和MyISAM。

MyISAM和InnoDB有很多區別,其中有一個關鍵的區別和我們接下來要介紹的 COUNT(*) 有關,那就是 MyISAM不支援事務,MyISAM中的鎖是表級鎖; 而InnoDB支援事務,並且支援行級鎖。

因為MyISAM的鎖是表級鎖,所以同一張表上面的操作需要序列進行,所以, MyISAM做了一個簡單的優化,那就是它可以把表的總行數單獨記錄下來,如果從一張表中使用COUNT(*)進行查詢的時候,可以直接返回這個記錄下來的數值就可以了,當然,前提是不能有where條件。

MyISAM之所以可以把表中的總行數記錄下來供COUNT(*)查詢使用,那是因為MyISAM資料庫是表級鎖,不會有併發的資料庫行數修改,所以查詢得到的行數是準確的。

但是,對於InnoDB來說,就不能做這種快取操作了,因為InnoDB支援事務,其中大部分操作都是行級鎖,所以可能表的行數可能會被併發修改,那麼快取記錄下來的總行數就不準確了。

但是,InnoDB還是針對COUNT(*)語句做了些優化的。

在InnoDB中,使用COUNT(*)查詢行數的時候,不可避免的要進行掃表了,那麼,就可以在掃表過程中下功夫來優化效率了。

從MySQL 8.0.13開始,針對InnoDB的 SELECT COUNT(*) FROM tbl_name 語句,確實在掃表的過程中做了一些優化。 前提是查詢語句中不包含WHERE或GROUP BY等條件。

我們知道,COUNT(*)的目的只是為了統計總行數,所以,他根本不關心自己查到的具體值,所以,他如果能夠在掃表的過程中,選擇一個成本較低的索引進行的話,那就可以大大節省時間。

我們知道,InnoDB中索引分為聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中儲存的是整行記錄,而非聚簇索引的葉子節點中儲存的是該行記錄的主鍵的值。

所以,相比之下,非聚簇索引要比聚簇索引小很多,所以 MySQL會優先選擇最小的非聚簇索引來掃表。 所以,當我們建表的時候,除了主鍵索引以外,建立一個非主鍵索引還是有必要的。

至此,我們介紹完了MySQL資料庫對於COUNT(*)的優化,這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。


COUNT(*)和COUNT(1)

介紹完了 COUNT(*) ,接下來看看 COUNT(1) ,對於,這二者到底有沒有區別,網上的說法眾說紛紜。

有的說 COUNT(*) 執行時會轉換成 COUNT(1) ,所以COUNT(1)少了轉換步驟,所以更快。

還有的說,因為MySQL針對 COUNT(*) 做了特殊優化,所以 COUNT(*) 更快。

那麼,到底哪種說法是對的呢? 看下MySQL官方文件是怎麼說的:

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.

畫重點: same way  ,  no performance difference 所以,對於COUNT(1)和COUNT(*),MySQL的優化是完全一樣的,根本不存在誰比誰快!

那既然 COUNT(*) COUNT(1) 一樣,建議用哪個呢?

建議使用 COUNT(*) 因為這個是SQL92定義的標準統計行數的語法,而且本文只是基於MySQL做了分析,關於Oracle中的這個問題,也是眾說紛紜的呢。


COUNT(欄位)

最後,就是我們一直還沒提到的COUNT(欄位),他的查詢就比較簡單粗暴了,就是進行全表掃描,然後判斷指定欄位的值是不是為NULL,不為NULL則累加。

相比 COUNT(*) COUNT(欄位) 多了一個步驟就是判斷所查詢的欄位是否為NULL,所以他的效能要比 COUNT(*) 慢。


總結

本文介紹了COUNT函式的用法,主要用於統計表行數。主要用法有 COUNT(*) COUNT(欄位) COUNT(1)

因為 COUNT(*) 是SQL92定義的標準統計行數的語法,所以MySQL對他進行了很多優化,MyISAM中會直接把表的總行數單獨記錄下來供 COUNT(*) 查詢,而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當然,這些優化的前提都是沒有進行where和group的條件查詢。

在InnoDB中 COUNT(*) COUNT(1) 實現上沒有區別,而且效率一樣,但是 COUNT(欄位) 需要進行欄位的非NULL判斷,所以效率會低一些。

因為 COUNT(*) 是SQL92定義的標準統計行數的語法,並且效率高,所以請直接使用 COUNT(*) 查詢表的行數!

參考資料:

https://dev.mysql.com/doc/refman/8.0/en/group-by-functions.html#function_count






About Me

........................................................................................................................

● 本文作者:小麥苗,部分內容整理自網路,若有侵權請聯絡小麥苗刪除

● 本文在itpub、部落格園、CSDN和個人微 信公眾號( xiaomaimiaolhr)上有同步更新

● 本文itpub地址: http://blog.itpub.net/26736162

● 本文部落格園地址: http://www.cnblogs.com/lhrbest

● 本文CSDN地址: https://blog.csdn.net/lihuarongaini

● 本文pdf版、個人簡介及小麥苗雲盤地址: http://blog.itpub.net/26736162/viewspace-1624453/

● 資料庫筆試面試題庫及解答: http://blog.itpub.net/26736162/viewspace-2134706/

● DBA寶典今日頭條號地址: http://www.toutiao.com/c/user/6401772890/#mid=1564638659405826

........................................................................................................................

● QQ群號: 230161599 、618766405

● 微 信群:可加我微 信,我拉大家進群,非誠勿擾

● 聯絡我請加QQ好友 646634621 ,註明新增緣由

● 於 2019-10-01 06:00 ~ 2019-10-31 24:00 在西安完成

● 最新修改時間:2019-10-01 06:00 ~ 2019-10-31 24:00

● 文章內容來源於小麥苗的學習筆記,部分整理自網路,若有侵權或不當之處還請諒解

● 版權所有,歡迎分享本文,轉載請保留出處

........................................................................................................................

小麥苗的微店https://weidian.com/s/793741433?wfr=c&ifr=shopdetail

小麥苗出版的資料庫類叢書http://blog.itpub.net/26736162/viewspace-2142121/

小麥苗OCP、OCM、高可用網路班http://blog.itpub.net/26736162/viewspace-2148098/

小麥苗騰訊課堂主頁https://lhr.ke.qq.com/

........................................................................................................................

使用 微 信客戶端掃描下面的二維碼來關注小麥苗的微 信公眾號( xiaomaimiaolhr)及QQ群(DBA寶典)、新增小麥苗微 信, 學習最實用的資料庫技術。

........................................................................................................................

歡迎與我聯絡

 

 



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/26736162/viewspace-2660733/,如需轉載,請註明出處,否則將追究法律責任。

相關文章