不就是SELECT COUNT語句嗎,竟然能被面試官虐的體無完膚
資料庫查詢相信很多人都不陌生,所有經常有人調侃程式設計師就是CRUD專員,這所謂的CRUD指的就是資料庫的增刪改查。
在資料庫的增刪改查操作中,使用最頻繁的就是查詢操作。而在所有查詢操作中,統計數量操作更是經常被用到。
關於資料庫中行數統計,無論是MySQL還是Oracle,都有一個函式可以使用,那就是COUNT。
但是,就是這個常用的COUNT函式,卻暗藏著很多玄機,尤其是在面試的時候,一不小心就會被虐。不信的話請嘗試回答下以下問題:
1、COUNT有幾種用法?
2、COUNT(欄位名)和COUNT(*)的查詢結果有什麼不同?
3、COUNT(1)和COUNT(*)之間有什麼不同?
4、COUNT(1)和COUNT(*)之間的效率哪個更高?
5、為什麼《阿里巴巴Java開發手冊》建議使用COUNT(*)
6、MySQL的MyISAM引擎對COUNT(*)做了哪些優化?
7、MySQL的InnoDB引擎對COUNT(*)做了哪些優化?
8、上面提到的MySQL對COUNT(*)做的優化,有一個關鍵的前提是什麼?
9、SELECT COUNT(*) 的時候,加不加where條件有差別嗎?
10、COUNT(*)、COUNT(1)和COUNT(欄位名)的執行過程是怎樣的?
以上10道題,如果您可以全部準確無誤的回答的話,那說明你真的很瞭解COUNT函式了,如果有哪些知識點是不瞭解的,那麼本文正好可以幫你答疑解惑。
認識COUNT
關於COUNT函式,在MySQL官網中有詳細介紹:
簡單翻譯一下:
1、COUNT(expr) ,返回SELECT語句檢索的行中expr的值不為NULL的數量。結果是一個BIGINT值。
2、如果查詢結果沒有命中任何記錄,則返回0
3、但是,值得注意的是,COUNT(*)
的統計結果中,會包含值為NULL的行數。
即以下表記錄
create table #bla(id int,id2 int)
insert #bla values(null,null)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,null)
使用語句count(*),count(id),count(id2)查詢結果如下:
select count(*),count(id),count(id2)
from #bla
results 7 3 2
除了COUNT(id)
和COUNT(*)
以外,還可以使用COUNT(常量)
(如COUNT(1)
)來統計行數,那麼這三條SQL語句有什麼區別呢?到底哪種效率更高呢?為什麼《阿里巴巴Java開發手冊》中強制要求不讓使用 COUNT(列名)
或 COUNT(常量)
來替代 COUNT(*)
呢?
COUNT(列名)、COUNT(常量)和COUNT(*)之間的區別
前面我們提到過COUNT(expr)
用於做行數統計,統計的是expr不為NULL的行數,那麼COUNT(列名)
、 COUNT(常量)
和 COUNT(*)
這三種語法中,expr分別是列名
、 常量
和 *
。
那麼列名
、 常量
和 *
這三個條件中,常量
是一個固定值,肯定不為NULL。*
可以理解為查詢整行,所以肯定也不為NULL,那麼就只有列名
的查詢結果有可能是NULL了。
所以, COUNT(常量)
和 COUNT(*)
表示的是直接查詢符合條件的資料庫表的行數。而COUNT(列名)
表示的是查詢符合條件的列的值不為NULL的行數。
除了查詢得到結果集有區別之外,COUNT(*)
相比COUNT(常量)
和 COUNT(列名)
來講,COUNT(*)是SQL92定義的標準統計行數的語法,因為他是標準語法,所以MySQL資料庫對他進行過很多優化。
SQL92,是資料庫的一個ANSI/ISO標準。它定義了一種語言(SQL)以及資料庫的行為(事務、隔離級別等)。
COUNT(*)的優化
前面提到了COUNT(*)
是SQL92定義的標準統計行數的語法,所以MySQL資料庫對他進行過很多優化。那麼,具體都做過哪些事情呢?
這裡的介紹要區分不同的執行引擎。MySQL中比較常用的執行引擎就是InnoDB和MyISAM。
MyISAM和InnoDB有很多區別,其中有一個關鍵的區別和我們接下來要介紹的COUNT(*)
有關,那就是MyISAM不支援事務,MyISAM中的鎖是表級鎖;而InnoDB支援事務,並且支援行級鎖。
因為MyISAM的鎖是表級鎖,所以同一張表上面的操作需要序列進行,所以,MyISAM做了一個簡單的優化,那就是它可以把表的總行數單獨記錄下來,如果從一張表中使用COUNT(*)進行查詢的時候,可以直接返回這個記錄下來的數值就可以了,當然,前提是不能有where條件。
MyISAM之所以可以把表中的總行數記錄下來供COUNT(*)查詢使用,那是因為MyISAM資料庫是表級鎖,不會有併發的資料庫行數修改,所以查詢得到的行數是準確的。
但是,對於InnoDB來說,就不能做這種快取操作了,因為InnoDB支援事務,其中大部分操作都是行級鎖,所以可能表的行數可能會被併發修改,那麼快取記錄下來的總行數就不準確了。
但是,InnoDB還是針對COUNT(*)語句做了些優化的。
在InnoDB中,使用COUNT(*)查詢行數的時候,不可避免的要進行掃表了,那麼,就可以在掃表過程中下功夫來優化效率了。
從MySQL 8.0.13開始,針對InnoDB的SELECT COUNT(*) FROM tbl_name
語句,確實在掃表的過程中做了一些優化。前提是查詢語句中不包含WHERE或GROUP BY等條件。
我們知道,COUNT(*)的目的只是為了統計總行數,所以,他根本不關心自己查到的具體值,所以,他如果能夠在掃表的過程中,選擇一個成本較低的索引進行的話,那就可以大大節省時間。
我們知道,InnoDB中索引分為聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中儲存的是整行記錄,而非聚簇索引的葉子節點中儲存的是該行記錄的主鍵的值。
所以,相比之下,非聚簇索引要比聚簇索引小很多,所以MySQL會優先選擇最小的非聚簇索引來掃表。所以,當我們建表的時候,除了主鍵索引以外,建立一個非主鍵索引還是有必要的。
至此,我們介紹完了MySQL資料庫對於COUNT(*)的優化,這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。
COUNT(*)和COUNT(1)
介紹完了COUNT(*)
,接下來看看COUNT(1)
,對於,這二者到底有沒有區別,網上的說法眾說紛紜。
有的說COUNT(*)
執行時會轉換成COUNT(1)
,所以COUNT(1)少了轉換步驟,所以更快。
還有的說,因為MySQL針對COUNT(*)
做了特殊優化,所以COUNT(*)
更快。
那麼,到底哪種說法是對的呢?看下MySQL官方文件是怎麼說的:
InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.
畫重點:same way
, no performance difference
。所以,對於COUNT(1)和COUNT(*),MySQL的優化是完全一樣的,根本不存在誰比誰快!
那既然COUNT(*)
和COUNT(1)
一樣,建議用哪個呢?
建議使用COUNT(*)
!因為這個是SQL92定義的標準統計行數的語法,而且本文只是基於MySQL做了分析,關於Oracle中的這個問題,也是眾說紛紜的呢。
COUNT(欄位)
最後,就是我們一直還沒提到的COUNT(欄位),他的查詢就比較簡單粗暴了,就是進行全表掃描,然後判斷指定欄位的值是不是為NULL,不為NULL則累加。
相比COUNT(*)
,COUNT(欄位)
多了一個步驟就是判斷所查詢的欄位是否為NULL,所以他的效能要比COUNT(*)
慢。
總結
本文介紹了COUNT函式的用法,主要用於統計表行數。主要用法有COUNT(*)
、COUNT(欄位)
和COUNT(1)
。
因為COUNT(*)
是SQL92定義的標準統計行數的語法,所以MySQL對他進行了很多優化,MyISAM中會直接把表的總行數單獨記錄下來供COUNT(*)
查詢,而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當然,這些優化的前提都是沒有進行where和group的條件查詢。
在InnoDB中COUNT(*)
和COUNT(1)
實現上沒有區別,而且效率一樣,但是COUNT(欄位)
需要進行欄位的非NULL判斷,所以效率會低一些。
因為COUNT(*)
是SQL92定義的標準統計行數的語法,並且效率高,所以請直接使用COUNT(*)
查詢表的行數!
參考資料:
https://dev.mysql.com/doc/refman/8.0/en/group-by-functions.html#function_count
《極客時間——MySQL實戰45講》
相關文章
- 記一次被“虐的體無完膚”的面試經歷面試
- 【Java】面試官靈魂拷問:if語句執行完else語句真的不會再執行嗎?Java面試
- MySQL的COUNT語句--count(*)、 count(常量)、 count(列名)MySql
- 面試位元組兩輪後被完虐,一份位元組跳動面試官給你的Android技術面試指南,請查收!面試Android
- Ask Hoegh(4)——select count(*)和select count(1)、count(column)有區別嗎?
- 我是如何用 ThreadLocal 虐面試官的?thread面試
- select count(*)和select count(1)的區別
- 聽說你又被面試官虐了?面試
- 面試官:十問泛型,你能扛住嗎?面試泛型
- 記一次被虐的很慘的面試面試
- Mybatis如何執行Select語句,你真的知道嗎?MyBatis
- SQL SELECT 語句SQL
- Go select 語句Go
- 【SQL】14 UNION 操作符、SELECT INTO 語句、INSERT INTO SELECT 語句、CREATE DATABASE 語句、CREATE TABLE 語句SQLDatabase
- 對線面試官,憑藉nginx能一戰封神嗎?面試Nginx
- 沒文憑能學IT技術嗎_學完能找到工作嗎?能的
- 面試官:你能回答這兩個簡單的問題嗎面試
- SELECT語句邏輯執行順序 你知道嗎?
- 假如我是面試官,我會這樣虐你面試
- INSERT...SELECT語句對查詢的表加鎖嗎
- 面試官:Java執行緒可以無限建立嗎?面試Java執行緒
- 原創 | 我被面試官給虐懵了,竟然是因為我不懂Spring中的@Configuration面試Spring
- 5年Android程式設計師面試位元組跳動兩輪後被完虐,請查收給你的面試指南Android程式設計師面試
- SQL update select語句SQL
- 面試周連續劇之被虐成‘狗’面試
- 學習MySQL的select語句MySql
- select 語句的解析過程
- 面試官:MySQL 是如何執行一條查詢語句的?面試MySql
- 面試官:能聊聊Paxos演算法和ZAB協議嗎面試演算法協議
- 咋滴,不就是面試總考Spring的AOP嗎,辦它!面試Spring
- 四年前端狗,面試被虐,如何翻身?前端面試
- 征服Android面試官路漫漫(二):OutOfMemoryError 可以被 try catch 嗎 ?Android面試Error
- Go select語句詳解Go
- 阿里面試題: (a,b,c)組合索引, 查詢語句select...from...where a=.. and c=..走索引嗎?阿里面試題索引
- SQL語言基礎(SELECT語句)SQL
- SQL語句中SELECT語句的執行順序SQL
- 【面試官問】你懂函數語言程式設計嗎?面試函數程式設計
- 查詢語句(SELECT)的最佳化