MySQL:count(*) count(欄位) 實現上區別
水平有限如有誤請指出
原始碼版本:5.7.22
歡迎關注我的《深入理解MySQL主從原理 32講 》,如下:
繼上一篇文章:
https://www.jianshu.com/p/ce063e2024ad MySQL:查詢欄位數量多少對查詢效率的影響
我們繼續來討論一下count(*) count(欄位) 實現上的區別。注意我們這裡都使用Innodb做為儲存引擎,不討論其他引擎。因為了有了前面的討論,更容易看出它們的區別,這裡我們有如下注意點:
- 我們需要做到執行計劃一樣,這裡一全表掃描為例。實際上count 很可能使用到覆蓋索引(Using index),本文主要討論它們實現的異同。
- count(*)和count(欄位) 在結果上可能並不一致。比如count(欄位),但是某些行本欄位為NULL的話那麼將不會統計行數,下面將會說明這種NULL判斷的位置。
本文還是使用簡單的全表掃描來進行對比實現上的區別。首先我們要明確的是count使用的是一個COUNT計數器。
一、使用示例
在示例中我們也可以看到兩個語句的結果實際上並不一致
mysql> show create table baguai_f \G
*************************** 1. row ***************************
Table: baguai_f
Create Table: CREATE TABLE `baguai_f` (
`id` int(11) DEFAULT NULL,
`a` varchar(20) DEFAULT NULL,
`b` varchar(20) DEFAULT NULL,
`c` varchar(20) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8
1 row in set (0.00 sec)
mysql> select * from baguai_f ;
+------+------+------+------+
| id | a | b | c |
+------+------+------+------+
| 1 | g | g | NULL |
| 1 | g1 | g1 | g1 |
| 3 | g2 | g2 | g2 |
| 4 | g | g | NULL |
| 5 | g | g | NULL |
| 6 | g3 | g3 | g3 |
+------+------+------+------+
6 rows in set (0.00 sec)
mysql> desc select count(*) from baguai_f where b='g';
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| 1 | SIMPLE | baguai_f | NULL | ALL | NULL | NULL | NULL | NULL | 6 | 16.67 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)
mysql> desc select count(c) from baguai_f where b='g';
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| 1 | SIMPLE | baguai_f | NULL | ALL | NULL | NULL | NULL | NULL | 6 | 16.67 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)
mysql> select count(*) from baguai_f where b='g';
+----------+
| count(*) |
+----------+
| 3 |
+----------+
1 row in set (0.00 sec)
mysql> select count(c) from baguai_f where b='g';
+----------+
| count(c) |
+----------+
| 0 |
+----------+
1 row in set (0.00 sec)
這種不一致來自於b=’g’的c列中 都是NULL值,因此count(c)返回為0。
二、示例中 count(*) 獲取資料流程簡析
注意在《MySQL:查詢欄位數量多少對查詢效率的影響》一文中我們已經詳細的描述了部分流程,這裡不再熬述,如果需要更加詳細的瞭解,自行參考。
1、MySQL層 構建read_set
這裡構建的read_set實際上只會包含列b,即一個欄位。
2、Innodb層 構建模板
同理根據read_set構建的欄位模板中只會包含列b。
LOOP:這裡開始迴圈返回每一條資料
3、Innodb層 根據模板返回資料
這裡我們可以看看模板的數量和模板對應的具體列名
- 模板的數量
斷點:row_sel_store_mysql_rec
檢視模板數量:
(gdb) p prebuilt->n_template
$1 = 1
- 檢視模板對應的欄位
斷點:row_sel_field_store_in_mysql_format_func
檢視模板對應的欄位:
(gdb) p field->name
$3 = {m_name = 0x7ffe7c99cf85 "b"}
顯然這裡只是將b列的值返回給了MySQL層,這裡也很好理解,因為b列在MySQL層需要繼續做過濾操作。
4、MySQL層 過濾條件b=’g’
好了當前返回給MySQL層的資料中只有b列的資料,然後施加b=’g’這個條件進行過濾。
5、MySQL層 過濾後做一個COUNT計數操作
對於普通的select語句過濾後的資料就可以返回了,但是對於count這種操作,這裡做的是一個計數操作,其中行會對count 欄位的NULL值進行判斷,當然這裡是count(*) 也就不存在NULL值判斷了,下面是這段程式碼:
bool Item_sum_count::add()
{
if (aggr->arg_is_null(false))
return 0;
count++;
return 0;
}
END LOOP
最終我們只需要返回這個計數就可以了。下面是傳送的資料,斷點可以設定在Query_result_send::send_data中。
$22 = Item::SUM_FUNC_ITEM
(gdb) p ((Item*)(items)->first->info)->field_type()
$23 = MYSQL_TYPE_LONGLONG
(gdb) p ((Item*)(items)->first->info)->val_int()
$24 = 3
(gdb) p (items)->first->info
$26 = (void *) 0x7ffe7c006580
(gdb) p ((Item_sum_count*)$26)->count
$28 = 3
我們可以傳送的資料實際就是這個計數器,最終值為3。
三、示例中 count(c) 獲取資料流程的不同
實際上整個流程基本一致,但是區別在於:
- 構建的read_set 不同,模板個數自然不同,因為需要2個欄位,即b、c兩個欄位,其中b列用於where條件過濾,而b列用於統計是否有NULL值,因此模板數量為2,如下:
(gdb) p prebuilt->n_template
$29 = 2
- 做COUNT計數器的時候會根據c 列的NULL值做實際的過濾,操作只要是NULL則count計數不會增加1,這個還是參考這段程式碼:
bool Item_sum_count::add()
{
if (aggr->arg_is_null(false)) //過濾NULL值
return 0;
count++;
return 0;
}
最終會調入函式Field::is_null進行NULL值判斷,斷點可以設定在這裡。
四、不同點總結
示例中的語句count(c)返回為0。現在我們很清楚了,這些資料什麼時候過濾掉的,總結如下:
- Innodb層返回了全部的行資料。
- MySQL層通過where條件過濾,剩下了b=’g’的行。
- MySQL層通過NULL判斷,將剩下的count(c)中為NULL的行也排除在計數之外。
而count(*)則沒有第3步,這是一個不同。
然後的不同點就是在返回的欄位上:
- count(c) 很明顯除了where條件以外,還需要返回c列給MySQL層
- count(*) 則不需要返回額外的欄位給MySQL層,只需要MySQL層過濾需要的b列即可。
通過上面的分析,實際上 效率沒有太大的差別,我覺得同樣執行計劃,同樣返回資料結果的前提下,可能count(*)的效率要略微高一點。
五、備用棧幀
- NULL值計數過濾棧幀
#0 Field::is_null (this=0x7ffe789949d8, row_offset=0) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/field.h:1129
#1 0x0000000000fbc678 in Item_field::is_null (this=0x7ffe78006a78) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item.h:2929
#2 0x000000000146ebf5 in Aggregator_simple::arg_is_null (this=0x7ffe78b451d0, use_null_value=false)
at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item_sum.cc:1633
#3 0x000000000146ef18 in Item_sum_count::add (this=0x7ffe780066c0) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item_sum.cc:1683
#4 0x0000000001478475 in Aggregator_simple::add (this=0x7ffe78b451d0) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item_sum.h:682
#5 0x0000000001478301 in Item_sum::aggregator_add (this=0x7ffe780066c0) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item_sum.h:526
#6 0x000000000157fd0b in update_sum_func (func_ptr=0x7ffe78007740) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:535
#7 0x0000000001585d3e in end_send_group (join=0x7ffe78007370, qep_tab=0x7ffe78007bd0, end_of_records=false)
at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:3117
#8 0x0000000001582059 in evaluate_join_record (join=0x7ffe78007370, qep_tab=0x7ffe78007a58)
at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:1645
#9 0x000000000158145a in sub_select (join=0x7ffe78007370, qep_tab=0x7ffe78007a58, end_of_records=false)
at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:1297
#10 0x0000000001580cce in do_select (join=0x7ffe78007370) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:950
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7728585/viewspace-2670258/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 圖解MySQL:count(*) 、count(1) 、count(主鍵欄位)、count(欄位)哪個效能最好?圖解MySql
- count(*)、count(1)和count(列名)的區別
- count (*) 和 count (1) 和 count (列名) 區別
- count(*) 和 count(1)和count(列名)區別
- MySQL的COUNT語句--count(*)、 count(常量)、 count(列名)MySql
- SQL Server中count(*)和Count(1)的區別SQLServer
- C# 中List中的Count和Count(),有什麼區別C#
- mysql count()的使用解析MySql
- MySQL:SELECT COUNT 小結MySql
- MySQL優化COUNT()查詢MySql優化
- C++ :引用計數(reference count) 實現C++
- MySQL:COUNT(*) profile optimizing階段慢MySql
- 百萬資料 mysql count(*)優化MySql優化
- [20180727]再論count(*)和count(1).txt
- SQL語句case when外用sum與count的區別SQL
- 7.65 COUNT
- MySQL中TEXT與BLOB欄位型別的區別MySql型別
- SAP ABAP OData 服務的 $count 操作實現
- MySQL中count(*)函式原理詳解MySql函式
- Count BFS Graph
- count(*) 優化優化
- 【Mysql原理與實踐】2020-08-03-景羅-MySQL中select count(col) 底層實現探索MySql
- MYSQL count標量子查詢改left joinMySql
- Mysql報錯注入原理分析(count()、rand()、group by)MySql
- mysql group by 執行原理及千萬級別count 查詢最佳化MySql
- SAP ABAP OData 服務的 $count 和 $inlinecount 兩個操作的區別inline
- MySQL欄位型別最全解析MySql型別
- 204. Count Primes
- Leetcode 38 Count and SayLeetCode
- std::count 函式函式
- 7.36 BITMAP_COUNT
- 7.13 APPROX_COUNTAPP
- 解析Count函式函式
- MySQL統計總數就用count(*),別花裡胡哨的《死磕MySQL系列 十》MySql
- 有關mysql中ROW_COUNT()的小例子MySql
- MySQL裡的found_row()與row_count()MySql
- 關於mysql中欄位定義的型別int、tinyint區別MySql型別
- mysql表操作(alter)/mysql欄位型別MySql型別