MySQL:count(*) count(欄位) 實現上區別

gaopengtttt發表於2019-12-24

水平有限如有誤請指出
原始碼版本:5.7.22
歡迎關注我的《深入理解MySQL主從原理 32講 》,如下:

image.png


繼上一篇文章:
https://www.jianshu.com/p/ce063e2024ad MySQL:查詢欄位數量多少對查詢效率的影響

我們繼續來討論一下count(*) count(欄位) 實現上的區別。注意我們這裡都使用Innodb做為儲存引擎,不討論其他引擎。因為了有了前面的討論,更容易看出它們的區別,這裡我們有如下注意點:

  • 我們需要做到執行計劃一樣,這裡一全表掃描為例。實際上count 很可能使用到覆蓋索引(Using index),本文主要討論它們實現的異同。
  • count(*)和count(欄位) 在結果上可能並不一致。比如count(欄位),但是某些行本欄位為NULL的話那麼將不會統計行數,下面將會說明這種NULL判斷的位置。

本文還是使用簡單的全表掃描來進行對比實現上的區別。首先我們要明確的是count使用的是一個COUNT計數器。

一、使用示例

在示例中我們也可以看到兩個語句的結果實際上並不一致

mysql> show create table  baguai_f  \G
*************************** 1. row ***************************
       Table: baguai_f
Create Table: CREATE TABLE `baguai_f` (
  `id` int(11) DEFAULT NULL,
  `a` varchar(20) DEFAULT NULL,
  `b` varchar(20) DEFAULT NULL,
  `c` varchar(20) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8
1 row in set (0.00 sec)
mysql> select * from baguai_f  ;
+------+------+------+------+
| id   | a    | b    | c    |
+------+------+------+------+
|    1 | g    | g    | NULL |
|    1 | g1   | g1   | g1   |
|    3 | g2   | g2   | g2   |
|    4 | g    | g    | NULL |
|    5 | g    | g    | NULL |
|    6 | g3   | g3   | g3   |
+------+------+------+------+
6 rows in set (0.00 sec)
mysql> desc select count(*) from  baguai_f where b='g';
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table    | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | baguai_f | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    6 |    16.67 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)
mysql> desc select count(c) from  baguai_f where b='g';
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table    | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | baguai_f | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    6 |    16.67 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)
mysql>  select count(*) from  baguai_f where b='g';
+----------+
| count(*) |
+----------+
|        3 |
+----------+
1 row in set (0.00 sec)
mysql>  select count(c) from  baguai_f where b='g';
+----------+
| count(c) |
+----------+
|        0 |
+----------+
1 row in set (0.00 sec)

這種不一致來自於b=’g’的c列中 都是NULL值,因此count(c)返回為0。

二、示例中 count(*) 獲取資料流程簡析

注意在《MySQL:查詢欄位數量多少對查詢效率的影響》一文中我們已經詳細的描述了部分流程,這裡不再熬述,如果需要更加詳細的瞭解,自行參考。

1、MySQL層 構建read_set

這裡構建的read_set實際上只會包含列b,即一個欄位。

2、Innodb層 構建模板

同理根據read_set構建的欄位模板中只會包含列b。

LOOP:這裡開始迴圈返回每一條資料

3、Innodb層 根據模板返回資料

這裡我們可以看看模板的數量和模板對應的具體列名

  • 模板的數量
斷點:row_sel_store_mysql_rec
檢視模板數量:
(gdb) p prebuilt->n_template
$1 = 1
  • 檢視模板對應的欄位
斷點:row_sel_field_store_in_mysql_format_func
檢視模板對應的欄位:
(gdb) p field->name
$3 = {m_name = 0x7ffe7c99cf85 "b"}

顯然這裡只是將b列的值返回給了MySQL層,這裡也很好理解,因為b列在MySQL層需要繼續做過濾操作。

4、MySQL層 過濾條件b=’g’

好了當前返回給MySQL層的資料中只有b列的資料,然後施加b=’g’這個條件進行過濾。

5、MySQL層 過濾後做一個COUNT計數操作

對於普通的select語句過濾後的資料就可以返回了,但是對於count這種操作,這裡做的是一個計數操作,其中行會對count 欄位的NULL值進行判斷,當然這裡是count(*) 也就不存在NULL值判斷了,下面是這段程式碼:

bool Item_sum_count::add()
{
  if (aggr->arg_is_null(false))
    return 0;
  count++;
  return 0;
}
END LOOP

最終我們只需要返回這個計數就可以了。下面是傳送的資料,斷點可以設定在Query_result_send::send_data中。

$22 = Item::SUM_FUNC_ITEM
(gdb) p ((Item*)(items)->first->info)->field_type()
$23 = MYSQL_TYPE_LONGLONG
(gdb) p ((Item*)(items)->first->info)->val_int()
$24 = 3
(gdb) p (items)->first->info
$26 = (void *) 0x7ffe7c006580
(gdb) p ((Item_sum_count*)$26)->count
$28 = 3

我們可以傳送的資料實際就是這個計數器,最終值為3。

三、示例中 count(c) 獲取資料流程的不同

實際上整個流程基本一致,但是區別在於:

  • 構建的read_set 不同,模板個數自然不同,因為需要2個欄位,即b、c兩個欄位,其中b列用於where條件過濾,而b列用於統計是否有NULL值,因此模板數量為2,如下:
(gdb) p prebuilt->n_template
$29 = 2
  • 做COUNT計數器的時候會根據c 列的NULL值做實際的過濾,操作只要是NULL則count計數不會增加1,這個還是參考這段程式碼:
bool Item_sum_count::add()
{
  if (aggr->arg_is_null(false)) //過濾NULL值
    return 0;
  count++;
  return 0;
}

最終會調入函式Field::is_null進行NULL值判斷,斷點可以設定在這裡。

四、不同點總結

示例中的語句count(c)返回為0。現在我們很清楚了,這些資料什麼時候過濾掉的,總結如下:

  • Innodb層返回了全部的行資料。
  • MySQL層通過where條件過濾,剩下了b=’g’的行。
  • MySQL層通過NULL判斷,將剩下的count(c)中為NULL的行也排除在計數之外。

而count(*)則沒有第3步,這是一個不同。

然後的不同點就是在返回的欄位上:

  • count(c) 很明顯除了where條件以外,還需要返回c列給MySQL層
  • count(*) 則不需要返回額外的欄位給MySQL層,只需要MySQL層過濾需要的b列即可。

通過上面的分析,實際上 效率沒有太大的差別,我覺得同樣執行計劃,同樣返回資料結果的前提下,可能count(*)的效率要略微高一點。

五、備用棧幀

  1. NULL值計數過濾棧幀
#0  Field::is_null (this=0x7ffe789949d8, row_offset=0) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/field.h:1129
#1  0x0000000000fbc678 in Item_field::is_null (this=0x7ffe78006a78) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item.h:2929
#2  0x000000000146ebf5 in Aggregator_simple::arg_is_null (this=0x7ffe78b451d0, use_null_value=false)
    at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item_sum.cc:1633
#3  0x000000000146ef18 in Item_sum_count::add (this=0x7ffe780066c0) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item_sum.cc:1683
#4  0x0000000001478475 in Aggregator_simple::add (this=0x7ffe78b451d0) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item_sum.h:682
#5  0x0000000001478301 in Item_sum::aggregator_add (this=0x7ffe780066c0) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/item_sum.h:526
#6  0x000000000157fd0b in update_sum_func (func_ptr=0x7ffe78007740) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:535
#7  0x0000000001585d3e in end_send_group (join=0x7ffe78007370, qep_tab=0x7ffe78007bd0, end_of_records=false)
    at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:3117
#8  0x0000000001582059 in evaluate_join_record (join=0x7ffe78007370, qep_tab=0x7ffe78007a58)
    at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:1645
#9  0x000000000158145a in sub_select (join=0x7ffe78007370, qep_tab=0x7ffe78007a58, end_of_records=false)
    at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:1297
#10 0x0000000001580cce in do_select (join=0x7ffe78007370) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_executor.cc:950

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7728585/viewspace-2670258/,如需轉載,請註明出處,否則將追究法律責任。

相關文章