由select for update鎖等待問題引發的深入思考

海布里_MySQL發表於2024-02-27

原文網址 : https://www.cnblogs.com/coygfly/p/18026342

關於MySQL的加鎖機制，其實十分複雜，不同的隔離級別，是否是主鍵或索引，鎖的粒度等等。很多工作了很多年的MySQL DBA也不能把各種加鎖場景一一講清楚。有時候一個簡單的鎖等待場景都值得深入研究，大家更多的是知其然而不知其所以然。本文介紹的是一個很常見的鎖等待問題，但很少有人知道其中的原理。

一、實驗場景

本文實驗和研究的MySQL版本為8.0.31，資料庫的隔離級別設定為RC，建立一張表，並在表中插入資料：

create table siri(
id int not null auto_increment,
a int not null,
b int not null,
c int not null,
primary key (id),
unique key uniq_a (a),
key idx_c (c)
)

insert into siri values (1,1,1,1),(2,2,2,2),(4,4,4,4),(6,6,6,4);

好的，現在可以開始模擬實驗場景了：

實驗一：

Session1

Session2

mysql> begin;

Query OK, 0 rows affected (0.00 sec)

mysql> select * from siri where b=1 for update;

+----+---+---+---+

| id | a | b | c |

+----+---+---+---+

| 1 | 1 | 1 | 1 |

+----+---+---+---+

1 row in set (0.00 sec)

mysql> select * from siri where b=4 for update;

ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction

實驗二：

Session1

Session2

mysql> begin;

Query OK, 0 rows affected (0.00 sec)

mysql> select * from siri where id=1 for update;

+----+---+---+---+

| id | a | b | c |

+----+---+---+---+

| 1 | 1 | 1 | 1 |

+----+---+---+---+

1 row in set (0.00 sec)

mysql> select * from siri where b=4 for update;

ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction

實驗三：

Session1

Session2

mysql> begin;

Query OK, 0 rows affected (0.00 sec)

mysql> select * from siri where b=1 for update;

+----+---+---+---+

| id | a | b | c |

+----+---+---+---+

| 1 | 1 | 1 | 1 |

+----+---+---+---+

1 row in set (0.00 sec)

mysql> select * from siri where id=4 for update;

+----+---+---+---+

| id | a | b | c |

+----+---+---+---+

| 4 | 4 | 4 | 4 |

+----+---+---+---+

1 row in set (0.00 sec)

從以上三個實驗可以看出，session2是否被堵塞與session1中語句的條件欄位是否是索引無關，而與session2中select for update語句的條件欄位有關，session2中條件欄位無索引則會被堵塞。

mysql> select * from performance_schema.data_locks\G
*************************** 1. row ***************************
               ENGINE: INNODB
       ENGINE_LOCK_ID: 139907486244056:1220:139907418869440
ENGINE_TRANSACTION_ID: 3816000
            THREAD_ID: 52900
             EVENT_ID: 44
        OBJECT_SCHEMA: test
          OBJECT_NAME: siri
       PARTITION_NAME: NULL
    SUBPARTITION_NAME: NULL
           INDEX_NAME: NULL
OBJECT_INSTANCE_BEGIN: 139907418869440
            LOCK_TYPE: TABLE
            LOCK_MODE: IX
          LOCK_STATUS: GRANTED
            LOCK_DATA: NULL
*************************** 2. row ***************************
               ENGINE: INNODB
       ENGINE_LOCK_ID: 139907486244056:59:4:2:139907418866384
ENGINE_TRANSACTION_ID: 3816000
            THREAD_ID: 52900
             EVENT_ID: 44
        OBJECT_SCHEMA: test
          OBJECT_NAME: siri
       PARTITION_NAME: NULL
    SUBPARTITION_NAME: NULL
           INDEX_NAME: PRIMARY
OBJECT_INSTANCE_BEGIN: 139907418866384
            LOCK_TYPE: RECORD
            LOCK_MODE: X,REC_NOT_GAP
          LOCK_STATUS: GRANTED
            LOCK_DATA: 1
2 rows in set (0.00 sec)

mysql> select * from sys.innodb_lock_waits\G
*************************** 1. row ***************************
                wait_started: 2023-11-16 14:23:49
                    wait_age: 00:00:02
               wait_age_secs: 2
                locked_table: `test`.`siri`
         locked_table_schema: test
           locked_table_name: siri
      locked_table_partition: NULL
   locked_table_subpartition: NULL
                locked_index: PRIMARY
                 locked_type: RECORD
              waiting_trx_id: 3816028
         waiting_trx_started: 2023-11-16 14:23:49
             waiting_trx_age: 00:00:02
     waiting_trx_rows_locked: 1
   waiting_trx_rows_modified: 0
                 waiting_pid: 54820
               waiting_query: select * from siri where b=4 for update
             waiting_lock_id: 139907486245672:59:4:2:139907418878432
           waiting_lock_mode: X,REC_NOT_GAP
             blocking_trx_id: 3816020
                blocking_pid: 54783
              blocking_query: NULL
            blocking_lock_id: 139907486244056:59:4:2:139907418866384
          blocking_lock_mode: X,REC_NOT_GAP
        blocking_trx_started: 2023-11-16 14:16:49
            blocking_trx_age: 00:07:02
    blocking_trx_rows_locked: 1
  blocking_trx_rows_modified: 0
     sql_kill_blocking_query: KILL QUERY 54783
sql_kill_blocking_connection: KILL 54783
1 row in set (0.01 sec)

查詢上面監控檢視可以發現，在實驗一和實驗二中，session1所申請的鎖資源也是一樣的，一個是表級別的IX鎖，一個是行級別的X鎖。而造成鎖等待的鎖是行鎖。所以這時候就有一個疑問了，行鎖鎖定的是b=1這一行，為啥session2中我們要申請b=4這一行的行鎖會發生鎖等待呢？其實原因也顯而易見了：欄位b無索引，申請b=4這一行的行鎖會掃描全表，也就是說對錶資料的每一行都會申請X鎖。而在實驗三中，可以走主鍵索引直接定位到b=4這一行，所以就不會造成鎖等待了。

下面再看一個實驗四：

Session1

Session2

mysql> begin;

Query OK, 0 rows affected (0.00 sec)

mysql> select * from siri where b=1 for update;

+----+---+---+---+

| id | a | b | c |

+----+---+---+---+

| 1 | 1 | 1 | 1 |

+----+---+---+---+

1 row in set (0.00 sec)

mysql> update siri set c=4 where b=4;

Query OK, 0 rows affected (0.00 sec)

Rows matched: 1 Changed: 0 Warnings: 0

可以發現，session2中直接對b=4這一行進行update是可以直接成功的，不會被阻塞。這說明update的加鎖流程和select for update是不一樣的。可以推測一下這兩種加鎖流程有什麼區別：session2中update進行更新時也會掃描全表，但是遇到第一個鎖等待時會做一個判斷，發現鎖住的行不是需要update的行時，則會跳過這個鎖，這樣就不會影響真正需要update的行，而select for update則不會做這個跳過，會一直等待鎖。

二、解讀原始碼

為了驗證我的猜想，深究背後的原理，還是得在實際場景下除錯一下原始碼，閱讀原始碼才能更好的瞭解為什麼是這樣的。

在mysql原始碼中，負責給行加鎖的函式是sel_set_rec_lock，我們可以在該函式處打下斷點，看看select for update和update這兩種sql在申請鎖的流程上面有什麼區別。

/** Sets a lock on a record.
mostly due to we cannot reposition a record in R-Tree (with the
nature of splitting)
@param[in]      pcur            cursor
@param[in]      rec             record
@param[in]      index           index
@param[in]      offsets         rec_get_offsets(rec, index)
@param[in]      sel_mode        select mode: SELECT_ORDINARY,
                                SELECT_SKIP_LOKCED, or SELECT_NO_WAIT
@param[in]      mode            lock mode
@param[in]      type            LOCK_ORDINARY, LOCK_GAP, or LOC_REC_NOT_GAP
@param[in]      thr             query thread
@param[in]      mtr             mtr
@return DB_SUCCESS, DB_SUCCESS_LOCKED_REC, or error code */
static inline dberr_t sel_set_rec_lock(btr_pcur_t *pcur, const rec_t *rec,
                                       dict_index_t *index,
                                       const ulint *offsets,
                                       select_mode sel_mode, ulint mode,
                                       ulint type, que_thr_t *thr, mtr_t *mtr) {
  trx_t *trx;
  dberr_t err = DB_SUCCESS;
  const buf_block_t *block;

  block = pcur->get_block();

  trx = thr_get_trx(thr);
  ut_ad(trx_can_be_handled_by_current_thread(trx));

  if (UT_LIST_GET_LEN(trx->lock.trx_locks) > 10000) {
    if (buf_LRU_buf_pool_running_out()) {
      return (DB_LOCK_TABLE_FULL);
    }
  }

  if (index->is_clustered()) {
    err = lock_clust_rec_read_check_and_lock(
        lock_duration_t::REGULAR, block, rec, index, offsets, sel_mode,
        static_cast<lock_mode>(mode), type, thr);
  } else {
    if (dict_index_is_spatial(index)) {
      if (type == LOCK_GAP || type == LOCK_ORDINARY) {
        ib::error(ER_IB_MSG_1026) << "Incorrectly request GAP lock "
                                     "on RTree";
        ut_d(ut_error);
        ut_o(return (DB_SUCCESS));
      }
      err = sel_set_rtr_rec_lock(pcur, rec, index, offsets, sel_mode, mode,
                                 type, thr, mtr);
    } else {
      err = lock_sec_rec_read_check_and_lock(
          lock_duration_t::REGULAR, block, rec, index, offsets, sel_mode,
          static_cast<lock_mode>(mode), type, thr);
    }
  }

  return (err);
}

在mysql的debug模式中執行select * from testdb.siri where b=4 for update，gdb中命中sel_set_rec_lock函式斷點，函式堆疊資訊如下：

#0  sel_set_rec_lock (pcur=0x7f52040e3ef8, rec=0x7f521e05c07d "\200", index=0x7f52040e8028, offsets=0x7f52146f3bc0, sel_mode=SELECT_ORDINARY, mode=3, type=1024, 
    thr=0x7f52040e4700, mtr=0x7f52146f3ef0) at /root/gdb_mysql/mysql-8.0.32/storage/innobase/row/row0sel.cc:1142

執行update testdb.siri set c=2 where b=4，函式堆疊資訊如下：

#0  sel_set_rec_lock (pcur=0x7f52040e3ef8, rec=0x7f521e05c07d "\200", index=0x7f52040e8028, offsets=0x7f52146f3630, sel_mode=SELECT_SKIP_LOCKED, mode=3, type=1024, 
    thr=0x7f52040e4700, mtr=0x7f52146f3960) at /root/gdb_mysql/mysql-8.0.32/storage/innobase/row/row0sel.cc:1142

發現了兩者的區別嗎？區別在於sel_mode這個引數是不同的：對於select for update，sel_mode是SELECT_ORDINARY；對於update，sel_mode是SELECT_SKIP_LOCKED。sel_mode引數的定義如下：

enum select_mode {
  SELECT_ORDINARY,    /* default behaviour */
  SELECT_SKIP_LOCKED, /* skip the row if row is locked */
  SELECT_NOWAIT       /* return immediately if row is locked */
};

在row_search_mvcc函式中，透過以下程式碼來判定這條sql是否為半一致性讀（semi-consistent read）。

/* in case of semi-consistent read, we use SELECT_SKIP_LOCKED, so we don't
waste time on creating a WAITING lock, as we won't wait on it anyway */
const bool use_semi_consistent =
    prebuilt->row_read_type == ROW_READ_TRY_SEMI_CONSISTENT &&
    !unique_search && index == clust_index && !trx_is_high_priority(trx);
err = sel_set_rec_lock(
    pcur, rec, index, offsets,
    use_semi_consistent ? SELECT_SKIP_LOCKED : prebuilt->select_mode,
    prebuilt->select_lock_type, lock_type, thr, &mtr);

update語句是半一致性讀，因此use_semi_consistent為true，select_mode為SELECT_SKIP_LOCKED，這表示會話不會浪費時間在建立鎖等待上，可以跳過持有鎖的行。而對於select for update語句，use_semi_consistent為false，select_mode為SELECT_ORDINARY，表示會話會建立一個鎖等待，直到鎖等待超時。

因此，對於實驗四中的現象update不會被堵塞的原因已經比較清楚了，update在mysql內部被定義成了半一致性讀（SELECT_SKIP_LOCKED），因此實驗四的session2中update進行全表掃描讀取主鍵時，讀取到b=1這一列時，會跳過session1所持有的位於b=1行上的行鎖，所以也就不會發生鎖等待的現象。相反，實驗二中select for update在mysql內部定義為普通讀（SELECT_ORDINARY），讀取到b=1這一列時，會被session1所持有的位於b=1行上的行鎖堵塞，發生鎖等待的現象。

記一次 MySQL select for update 死鎖問題
2020-04-03
MySql
MySQL中SELECT+UPDATE併發更新問題
2019-05-11
MySql
由一個emoji引發的思考
2019-01-23
mysql insert into ... select的鎖問題
2020-10-11
MySql
JS學習筆記之由定時器引發的深入思考
2018-04-12
JS筆記定時器
深入理解SELECT ... LOCK IN SHARE MODE和SELECT ... FOR UPDATE
2019-01-04
mysql 高併發 select update 併發更新問題解決方案
2020-10-28
MySql
由mv命令引發的對inode的思考
2020-09-01
MySQL鎖等待與死鎖問題分析
2021-03-30
MySql
【高併發】由InterruptedException異常引發的思考
2022-11-25
Exception
由屎色自行車棚引發的思考
2018-03-14
由Siri和Alexa結婚引發的思考
2019-05-08
QZ面試被問select......for update會鎖表還是鎖行lor
2022-03-01
面試
tempdb大量閂鎖等待問題分析
2023-02-24
由 LG P4309 引發的擴充思考
2024-03-06
iOS開發基礎149-由UUIDString引發的思考
2024-08-09
iOSUI
一個延時任務問題引發的思考
2023-05-01
select for update
2024-08-13
一個由line-height引發的血案與思考
2019-03-04
MySQL 由於MDL讀鎖select被阻塞
2020-06-10
MySql
一次線上問題排查所引發的思考
2018-07-09
GreatSQL 中為什麼 Update 不會被鎖等待
2024-09-23
SQL
Seata 全域性鎖等待超時問題排查
2023-03-28
關於 http cache 的一個小問題以及引發的思考
2019-03-15
HTTP
由script標籤引發了我對setTimeout非同步的思考
2019-02-16
非同步
由Object.prototype.toString.call( )引發關於toString( )方法的思考
2018-05-11
Object
由《暗黑地牢》這款「地主模擬器」引發的思考
2020-09-07
由ASP.NET Core讀取Response.Body引發的思考
2023-04-10
ASP.NET
由面試題“併發程式設計的三個問題”深入淺出Synchronied
2020-09-23
面試題程式設計
一道題引發的EventLoop思考
2019-03-03
OOP
一道排序題引發的思考
2021-05-03
排序
一場由React引發的前後端分離架構的思考
2018-05-21
React後端架構
一道面試題引發的思考
2018-10-19
面試題
記一個面試題引發的思考
2019-03-14
面試題
由節流函式引發出我對event-loop的思考，順便刷刷爆款題
2019-04-01
函式OOP
一個vuepress配置問題，引發的js遞迴演算法思考
2023-10-15
VueJS遞迴演算法
由VIP漂移引發的演算法異常問題調查和解決
2020-07-05
演算法
for...in引發的思考
2019-05-03

由select for update鎖等待問題引發的深入思考

相關文章