前言
大部分人在日常的業務開發中,其實很少去關注資料庫的事務相關問題,基本上都是 CURD 一把梭。正好最近在看 MySQL 的相關基礎知識,其中對於幻讀問題之前一直沒有理解深刻,今天就來聊聊「InnoDB 是如何解決幻讀的」,話不多說,下面進入主題。
事務隔離級別
事務隔離是資料庫處理的基礎之一,是 ACID 中的 I
。在 MySQL 的 InnoDB 引擎中支援在 SQL:1992 標準中的四種事務隔離級別,如下圖所示,其中 P1 表示髒讀(Dirty read),P2 表示不可重複讀(Dirty read),P3 表示幻讀(Phantom)。
為什麼需要定義這麼多隔離呢?從上圖中也能猜出一二了,InnoDB 提供多個隔離級別主要原因是:讓使用者可以在多個事務同時進行更改和執行查詢時微調效能與結果的可靠性、一致性和可再現性之間的平衡的設定。是一種效能與結果可靠性間的 trade off
。
什麼是幻讀
在聊「InnoDB 解決幻讀方式」前我們需要先了解幻讀是什麼,官方文件的描述如下:
A row that appears in the result set of a query, but not in the result set of an earlier query.
其中我加粗的「result set」是關鍵的地方,兩次查詢返回的是結果集,說明必須是一個範圍查詢操作。總結下,幻讀就是:在同一個事務中,在前後兩次查詢相同範圍時,兩次查詢得到的結果是不一致的。所以幻讀會產生資料一致性問題。
InnoDB 解決幻讀方式
為了解決上述的幻讀問題,InnoDB 引入了兩種鎖,分別是「間隙鎖」和「next-key 鎖」。下面透過一個示例來描述這兩種鎖的作用分別是什麼。假如存在一個這樣的 B+ Tree 的索引結構,結構中有 4 個索引元素分別是:9527、9530、9535、9540。
此時當我們使用如下 SQL 透過主鍵索引查詢一條記錄,並且加上 X 鎖(排它鎖)時:
select * from user where id = 9527 for update;
這時就會產生一個記錄鎖(也就是行鎖),鎖定 id = 9527
這個索引。
在被鎖定的記錄(這裡是 id = 9527)的鎖釋放之前,其它事務無法對這條被鎖定記錄做任何操作。再回憶一下,前面說的幻讀定義「在同一個事務中,在前後兩次查詢相同範圍時,兩次查詢得到的結果是不一致」。注意,這裡強調的是範圍查詢。
InnoDB 要解決幻讀問題,就必須得保證在如果在一個事務中,透過如下這條語句進行鎖定時:
select * from user where id > 9530 and id < 9535 for update;
此時,另外一個語句再執行一如下這條 insert 語句時,需要被阻塞,直到上面這個獲得鎖的事務釋放鎖後才能執行。
insert into user(id, name, age) values(9533, 'Jack', 44);
為此,InnoDB 引入了「間隙鎖」,它的主要功能是鎖定一段範圍內的索引記錄。比如上面查詢 id > 9530 and id < 9535
的時候,對 B+ Tree 中的(9530,9535)這個開區間範圍的索引加間隙鎖。
在這種加了間隙鎖的情況下,其它事務對這個區間的資料進行插入、更新、刪除都會被鎖住直到這個獲取到鎖的事務釋放。
這種是在區間之間的情況,你可能想到另外的一種情況:鎖定多個區間,如下的一條語句:
select * from user where id > 9530 for update;
上面這條查詢語句是針對 id > 9530
這個條件加鎖,那麼此時它需要鎖定多個索引區間,所以在這種情況下 InnoDB 引入了「next-key 鎖」機制。其實 next-key 鎖的效果相當於間隙鎖和記錄鎖的合集,記錄鎖鎖定存在的記錄行,間隙鎖鎖住記錄行之間的間隙,而 next-key 鎖它鎖住的是兩者之和。
在 InnoDB 中,每個資料行上的非唯一索引列上都會存在一把 next-key 鎖,當某個事務持有該資料行的 next-key 鎖時,會鎖住一段左開右閉區間的資料。因此,當透過 id > 9530
這樣一種範圍查詢加鎖時,會加 next-key 鎖,鎖定區間是範圍是:
(9530,9535] (9535,9540] (9540,+∞]
間隙鎖(也叫 Gap 鎖)和 next-key 鎖的區別在於加鎖的範圍,間隙鎖只鎖定兩個索引之間的引用間隙,而 next-key 鎖會鎖定多個索引區間,它包含「記錄鎖」和「間隙鎖」。所以,當我們使用了範圍查詢,不僅僅命中了已存在的 Record 記錄,還包含了 Gap 間隙。
總結
雖然在 InnoDB 引擎中透過間隙鎖和 next-key 鎖的方式解決了幻讀問題,但是加鎖之後會影響到資料庫的併發效能,因此,如果對效能要求較高的業務場景中,建議把隔離級別設定成 RC(READ COMMITTED),這個級別中不存在間隙鎖,但是需要考慮到幻讀問題會導致的資料一致性。