什麼是事務
事務是應用程式中一系列嚴密的操作,所有操作必須成功完成,否則在每個操作中所作的所有更改都會被撤消。也就是事務具有原子性,一個事務中的一系列的操作要麼全部成功,要麼一個都不做。
事務的結束有兩種,當事務中的所以步驟全部成功執行時,事務提交。如果其中一個步驟失敗,將發生回滾操作,撤消撤消之前到事務開始時的所以操作。
事務的 ACID
事務具有四個特徵:原子性( Atomicity )、一致性( Consistency )、隔離性( Isolation )和持續性( Durability )。這四個特性簡稱為 ACID 特性。
原子性。事務是資料庫的邏輯工作單位,事務中包含的各操作要麼都做,要麼都不做
一致性。事 務執行的結果必須是使資料庫從一個一致性狀態變到另一個一致性狀態。因此當資料庫只包含成功事務提交的結果時,就說資料庫處於一致性狀態。如果資料庫系統 執行中發生故障,有些事務尚未完成就被迫中斷,這些未完成事務對資料庫所做的修改有一部分已寫入物理資料庫,這時資料庫就處於一種不正確的狀態,或者說是 不一致的狀態。
隔離性。一個事務的執行不能其它事務干擾。即一個事務內部的操作及使用的資料對其它併發事務是隔離的,併發執行的各個事務之間不能互相干擾。
持續性。也稱永久性,指一個事務一旦提交,它對資料庫中的資料的改變就應該是永久性的。接下來的其它操作或故障不應該對其執行結果有任何影響。
Mysql的四種隔離級別
SQL標準定義了4類隔離級別,包括了一些具體規則,用來限定事務內外的哪些改變是可見的,哪些是不可見的。低階別的隔離級一般支援更高的併發處理,並擁有更低的系統開銷。
Read Uncommitted(讀取未提交內容)
在該隔離級別,所有事務都可以看到其他未提交事務的執行結果。本隔離級別很少用於實際應用,因為它的效能也不比其他級別好多少。讀取未提交的資料,也被稱之為髒讀(Dirty Read)。
Read Committed(讀取提交內容)
這是大多數資料庫系統的預設隔離級別(但不是MySQL預設的)。它滿足了隔離的簡單定義:一個事務只能看見已經提交事務所做的改變。這種隔離級別 也支援所謂的不可重複讀(Nonrepeatable Read),因為同一事務的其他例項在該例項處理其間可能會有新的commit,所以同一select可能返回不同結果。
Repeatable Read(可重讀)
這是MySQL的預設事務隔離級別,它確保同一事務的多個例項在併發讀取資料時,會看到同樣的資料行。不過理論上,這會導致另一個棘手的問題:幻讀 (Phantom Read)。簡單的說,幻讀指當使用者讀取某一範圍的資料行時,另一個事務又在該範圍內插入了新行,當使用者再讀取該範圍的資料行時,會發現有新的“幻影” 行。InnoDB和Falcon儲存引擎通過多版本併發控制(MVCC,Multiversion Concurrency Control)機制解決了該問題。
Serializable(可序列化)
這是最高的隔離級別,它通過強制事務排序,使之不可能相互衝突,從而解決幻讀問題。簡言之,它是在每個讀的資料行上加上共享鎖。在這個級別,可能導致大量的超時現象和鎖競爭。
這四種隔離級別採取不同的鎖型別來實現,若讀取的是同一個資料的話,就容易發生問題。例如:
髒讀(Drity Read):某個事務已更新一份資料,另一個事務在此時讀取了同一份資料,由於某些原因,前一個RollBack了操作,則後一個事務所讀取的資料就會是不正確的。
不可重複讀(Non-repeatable read):在一個事務的兩次查詢之中資料不一致,這可能是兩次查詢過程中間插入了一個事務更新的原有的資料。
幻讀(Phantom Read):在一個事務的兩次查詢中資料筆數不一致,例如有一個事務查詢了幾列(Row)資料,而另一個事務卻在此時插入了新的幾列資料,先前的事務在接下來的查詢中,就有幾列資料是未查詢出來的,如果此時插入和另外一個事務插入的資料,就會報錯。
在MySQL中,實現了這四種隔離級別,分別有可能產生問題如下所示:
測試Mysql的隔離級別
下面,將利用MySQL的客戶端程式,我們分別來測試一下這幾種隔離級別。
測試資料庫為demo,表為test;表結構:
兩個命令列客戶端分別為A,B;不斷改變A的隔離級別,在B端修改資料。
將A的隔離級別設定為read uncommitted(未提交讀)
A:啟動事務,此時資料為初始狀態
B:啟動事務,更新資料,但不提交
A:再次讀取資料,發現資料已經被修改了,這就是所謂的“髒讀”
B:回滾事務
A:再次讀資料,發現資料變回初始狀態
經過上面的實驗可以得出結論,事務B更新了一條記錄,但是沒有提交,此時事務A可以查詢出未提交記錄。造成髒讀現象。未提交讀是最低的隔離級別。
將客戶端A的事務隔離級別設定為read committed(已提交讀)
A:啟動事務,此時資料為初始狀態
B:啟動事務,更新資料,但不提交
A:再次讀資料,發現資料未被修改
B:提交事務
A:再次讀取資料,發現資料已發生變化,說明B提交的修改被事務中的A讀到了,這就是所謂的“不可重複讀”
經過上面的實驗可以得出結論,已提交讀隔離級別解決了髒讀的問題,但是出現了不可重複讀的問題,即事務A在兩次查詢的資料不一致,因為在兩次查詢之間事務B更新了一條資料。已提交讀只允許讀取已提交的記錄,但不要求可重複讀。
將A的隔離級別設定為repeatable read(可重複讀)
A:啟動事務,此時資料為初始狀態
B:啟動事務,更新資料,但不提交
A:再次讀取資料,發現資料未被修改
B:提交事務
A:再次讀取資料,發現資料依然未發生變化,這說明這次可以重複讀了
B:插入一條新的資料,並提交
A:再次讀取資料,發現資料依然未發生變化,雖然可以重複讀了,但是卻發現讀的不是最新資料,這就是所謂的“幻讀”
A:提交本次事務,再次讀取資料,發現讀取正常了
由以上的實驗可以得出結論,可重複讀隔離級別只允許讀取已提交記錄,而且在一個事務兩次讀取一個記錄期間,其他事務部的更新該記錄。但該事務不要求與其他事務可序列化。例如,當一個事務可以找到由一個已提交事務更新的記錄,但是可能產生幻讀問題(注意是可能,因為資料庫對隔離級別的實現有所差別)。像以上的實驗,就沒有出現資料幻讀的問題。
將A的隔離級別設定為可序列化(Serializable)
A:啟動事務,此時資料為初始狀態
B:發現B此時進入了等待狀態,原因是因為A的事務尚未提交,只能等待(此時,B可能會發生等待超時)
A:提交事務
B:發現插入成功
serializable完全鎖定欄位,若一個事務來查詢同一份資料就必須等待,直到前一個事務完成並解除鎖定為止。是完整的隔離級別,會鎖定對應的資料表格,因而會有效率的問題。
歡迎工作一到五年的Java工程師朋友們加入Java高階網際網路架構群:643459718 免費領取架構師資料