寫在前面
相信大部分小夥伴在面試過程中,只會針對面試官提出的表面問題來進行回答。其實不然,面試官問的每一個問題都是經過深思熟慮的,面試的時間相對來說也是短暫的,面試官不可能在很短的時間內就對你非常瞭解,他想通過幾個問題來考察你所掌握的知識的深度和廣度,如果你只是回答面試官表面問你的問題,向擠牙膏一樣,問一點,答一點,結果不用說,肯定是涼涼了。
面試問題
說說什麼是事務?併發事務會帶來哪些問題呢?
分析問題
表面上看,面試官是問了兩個問題。一個是:什麼是事務,也就是讓你說說事務的基本概念;另一個是:併發事務會帶來哪些問題。
實則不然,聽到面試官這樣問,你不要隨意回答。要用極短的時間思考一下,面試官究竟想要得到什麼答案。
對於第一個問題:說說什麼是事務?就只是讓你簡單的說說事務的基本概念嗎?基本概念相信是個學過資料庫的小學生都會,面試官為什麼會問你這個問題呢?此時,你需要揣測面試官的心理。此時的面試官其實想問你的不久是事務的基本概念,而且他也想讓你說出事務的特性,也就是四大屬性。這才是這個問題的核心所在!
對於第二個問題:併發事務會帶來哪些問題呢?就只是想問一下會帶來哪些問題嗎?知道問題,不知道如何解決問題,這樣的面試者面試官能要嗎?究其本質,面試官是想問你併發事務會帶來哪些問題,有哪些解決方案能夠解決這些問題!這才是面試官想要的答案!
綜上,面試官本質上問的問題是:什麼是事務?事務的四大特性是什麼?併發事務會帶來哪些問題?有哪些解決方案?你只有深刻理解了面試官提問的本質,才能更好的回答面試官所提出的問題。不然,你應付面試官,面試官也會應付你。
什麼是事務?
事務的概念理解起來還比較簡單的:事務是指作為單個邏輯工作單元執行的一系列操作,要麼完全地執行,要麼完全地不執行。 事務處理可以確保除非事務性單元內的所有操作都成功完成,否則不會永久更新面向資料的資源。通過將一組相關操作組合為一個要麼全部成功要麼全部失敗的單元,可以簡化錯誤恢復並使應用程式更加可靠。一個邏輯工作單元要成為事務,必須滿足所謂的ACID(原子性、一致性、隔離性和永續性)屬性。事務是資料庫執行中的邏輯工作單位,由DBMS中的事務管理子系統負責事務的處理。
事務的四大特性
原子性(Atomicity)
事務必須是原子工作單元;對於其資料修改,要麼全都執行,要麼全都不執行。比如轉賬,要麼轉賬成功,賬戶餘額增加(減少);要麼轉賬失敗,賬戶餘額不變。
一致性(Consistency)
事務在完成時,必須使所有的資料都保持一致狀態。在相關資料庫中,所有規則都必須應用於事務的修改,以保持所有資料的完整性。事務結束時,所有的內部資料結構(如 B 樹索引或雙向連結串列)都必須是正確的。某些維護一致性的責任由應用程式開發人員承擔,他們必須確保應用程式已強制所有已知的完整性約束。例如,當開發用於轉帳的應用程式時,應避免在轉帳過程中任意移動小數點。
隔離性(Isolation)
由併發事務所作的修改必須與任何其它併發事務所作的修改隔離。事務檢視資料時資料所處的狀態,要麼是另一併發事務修改它之前的狀態,要麼是另一事務修改它之後的狀態,事務不會檢視中間狀態的資料。這稱為隔離性,因為它能夠重新裝載起始資料,並且重播一系列事務,以使資料結束時的狀態與原始事務執行的狀態相同。當事務可序列化時將獲得最高的隔離級別。在此級別上,從一組可並行執行的事務獲得的結果與通過連續執行每個事務所獲得的結果相同。由於高度隔離會限制可並行執行的事務數,所以一些應用程式降低隔離級別以換取更大的吞吐量。
永續性(Durability)
事務完成之後,它對於系統的影響是永久性的。該修改即使出現致命的系統故障也將一直保持。
例如我們在使用JDBC運算元據庫時,在提交事務方法後,提示使用者事務操作完成,當我們程式執行完成直到看到提示後,就可以認定事務以及正確提交,即使這時候資料庫出現了問題,也必須要將我們的事務完全執行完成,否則就會造成我們看到提示事務處理完畢,但是資料庫因為故障而沒有執行事務的重大錯誤。
併發事務帶來的問題
髒寫問題
當兩個或多個事務選擇同一行,然後基於最初選定的值更新該行時,會發生丟失更新問題。每個事務都不知道其它事務的存在。最後的更新將重寫由其它事務所做的更新,這將導致資料丟失。
例如,T1和T2同時修改一條資料,T2的修改覆蓋了T1的修改;如果在T1之後T2才能進行更改,則可以避免該問題。
我們來看一個經典的轉賬問題,開始小明和小剛都有1000元錢,在事務T1中,小明為小剛轉賬100元,在事務T2中,小剛為小明轉賬200元。則正常情況下,結果為:小明有1100元,小剛為900元。如果發生了髒寫的問題,則結果可能為:小明1200元,小剛800元。如下圖所示。
髒讀問題
一個事務正在對一條記錄做修改,在這個事務完成並提交前,這條記錄的資料就處於不一致狀態;這時,另一個事務也來讀取同一條記錄,如果不加控制,第二個事務讀取了這些“髒”資料,並據此做進一步的處理,就會產生未提交的資料依賴關係。這種現象被形象地叫做”髒讀”。
例如:在事務T1中,小明為小剛轉賬100元,在轉賬的過程中,事務未提交或者未回滾時,此時事務T2讀取到了事務T1未提交的內容,也就是說在事務T2中讀取到了小明900元,小剛1100元的記錄。可以用下圖表示。
不可重複讀問題
一個事務在讀取某些資料後的某個時間,再次讀取以前讀過的資料,卻發現其讀出的資料已經發生了改變!這種現象就叫做“不可重複讀”。
指事務T2讀取資料後,事務T1執行更新操作,使T2無法讀取前一次結果。
例如,在事務T1中執行小明為小剛轉賬100元的操作,在事務未提交之前,在事務T2中讀取的資料還是小明為1000元,小剛為1000元。待事務T1提交後,事務T2中讀取的資料為小明900元,小剛1100元。如下圖所示。
幻讀問題
一個事務按相同的查詢條件重新讀取以前檢索過的資料,卻發現其他事務插入了滿足其查詢條件的新資料,這種現象就稱為“幻讀”。
事務t2讀取到了事務t1體提交的新增、刪除資料,不符合隔離性。
幻讀和不可重複讀都是讀取了另一條已經提交的事務(這點就髒讀不同),所不同的是不可重複讀查詢的都是同一個資料項,而幻讀針對的是一批資料整體(比如資料的個數)。
例如,在事務T1中插入兩條分別為小明和小剛的資料,在事務提交之前,事務T2中讀取的資料記錄為10,隨後事務T1提交,則在事務T2中讀取的記錄為12,如下所示。
併發事務問題的解決方案
為了避免上面出現的幾種情況,在標準SQL規範中,定義了4個事務隔離級別,不同的隔離級別對事務的處理不同。以下四種不同的隔離級別限制由低到高,效能從高到底。
讀未提交
讀未提交(Read Uncommitted):允許髒讀取,但不允許更新丟失。如果一個事務已經開始寫資料,則另外一個事務則不允許同時進行寫操作,但允許其他事務讀此行資料。該隔離級別可以通過“排他寫鎖”實現。
不可避免 髒讀、不可重複讀、虛讀。
讀已提交
讀已提交(Read Committed):允許不可重複讀取,但不允許髒讀取。這可以通過“瞬間共享讀鎖”和“排他寫鎖”實現。讀取資料的事務允許其他事務繼續訪問該行資料,但是未提交的寫事務將會禁止其他事務訪問該行。
可避免 髒讀,不可避免 不可重複讀、虛讀。Oracle採用讀已提交。
可重複度
可重複讀取(Repeatable Read):禁止不可重複讀取和髒讀取,但是有時可能出現幻讀資料。這可以通過“共享讀鎖”和“排他寫鎖”實現。讀取資料的事務將會禁止寫事務(但允許讀事務),寫事務則禁止任何其他事務。
可避免 髒讀、不可重複讀, 不可避免 虛讀。MySQL採用可重複讀。
序列化
序列化(Serializable):提供嚴格的事務隔離。它要求事務序列化執行,事務只能一個接著一個地執行,不能併發執行。僅僅通過“行級鎖”是無法實現事務序列化的,必須通過其他機制保證新插入的資料不會被剛執行查詢操作的事務訪問到。
可避免 髒讀、不可重複讀、幻讀情況的發生。
事務的四種隔離級別總結起來如下圖所示。
常看當前資料庫的事務隔離級別: show variables like 'tx_isolation';
設定事務隔離級別:set tx_isolation='REPEATABLE-READ';
Mysql預設的事務隔離級別是可重複讀,用Spring開發程式時,如果不設定隔離級別預設用Mysql設定的隔離級別,如果Spring設定了就用已經設定的隔離級別
重磅福利
關注「 冰河技術 」微信公眾號,後臺回覆 “設計模式” 關鍵字領取《深入淺出Java 23種設計模式》PDF文件。回覆“Java8”關鍵字領取《Java8新特性教程》PDF文件。回覆“限流”關鍵字獲取《億級流量下的分散式限流解決方案》PDF文件,三本PDF均是由冰河原創並整理的超硬核教程,面試必備!!
好了,今天就聊到這兒吧!別忘了點個贊,給個在看和轉發,讓更多的人看到,一起學習,一起進步!!
寫在最後
如果你覺得冰河寫的還不錯,請微信搜尋並關注「 冰河技術 」微信公眾號,跟冰河學習高併發、分散式、微服務、大資料、網際網路和雲原生技術,「 冰河技術 」微信公眾號更新了大量技術專題,每一篇技術文章乾貨滿滿!不少讀者已經通過閱讀「 冰河技術 」微信公眾號文章,吊打面試官,成功跳槽到大廠;也有不少讀者實現了技術上的飛躍,成為公司的技術骨幹!如果你也想像他們一樣提升自己的能力,實現技術能力的飛躍,進大廠,升職加薪,那就關注「 冰河技術 」微信公眾號吧,每天更新超硬核技術乾貨,讓你對如何提升技術能力不再迷茫!