分散式事務(一)—分散式事務的概念

御狐神發表於2021-10-19

現今網際網路界,分散式系統和微服務架構盛行。一個簡單操作,在服務端非常可能是由多個服務和資料庫例項協同完成的。在網際網路金融等一致性要求較高的場景下,多個獨立操作之間的一致性問題顯得格外棘手。隨著業務的快速發展、業務複雜度越來越高,幾乎每個公司的系統都會從單體走向分散式,特別是轉向微服務架構,隨之而來就必然遇到分散式事務這個難題。本文會介紹分散式事務的一些相關概念。

分散式事務的概念

資料庫事務

資料庫事務的目的

資料庫事務(簡稱:事務)是資料庫管理系統執行過程中的一個邏輯單位,由一個有限的資料庫操作序列構成。資料庫事務通常包含了一個序列的對資料庫的讀/寫操作。包含有以下兩個目的:

  • 為資料庫操作序列提供了一個從失敗中恢復到正常狀態的方法,同時提供了資料庫即使在異常狀態下仍能保持一致性的方法。
  • 當多個應用程式在併發訪問資料庫時,可以在這些應用程式之間提供一個隔離方法,以防止彼此的操作互相干擾。

當事務被提交給了資料庫管理系統(DBMS),則DBMS需要確保該事務中的所有操作都成功完成且其結果被永久儲存在資料庫中,如果事務中有的操作沒有成功完成,則事務中的所有操作都需要回滾,回到事務執行前的狀態;同時,該事務對資料庫或者其他事務的執行無影響,所有的事務都好像在獨立的執行。

ACID特性

資料庫事務擁有以下四個特性,習慣上被稱之為ACID特性:

  1. 原子性(Atomicity):事務中的所有操作作為一個整體像原子一樣不可分割,要麼全部成功,要麼全部失敗。
  2. 一致性(Consistency):事務的執行結果必須使資料庫從一個一致性狀態到另一個一致性狀態。一致性狀態是指:1.系統的狀態滿足資料的完整性約束(主碼,參照完整性,check約束等) 2.系統的狀態反應資料庫本應描述的現實世界的真實狀態,比如轉賬前後兩個賬戶的金額總和應該保持不變。
  3. 隔離性(Isolation):併發執行的事務不會相互影響,其對資料庫的影響和它們序列執行時一樣。比如多個使用者同時往一個賬戶轉賬,最後賬戶的結果應該和他們按先後次序轉賬的結果一樣。
  4. 永續性(Durability):事務一旦提交,其對資料庫的更新就是持久的。任何事務或系統故障都不會導致資料丟失。

ACID特性的實現

資料庫的併發控制

影響資料庫ACID實現的因素有兩個:併發和系統故障,相應地,資料庫系統通過併發控制技術和日誌恢復技術來實現資料庫的ACID特性。

併發控制技術是實現事務隔離性以及不同隔離級別的關鍵,實現方式有很多,按照其對可能衝突的操作採取的不同策略可以分為樂觀併發控制和悲觀併發控制兩大類。

  • 樂觀併發控制:對於併發執行可能衝突的操作,假定其不會真的衝突,允許併發執行,直到真正發生衝突時才去解決衝突,比如讓事務回滾。
  • 悲觀併發控制:對於併發執行可能衝突的操作,假定其必定發生衝突,通過讓事務等待(鎖)或者中止(時間戳排序)的方式使並行的操作序列執行。

其實現方式有多種: 基於封鎖的併發控制、基於時間戳的併發控制、基於有效性檢查的併發控制、基於快照隔離的併發控制.

資料庫日誌

資料庫執行過程中可能會出現故障,這些故障包括事務故障和系統故障兩大類

  • 事務故障:比如非法輸入,系統出現死鎖,導致事務無法繼續執行。
  • 系統故障:比如由於軟體漏洞或硬體錯誤導致系統崩潰或中止。

這些故障可能會對事務和資料庫狀態造成破壞,因而必須提供一種技術來對各種故障進行恢復,保證資料庫一致性,事務的原子性以及永續性。資料庫通常以日誌的方式記錄資料庫的操作從而在故障時進行恢復,因而可以稱之為日誌恢復技術。資料庫日誌包含undo和redo日誌。

分散式事務場景

當我們的單個資料庫的效能產生瓶頸的時候,我們可能會對資料庫進行分割槽,這裡所說的分割槽指的是物理分割槽,分割槽之後可能不同的庫就處於不同的伺服器上了,這個時候單個資料庫的ACID已經不能適應這種情況了,而在這種ACID的叢集環境下,再想保證叢集的ACID幾乎是很難達到,或者即使能達到那麼效率和效能會大幅下降,最為關鍵的是再很難擴充套件新的分割槽了,這個時候如果再追求叢集的ACID會導致我們的系統變得很差,這時我們就需要引入一個新的理論原則來適應這種叢集的情況,就是CAP原則或者叫CAP定理?

CAP定理

CAP定理是由加州大學伯克利分校Eric Brewer教授提出來的,他指出WEB服務無法同時滿足一下3個屬性:

  • 一致性(Consistency):(等同於所有節點訪問同一份最新的資料副本)
  • 可用性(Availability):(每次請求都能獲取到非錯的響應——但是不保證獲取的資料為最新資料)
  • 分割槽容錯性(Partition tolerance):(以實際效果而言,分割槽相當於對通訊的時限要求。系統如果不能在時限內達成資料一致性,就意味著發生了分割槽的情況,必須就當前操作在C和A之間做出選擇。)

CAP 示例

根據定理,分散式系統只能滿足三項中的兩項而不可能滿足全部三項。理解CAP理論的最簡單方式是想象兩個節點分處分割槽兩側。允許至少一個節點更新狀態會導致資料不一致,即喪失了C性質。如果為了保證資料一致性,將分割槽一側的節點設定為不可用,那麼又喪失了A性質。除非兩個節點可以互相通訊,才能既保證C又保證A,這又會導致喪失P性質。

因此在進行分散式架構設計時,必須做出取捨。當前一般是通過分散式快取中各節點的最終一致性來提高系統的效能,通過使用多節點之間的資料非同步複製技術來實現叢集化的資料一致性。通常使用類似 memcached 之類的 NOSQL 作為實現手段。雖然 memcached 也可以是分散式叢集環境的,但是對於一份資料來說,它總是儲存在某一臺 memcached 伺服器上。如果發生網路故障或是伺服器當機,則儲存在這臺伺服器上的所有資料都將不可訪問。由於資料是儲存在記憶體中的,重啟伺服器,將導致資料全部丟失。當然也可以自己實現一套機制,用來在分散式 memcached 之間進行資料的同步和持久化,但是實現難度是非常大的。

分割槽容錯性(Partition tolerance)

大多數分散式系統都分佈在多個子網路。每個子網路就叫做一個區(partition)。分割槽容錯的意思是,區間通訊可能失敗。比如,一臺伺服器放在中國,另一臺伺服器放在美國,這就是兩個區,它們之間可能無法通訊。

圖中,P1和P2是兩臺跨區的伺服器。P1向P2傳送一條訊息,P2可能無法收到。系統設計的時候,必須考慮到這種情況。一般來說,分割槽容錯無法避免,因此可以認為CAP的P總是成立。CAP定理告訴我們,剩下的C和A無法同時做到。

分割槽容錯

一致性(Consistency)

一致性意味著寫操作之後的讀操作,必須返回該值。舉例來說,某條記錄是v1=1,使用者向P1發起一個寫操作,將其改為v1=10,接下來,使用者的讀操作就會得到v1=10,這就叫一致性。

一致性

問題是,使用者有可能向P2發起讀操作,由於P2的值沒有發生變化,因此返回的是 v0。P1和P2讀操作的結果不一致,這就不滿足一致性了。

資料不一致

為了讓P2也能變為v1=10,就要在P1寫操作的時候,讓P1向P2傳送一條訊息,要求P2也改成v1=10。

同步P2

可用性(Availability)

可用性是指只要收到使用者的請求,伺服器就必須給出回應。
使用者可以選擇向P1或P2發起讀操作。不管是哪臺伺服器,只要收到請求,就必須告訴使用者v1的值,否則就不滿足可用性。

一致性和可用性的矛盾

一致性和可用性,為什麼不可能同時成立?答案很簡單,因為可能通訊失敗(即出現分割槽容錯)。

如果保證P2的一致性,那麼P1必須在寫操作時,鎖定P2的讀操作和寫操作。只有資料同步後,才能重新開放讀寫。鎖定期間,P2不能讀寫,沒有可用性。如果保證P2的可用性,那麼勢必不能鎖定P2,所以一致性不成立。綜上所述,P2無法同時做到一致性和可用性。系統設計時只能選擇一個目標。如果追求一致性,那麼無法保證所有節點的可用性;如果追求所有節點的可用性,那就沒法做到一致性。

那麼在什麼場合,可用性高於一致性?舉例來說,釋出一張網頁到 CDN,多個伺服器有這張網頁的副本。後來發現一個錯誤,需要更新網頁,這時只能每個伺服器都更新一遍。一般來說,網頁的更新不是特別強調一致性。短時期內,一些使用者拿到老版本,另一些使用者拿到新版本,問題不會特別大。當然,所有人最終都會看到新版本。所以,這個場合就是可用性高於一致性。

常見產品

Ereka->ereka是SpringCloud系列用來做服務註冊和發現的元件,作為服務發現的一個實現,在設計的時候就更考慮了可用性,保證了AP。

Zookeeper->Zookeeper在實現上犧牲了可用性,保證了一致性(單調一致性)和分割槽容錯性,也即:CP。所以這也是SpringCloud拋棄了zookeeper而選擇Ereka的原因。

Zookeeper當master掛了,會在30-120s進行leader選舉,這點類似於redis的哨兵機制,在選舉期間Zookeeper是不可用的,這麼長時間不能進行服務註冊,是無法忍受的,別說30s,5s都不能忍受。這時Zookeeper叢集會癱瘓,這也是Zookeeper的CP,保持節點的一致性,犧牲了A/高可用。而Eureka不會,即使Eureka有部分掛掉,還有其他節點可以使用的,他們保持平級的關係,只不過資訊有可能不一致,這就是AP,犧牲了C/一致性。

BASE理論

如前文中說CAP定理是三個單詞的縮寫,BASE也是一樣,是由Basically Available(基本可用),Soft state(軟狀態),和 Eventually consistent(最終一致性)三個短語的縮寫。

為什麼要BASE理論

CAP定理只能三選二,CAP理論表明,對於一個分散式系統而言,它是無法同時滿足Consistency(強一致性)、Availability(可用性) 和Partition tolerance(分割槽容忍性) 這三個條件的,最多隻能滿足其中兩個。

分割槽容錯必須選,對於網際網路來說,由於網路環境是不可信的,所以分割槽容錯性(P)必須滿足

為了使用者體驗,先選可用性。現在只能在一致性和可用性之間做選擇,大部分情況下,大家都會選擇犧牲一部分的一致性來保證可用性,因為你不返回給使用者資料,這體驗也太差了,寧可拒絕服務也不能說能訪問卻沒有資料,當然,嚴格場景下,比如支付場景,強一致性是必須要滿足,這另說。

但是放棄了一致性的系統又失去了存在的意義,好了,我們只能放棄一致性,但是我們真這樣做了,將一致性放棄了,現在這個系統返回的資料你敢信嗎?沒有一致性,系統中的資料也就從根本上變得不可信了,那這資料拿來有什麼用,那這個系統也就沒有任何價值,根本沒用。

如上所述,由於我們三者都無法拋棄,但CAP定理限制了我們三者無法同時滿足,這種情況,我們會選擇儘量靠近CAP定理,即儘量讓C、A、P都滿足,在此大勢所趨下,出現了BASE定理。

核心思想

強一致性(Strong consistency)無法得到保障時(分割槽容錯和可用性滿足系統),我們可以根據業務自身的特點,採用適當的方式來達到最終一致性(Eventual consistency)。

base-demo-2021-10-19-17-54-26

基本可用(Basically Available)

基本可用是相對於正常的系統來說的,常見如下情況

響應時間上的損失:正常情況下的搜尋引擎0.5秒即返回給使用者結果,而基本可用看的搜尋結果可能要1秒,2秒甚至3秒。如下圖中所示,本來使用者可以從redis用10ms讀取到資料,但是有些情況下為了保證一致性,需要從MySql花費1s讀取資料,使用者以更長的時間代價拿到了資料。

響應時間上的損失

功能上的損失:在一個電商網站上,正常情況下,使用者可以順利完成每一筆訂單,但是到了促銷時間,可能為了應對併發,保護購物系統的穩定性,部分使用者會被引導到一個降級頁面。

降級服務

軟狀態

軟狀態是相對原子性來說的

原子性(硬狀態)-> 要求多個節點的資料副本都是一致的,這是一種"硬狀態"。我們在之前學習過硬狀態,指的就是ACID的原子性。如下圖所示,硬狀態只有在訂單狀態、積分傳送成功、倉庫出單成功,即三者同時成功的情況才算支付成功。

ACID示例

軟狀態(弱狀態)-> 允許系統中的資料存在中間狀態,並認為該狀態不影響系統的整體可用性,即允許系統在多個不同節點的資料副本存在資料延遲。軟狀態不需要完全符合ACID的原子性先把訂單狀態改成已支付成功,然後告訴使用者已經成功了,剩下在非同步傳送mq訊息通知積分服務和倉庫服務,即使消費失敗,MQ訊息也會重新傳送(重試)。

軟狀態

最終一致性(Eventually consistent)

弱一致性和強一致性相對,系統並不保證連續程式或者執行緒的訪問都會返回最新的更新過的值。系統在資料寫入成功之後,不承諾立即可以讀到最新寫入的值,也不會具體的承諾多久之後可以讀到。但會 儘可能保證在某個時間級別(比如秒級別)之後,可以讓資料達到一致性狀態。最終一致性是弱一致性的特定形式。

強一致性與弱一致性:其實只有兩類資料一致性,強一致性與弱一致性。強一致性也叫做線性一致性,除此以外,所有其他的一致性都是弱一致性的特殊情況。所謂強一致性,即複製是同步的,弱一致性,即複製是非同步的。

使用者更新網站頭像,在某個時間點,使用者向主庫傳送更新請求,不久之後主庫就收到了請求。在某個時刻,主庫又會將資料變更轉發給自己的從庫。最後,主庫通知使用者更新成功。

如果在返回“更新成功”並使新頭像對其他使用者可見之前,主庫需要等待從庫的確認,確保從庫已經收到寫入操作,那麼複製是同步的,即強一致性。如果主庫寫入成功後,不等待從庫的響應,直接返回“更新成功”,則複製是非同步的,即弱一致性。

強一致性可以保證從庫有與主庫一致的資料。如果主庫突然當機,我們仍可以保證資料完整。但如果從庫當機或網路阻塞,主庫就無法完成寫入操作。

在實踐中,我們通常使一個從庫是同步的,而其他的則是非同步的。如果這個同步的從庫出現問題,則使另一個非同步從庫同步。這可以確保永遠有兩個節點擁有完整資料:主庫和同步從庫。 這種配置稱為半同步。

X/Open DTP模型與XA規範

X/Open,即現在的open group,是一個獨立的組織,主要負責制定各種行業技術標準。官網地址:http://www.opengroup.org/。X/Open組織主要由各大知名公司或者廠商進行支援,這些組織不光遵循X/Open組織定義的行業技術標準,也參與到標準的制定。下圖展示了open group目前主要成員(官網截圖):

x-open-2021-10-19-17-57-05

DTP 參考模型:Distributed Transaction Processing: Reference Model

DTP XA規範: Distributed Transaction Processing: The XA Specification

參考文件

維基百科——資料庫事務
維基百科——CAP定理
資料庫事務的概念及其實現原理
詳解分散式BASE定理
面試必問:分散式事務六種解決方案
漫畫:什麼是分散式事務?
聊聊分散式事務,再說說解決方案
分散式事務?No, 最終一致性
CAP 定理的含義
分散式事務概述

我是御狐神,歡迎大家關注我的微信公眾號:wzm2zsd

qrcode_for_gh_83670e17bbd7_344-2021-09-04-10-55-16

本文最先發布至微信公眾號,版權所有,禁止轉載!

相關文章