cap理論賞析

brave_zhao發表於2018-04-02

分散式領域CAP理論,
Consistency(一致性), 資料一致更新,所有資料變動都是同步的
Availability(可用性), 好的響應效能
Partition tolerance(分割槽容忍性) 可靠性

定理:任何分散式系統只可同時滿足二點,沒法三者兼顧。
忠告:架構師不要將精力浪費在如何設計能滿足三者的完美分散式系統,而是應該進行取捨。

關聯式資料庫的ACID模型擁有 高一致性 + 可用性 很難進行分割槽:
Atomicity原子性:一個事務中所有操作都必須全部完成,要麼全部不完成。
Consistency一致性. 在事務開始或結束時,資料庫應該在一致狀態。
Isolation隔離層. 事務將假定只有它自己在運算元據庫,彼此不知曉。
Durability. 一旦事務完成,就不能返回。
跨資料庫兩段提交事務:2PC (two-phase commit), 2PC is the anti-scalability pattern (Pat Helland) 是反可伸縮模式的,JavaEE中的JTA事務可以支援2PC。因為2PC是反模式,儘量不要使用2PC,使用BASE來回避。

BASE模型反ACID模型,完全不同ACID模型,犧牲高一致性,獲得可用性或可靠性:
Basically Available基本可用。支援分割槽失敗(e.g. sharding碎片劃分資料庫)
Soft state軟狀態 狀態可以有一段時間不同步,非同步。
Eventually consistent最終一致,最終資料是一致的就可以了,而不是時時高一致。

BASE思想的主要實現有
1.按功能劃分資料庫
2.sharding碎片

BASE思想主要強調基本的可用性,如果你需要High 可用性,也就是純粹的高效能,那麼就要以一致性或容忍性為犧牲,BASE思想的方案在效能上還是有潛力可挖的。

現在NOSQL運動豐富了擴充了BASE思想,可按照具體情況定製特別方案,比如忽視一致性,獲得高可用性等等,NOSQL應該有下面兩個流派:
1. Key-Value儲存,如Amaze Dynamo等,可根據CAP三原則靈活選擇不同傾向的資料庫產品。
2. 領域模型 + 分散式快取 + 儲存 (Qi4j和NoSql運動),可根據CAP三原則結合自己專案定製靈活的分散式方案,難度高。

這兩者共同點:都是關聯式資料庫SQL以外的可選方案,邏輯隨著資料分佈,任何模型都可以自己持久化,將資料處理和資料儲存分離,將讀和寫分離,儲存可以是非同步或同步,取決於對一致性的要求程度。

不同點:NOSQL之類的Key-Value儲存產品是和關聯式資料庫頭碰頭的產品BOX,可以適合非Java如PHP RUBY等領域,是一種可以拿來就用的產品,而領域模型 + 分散式快取 + 儲存是一種複雜的架構解決方案,不是產品,但這種方式更靈活,更應該是架構師必須掌握的。


相關文章