Kubernetes併發控制與資料一致性的實現原理

雲容器大師發表於2018-11-22

原文網址 : https://www.cnblogs.com/huaweiyuncce/p/10001148.html

在大型分散式系統中，定會存在大量併發寫入的場景。在這種場景下如何進行更好的併發控制，即在多個任務同時存取資料時保證資料的一致性，成為分散式系統必須解決的問題。
悲觀併發控制和樂觀併發控制是併發控制中採用的主要技術手段，對於不同的業務場景，應該選擇不同的控制方法。
悲觀鎖
悲觀併發控制（又名“悲觀鎖”，Pessimistic Concurrency Control，縮寫“PCC”）是一種併發控制的方法。它可以阻止一個事務以影響其他使用者的方式來修改資料。如果一個事務執行的操作讀某行資料應用了鎖，那只有當這個事務把鎖釋放，其他事務才能夠執行與該鎖衝突的操作。
在悲觀鎖的場景下，假設使用者A和B要修改同一個檔案，A在鎖定檔案並且修改的過程中，B是無法修改這個檔案的，只有等到A修改完成，並且釋放鎖以後，B才可以獲取鎖，然後修改檔案。由此可以看出，悲觀鎖對併發的控制持悲觀態度，它在進行任何修改前，首先會為其加鎖，確保整個修改過程中不會出現衝突，從而有效的保證資料一致性。但這樣的機制同時降低了系統的併發性，尤其是兩個同時修改的物件本身不存在衝突的情況。同時也可能在競爭鎖的時候出現死鎖，所以現在很多的系統例如Kubernetes採用了樂觀併發的控制方法。
樂觀鎖
樂觀併發控制（又名“樂觀鎖”，Optimistic Concurrency Control，縮寫“OCC”）是一種併發控制的方法。它假設多使用者併發的事務在處理時不會彼此影響，各事務能夠在不請求鎖的情況下處理各自的資料。在提交資料更新之前，每個事務會先檢查在該事務讀取資料後，有沒有其他事務又修改了該資料。如果其他事務有更新的話，正在提交的事務會進行回滾。
相對於悲觀鎖對鎖的提前控制，樂觀鎖相信請求之間出現衝突的概率是比較小的，在讀取及更改的過程中都是不加鎖的，只有在最後提交更新時才會檢測衝突，因此在高併發量的系統中佔有絕對優勢。同樣假設使用者A和B要修改同一個檔案，A和B會先將檔案獲取到本地，然後進行修改。如果A已經修改好並且將資料提交，此時B再提交，伺服器端會告知B檔案已經被修改，返回衝突錯誤。此時衝突必須由B來解決，可以將檔案重新獲取回來，再一次修改後提交。
樂觀鎖通常通過增加一個資源版本欄位，來判斷請求是否衝突。初始化時指定一個版本值，每次讀取資料時將版本號一同讀出，每次更新資料，同時也對版本號進行更新。當伺服器端收到資料時，將資料中的版本號與伺服器端的做對比，如果不一致，則說明資料已經被修改，返回衝突錯誤。
Kubernetes中的併發控制
在Kubernetes叢集中，外部使用者及內部元件頻繁的資料更新操作，導致系統的資料併發讀寫量非常大。假設採用悲觀並行的控制方法，將嚴重損耗叢集效能，因此Kubernetes採用樂觀並行的控制方法。Kubernetes通過定義資源版本欄位實現了樂觀併發控制，資源版本(ResourceVersion)欄位包含在Kubernetes物件的後設資料(Metadata)中。這個字串格式的欄位標識了物件的內部版本號，其取值來自etcd的modifiedindex，且當物件被修改時，該欄位將隨之被修改。值得注意的是該欄位由服務端維護，不建議在客戶端進行修改。
type ObjectMeta struct {
......
// An opaque value that represents the internal version of this object that can
// be used by clients to determine when objects have changed. May be used for optimistic
// concurrency, change detection, and the watch operation on a resource or set of resources.
// Clients must treat these values as opaque and passed unmodified back to the server.
// They may only be valid for a particular resource or set of resources.
//
// Populated by the system.
// Read-only.
// Value must be treated as opaque by clients and .
// More info: https://git.k8s.io/community/contributors/devel/api-conventions.md#concurrency-control-and-consistency
// +optional
ResourceVersion string
......
}
Kube-Apiserver可以通過該欄位判斷物件是否已經被修改。當包含ResourceVersion的更新請求到達Apiserver，伺服器端將對比請求資料與伺服器中資料的資源版本號，如果不一致，則表明在本次更新提交時，服務端物件已被修改，此時Apiserver將返回衝突錯誤(409)，客戶端需重新獲取服務端資料，重新修改後再次提交到伺服器端。上述並行控制方法可防止如下的data race：
Client #1: GET Foo
Client #2: GET Foo
Client #1: Set Foo.Bar = "one"
Client #1: PUT Foo
Client #2: Set Foo.Baz = "two"
Client #2: PUT Foo
當未採用併發控制時，假設發生如上請求序列，兩個客戶端同時從服務端獲取同一物件Foo(含有Bar、Baz兩個欄位)，Client#1先將Bar欄位置成one，其後Client#2對Baz欄位賦值的更新請求到服務端時，將覆蓋Client#1對Bar的修改。反之在物件中新增資源版本欄位，同樣的請求序列將如下：
Client #1: GET Foo //初始Foo.ResourceVersion=1
Client #2: GET Foo //初始Foo.ResourceVersion=1
Client #1: Set Foo.Bar = "one"
Client #1: PUT Foo //更新Foo.ResourceVersion=2
Client #2: Set Foo.Baz = "two"
Client #2: PUT Foo //返回409衝突
Client#1更新物件後資源版本號將改變，Client#2在更新提交時將返回衝突錯誤(409)，此時Client#2必須在本地重新獲取資料，更新後再提交到服務端。
假設更新請求的物件中未設定ResourceVersion值，Kubernetes將會根據硬改寫策略(可配置)決定是否進行硬更新。如果配置為可硬改寫，則資料將直接更新並存入Etcd，反之則返回錯誤，提示使用者必須指定ResourceVersion。
Kubernetes中的Update和Patch
Kubernetes實現了Update和Patch兩個物件更新的方法，兩者提供不同的更新操作方式，但衝突判斷機制是相同的。
Update
對於Update，客戶端更新請求中包含的是整個obj物件，伺服器端將對比該請求中的obj物件和伺服器端最新obj物件的ResourceVersion值。如果相等，則表明未發生衝突，將成功更新整個物件。反之若不相等則返回409衝突錯誤，Kube-Apiserver中衝突判斷的程式碼片段如下。
e.Storage.GuaranteedUpdate(ctx, key...) (runtime.Object, *uint64, error) {
// If AllowUnconditionalUpdate() is true and the object specified by
// the user does not have a resource version, then we populate it with
// the latest version. Else, we check that the version specified by
// the user matches the version of latest storage object.
resourceVersion, err := e.Storage.Versioner().ObjectResourceVersion(obj)
if err != nil {
return nil, nil, err
}
version, err := e.Storage.Versioner().ObjectResourceVersion(existing)
doUnconditionalUpdate := resourceVersion == 0 && e.UpdateStrategy.AllowUnconditionalUpdate()
if doUnconditionalUpdate {
// Update the object's resource version to match the latest
// storage object's resource version.
err = e.Storage.Versioner().UpdateObject(obj, res.ResourceVersion)
if err != nil {
return nil, nil, err
}
} else {
// Check if the object's resource version matches the latest
// resource version.
......
if resourceVersion != version {
return nil, nil, kubeerr.NewConflict(qualifiedResource, name, fmt.Errorf(OptimisticLockErrorMsg))
}
}
......
return out, creating, nil
}
基本流程為：
1. 獲取當前更新請求中obj物件的ResourceVersion值，及伺服器端最新obj物件(existing)的ResourceVersion值
2. 如果當前更新請求中obj物件的ResourceVersion值等於0，即客戶端未設定該值，則判斷是否要硬改寫(AllowUnconditionalUpdate)，如配置為硬改寫策略，將直接更新obj物件
3. 如果當前更新請求中obj物件的ResourceVersion值不等於0，則判斷兩個ResourceVersion值是否一致，不一致返回衝突錯誤(OptimisticLockErrorMsg)
Patch
相比Update請求包含整個obj物件，Patch請求實現了更細粒度的物件更新操作，其請求中只包含需要更新的欄位。例如要更新pod中container的映象，可使用如下命令：
kubectl patch pod my-pod -p '{"spec":{"containers":[{"name":"my-container","image":"new-image"}]}}'
伺服器端只收到以上的patch資訊，然後通過如下程式碼將該patch更新到Etcd中。
func (p *patcher) patchResource(ctx context.Context) (runtime.Object, error) {
p.namespace = request.NamespaceValue(ctx)
switch p.patchType {
case types.JSONPatchType, types.MergePatchType:
p.mechanism = &jsonPatcher{patcher: p}
case types.StrategicMergePatchType:
schemaReferenceObj, err := p.unsafeConvertor.ConvertToVersion(p.restPatcher.New(), p.kind.GroupVersion())
if err != nil {
return nil, err
}
p.mechanism = &smpPatcher{patcher: p, schemaReferenceObj: schemaReferenceObj}
default:
return nil, fmt.Errorf("%v: unimplemented patch type", p.patchType)
}
p.updatedObjectInfo = rest.DefaultUpdatedObjectInfo(nil, p.applyPatch, p.applyAdmission)
return finishRequest(p.timeout, func() (runtime.Object, error) {
updateObject, _, updateErr := p.restPatcher.Update(ctx, p.name, p.updatedObjectInfo, p.createValidation, p.updateValidation, false, p.options)
return updateObject, updateErr
})
}
基本流程為：
1.首先判斷patch的型別，根據型別選擇相應的mechanism
2.利用DefaultUpdatedObjectInfo方法將applyPatch(應用Patch的方法)新增到admission chain的頭部
3.最終還是呼叫上述Update方法執行更新操作
在步驟2中將applyPatch方法掛到admission chain的頭部，與admission行為相似，applyPatch方法會將patch應用到最新獲取的伺服器端obj上，生成一個已更新的obj，再對該obj繼續執行admission chain中的Admit與Validate。最終呼叫的還是update方法，因此衝突檢測的機制與上述Update方法完全一致。
相比Update，Patch的主要優勢在於客戶端不必提供全量的obj物件資訊。客戶端只需以patch的方式提交要修改的欄位資訊，伺服器端會將該patch資料應用到最新獲取的obj中。省略了Client端獲取、修改再提交全量obj的步驟，降低了資料被修改的風險，更大大減小了衝突概率。由於Patch方法在傳輸效率及衝突概率上都佔有絕對優勢，目前Kubernetes中幾乎所有更新操作都採用了Patch方法，我們在編寫程式碼時也應該注意使用Patch方法。
附：
ResourceVersion欄位在Kubernetes中除了用在上述併發控制機制外，還用在Kubernetes的list-watch機制中。Client端的list-watch分為兩個步驟，先list取回所有物件，再以增量的方式watch後續物件。Client端在list取回所有物件後，將會把最新物件的ResourceVersion作為下一步watch操作的起點引數，也即Kube-Apiserver以收到的ResourceVersion為起始點返回後續資料，保證了list-watch中資料的連續性與完整性。

Kubernetes 併發控制與資料一致性的實現原理
2019-03-01
資料庫系列：InnoDB下實現高併發控制
2023-11-07
資料庫
值得收藏，揭秘 MySQL 多版本併發控制實現原理
2022-12-01
MySql
一致性Hash的原理與實現
2022-04-10
Oracle的資料併發與一致性詳解（上）
2021-09-09
Oracle
【資料庫】併發控制
2018-06-01
資料庫
圖解kubernetes控制器StatefulSet核心實現原理
2020-03-29
圖解
圖解 kubernetes 控制器 StatefulSet 核心實現原理
2020-03-29
圖解
Nginx 實現高併發的原理分析
2022-09-20
Nginx
併發Lock之ReentrantLock實現原理
2019-03-03
ReentrantLock
java併發之SynchronousQueue實現原理
2018-08-23
Java
併發——深入分析ThreadLocal的實現原理
2020-04-16
thread
《java併發程式設計的藝術》併發底層實現原理
2018-07-17
Java程式設計
mysql併發控制原理知識點
2021-01-14
MySql
Kubernetes List-Watch 機制原理與實現 - chunked
2021-10-19
MySQL的多版本併發控制MVCC的實現惡琿
2022-03-01
MySqlMVC
Nginx實現高速併發處理的原理詳解
2021-01-13
Nginx
併發場景下資料寫入功能的實現
2022-05-26
使用併發工具實現 RPC 呼叫流量控制
2018-05-19
RPC
【死磕Java併發】-----深入分析synchronized的實現原理
2021-12-13
Javasynchronized
【死磕Java併發】—–深入分析volatile的實現原理
2021-12-14
Java
pgsql事務與併發控制
2018-11-19
SQL
oracle併發與多版本控制
2024-06-17
Oracle
Java ConcurrentHashMap 高併發安全實現原理解析
2020-09-21
JavaHashMap
Java併發指南9：AQS共享模式與併發工具類的實現
2019-11-10
JavaAQS模式
MySQL隔離級別解析：資料一致性與高併發之間的平衡術！
2023-12-06
MySql
服務註冊與發現的原理和實現
2021-09-12
淺析 Kubernetes 控制器的工作原理
2019-03-31
堆的原理與實現
2021-09-21
304441事務管理與併發控制
2019-06-22
併發容器之ArrayBlockingQueue和LinkedBlockingQueue實現原理詳解
2018-05-06
BloC
如何實現資料庫讀一致性
2024-01-17
資料庫
高併發下的資料一致性保障（圖文全面總結）
2024-04-02
PHP 併發扣款，保證資料一致性（悲觀鎖）
2020-03-26
PHP
資料庫事務和MVCC多版本併發控制
2019-02-03
資料庫MVC
併發控制
2024-03-22
MySQL實戰：解密樂觀併發控制，確保資料操作不衝突
2024-03-13
MySql解密
一文讀懂圖資料庫 Nebula Graph 訪問控制實現原理
2020-06-03
資料庫

Kubernetes併發控制與資料一致性的實現原理

相關文章