本文主要梳理刪除Pod時,Pod的執行流程
kube-apiserver的任務
我們通常使用kubectl命令刪除Pod,或者通過http協議直接呼叫apiserver暴露的介面去刪除Pod。所以,刪除Pod的起源肯定在apiserver這兒。
在之前分析kube-apiserver部分有分析到,kube-apiserver的http處理架構使用的是go-restful。其中,對於刪除,呼叫的自然是DELETE介面。方法如下(位於kubernetes/staging/src/k8s.io/apiserver/pkg/endpoints/install.go下的registerResourceHandlers方法
)

restfulDeleteResource

restfulDeleteResource
繼續封裝handler,呼叫了DeleteResource
方法。DeleteResource
方法很長,但最終呼叫的還是DELETE
方法,如下

DELETE
方法位於staging/src/k8s.io/apiserver/pkg/registry/generic/registry/store.go
下。在DELETE
方法中,最主要的是updateForGracefulDeletionAndFinalizers
方法,該方法的主要作用就是用來改變Pod的一些內部資訊,其實就是改變Pod的兩個欄位:DeletionTimestamp以及DeletionGracePeriodSeconds,呼叫的是BeforeDelete
方法


kubelet的任務
通過之前分析過kubelet的程式碼得知,kubelet一直在通過listwatch監聽apiserver的變化


start方法如下:


深層分析
我們知道,Pod的刪除如果不去強制刪除,則其實是一個優雅的刪除,也就是一個graceful的刪除。預設情況下,這個優雅的時間是30s,也就是grace-period的時間。在kube-apiserver的任務中,通過updateForGracefulDeletionAndFinalizers
方法為Pod設定了DeletionTimestamp和DeletionGracePeriodSeconds兩個欄位,此時Pod定義為graceful的狀態。回到程式碼處,呼叫完updateForGracefulDeletionAndFinalizers
方法後,下面有一個判斷的語句

沒錯,實際情況的確是這樣,每次刪除的時候,apiserver的處理邏輯到此就中斷了。接下來就要重新認識kubelet了。
Kubelet在呼叫apiserver的刪除介面的時候,提前會有一個判斷,呼叫鏈為
canBeDeleted-->PodResourcesAreReclaimed
。在PodResourcesAreReclaimed
方法內,主要的任務就是判斷Pod內的資源是否已經完全關閉和清理,包括containers
、processes
、volumes
以及cgroup sandbox
資源。

canBeDeleted
方法返回true,kubelet呼叫apiserver的delete介面再次刪除Pod。不過,與優雅刪除不同的是,這次呼叫,多了一個deleteOptions
欄位


總結
優雅刪除Pod時:
1、apiserver handler執行了兩次,第一次主要是修改Pod資訊,設定DeletionTimestamp和DeletionGracePeriodSeconds資訊,第二次去資料庫etcd刪除Pod資訊;
2、kubelet通過檢測到Pod內的資源已經完全釋放之後,觸發了第二次刪除事件,且是強制刪除Pod;
3、kubelet的DELETE操作其實監聽到的是Pod的更新事件,Pod刪除之後,執行的是REMOVE操作;
4、處理流程為:客戶端請求刪除Pod-->apiserver更新Pod資訊-->kubelet優雅釋放Pod資源-->kubelet請求刪除Pod-->apiserver刪除etcd中Pod資訊-->kubelet完成最終Pod的資源清理
。