Kubernetes Pod驅逐策略

空殼先生發表於2020-11-02

Kubelet 能夠主動監測和防止計算資源的全面短缺。在資源短缺的情況下，kubelet 可以主動地結束一個或多個 Pod 以回收短缺的資源。當 kubelet 結束一個 Pod 時，它將終止 Pod 中的所有容器，而 Pod 的 Phase 將變為 Failed。如果被驅逐的 Pod 由 Deployment 管理，這個 Deployment 會建立另一個 Pod 給 Kubernetes 來排程。配置資源不足時的處理方式:

驅逐訊號

kubelet 支援按照以下訊號觸發驅逐決定。

驅逐閾值

kubelet支援指定驅逐閾值，用於觸發 kubelet 回收資源。每個閾值形式如下：

[eviction-signal][operator][quantity]

合法的 eviction-signal 標誌如上圖所示。
operator 是所需的關係運算子，例如 <,>。
quantity 是驅逐閾值值標誌，例如 1Gi。合法的標誌必須匹配 Kubernetes 使用的數量表示。 驅逐閾值也可以使用 % 標記表示百分比。

舉例說明，如果一個節點有 10Gi 記憶體，希望在可用記憶體下降到 1Gi 以下時引起驅逐操作，則驅逐閾值可以使用下面任意一種方式指定（但不是兩者同時）。

memory.available<10%
memory.available<1Gi

軟碟機逐閾值

軟碟機逐閾值使用一對由驅逐閾值和管理員必須指定的寬限期組成的配置對。在超過寬限期前，kubelet不會採取任何動作回收和驅逐訊號關聯的資源。如果沒有提供寬限期，kubelet啟動時將報錯。

此外，如果達到了軟碟機逐閾值，操作員可以指定從節點驅逐 pod 時，在寬限期內允許結束的 pod 的最大數量。如果指定了 pod.Spec.TerminationGracePeriodSeconds 值， kubelet 將使用它和寬限期二者中較小的一個。如果沒有指定，kubelet將立即終止 pod，而不會優雅結束它們。

軟碟機逐閾值的配置支援下列標記：

硬驅逐閾值

硬驅逐閾值沒有寬限期，一旦察覺，kubelet將立即採取行動回收關聯的短缺資源。如果滿足硬驅逐閾值，kubelet將立即結束 pod 而不是優雅終止。

硬驅逐閾值的配置支援下列標記： eviction-hard 描述了驅逐閾值的集合（例如 memory.available<1Gi），如果滿足條件將觸發 pod 驅逐。

驅逐監控時間間隔

kubelet 根據其配置的整理時間間隔計算驅逐閾值。 housekeeping-interval 是容器管理時間間隔。

驅逐終端使用者的 pod

如果 kubelet 在節點上無法回收足夠的資源，kubelet將開始驅逐 pod。

kubelet 首先根據他們對短缺資源的使用是否超過請求來排除 pod 的驅逐行為，然後通過優先順序，然後通過相對於 pod 的排程請求消耗急需的計算資源。

kubelet 按以下順序對要驅逐的 pod 排名:

BestEffort 或 Burstable，其對短缺資源的使用超過了其請求，此類 pod 按優先順序排序，然後使用高於請求。
Guaranteed pod 和 Burstable pod，其使用率低於請求，最後被驅逐。 Guaranteed Pod 只有為所有的容器指定了要求和限制並且它們相等時才能得到保證。由於另一個 Pod 的資源消耗，這些 Pod 保證永遠不會被驅逐。如果系統守護程式（例如 kubelet、docker、和 journald）消耗的資源多於通過 system-reserved 或 kube-reserved 分配保留的資源，並且該節點只有 Guaranteed 或 Burstable Pod 使用少於剩餘的請求，然後節點必須選擇驅逐這樣的 Pod 以保持節點的穩定性並限制意外消耗對其他 pod 的影響。在這種情況下，它將首先驅逐優先順序最低的 pod。

必要時，kubelet會在遇到 DiskPressure 時逐個驅逐 Pod 來回收磁碟空間。如果 kubelet 響應 inode 短缺，它會首先驅逐服務質量最低的 Pod 來回收 inodes。如果 kubelet 響應缺少可用磁碟，它會將 Pod 排在服務質量範圍內，該服務會消耗大量的磁碟並首先結束這些磁碟。

kubernetes-pod驅逐機制
2020-07-05
Kubernetes-22：kubelet 驅逐策略詳解
2021-07-16
kubernetes驅逐機制總結
2023-11-05
kubernetes高階之pod安全策略
2019-06-24
D8 kubernetes 之pod映象拉取策略
2024-08-23
一次意想不到的pod記憶體驅逐問題
2024-04-30
記憶體
Redis快取刪除驅逐策略的工作方式 - codemancers
2021-05-26
Redis快取
傲視Kubernetes(三)：Kubernetes中的Pod
2020-12-13
Kubernetes之Pod排程
2018-12-14
kubernetes之pod中斷
2019-06-06
Kubernetes：Pod總結(二)
2022-02-10
Kubernetes Pod 全面知識
2021-11-29
Kubernetes部署單元-Pod
2022-04-11
阿里面試讓聊一聊Redis 的記憶體淘汰（驅逐）策略
2024-09-23
阿里面試Redis記憶體
【虹科乾貨】Redis 開發者需要了解的快取驅逐策略
2023-10-11
Redis快取
Kubernetes之Pod工作負載
2024-03-23
負載
Kubernetes Pod OOM 排查日記
2020-08-07
OOM
Kubernetes的Pod進階（十一）
2022-01-27
Kubernetes：Pod 升級、回滾
2021-12-03
Kubernetes:28---pod託管（Job：任務型pod）
2020-12-28
Pod安全策略：PodSecurityPolicy(PSP)
2024-06-04
kubernetes如何訪問pod服務
2019-06-23
Kubernetes-POD的健康檢查
2024-08-10
詳解Kubernetes Pod優雅退出
2024-06-20
技術分享 | kubernetes pod 簡介
2022-06-23
kubernetes雜談之(二)Pod初談
2020-10-14
kubernetes實踐之二十二：Pod
2018-04-24
Kubernetes POD與NodePort服務釋出
2021-01-03
【一】kubernetes學習筆記-Pod概念
2021-05-13
筆記
kubernetes中將hostpath卷安裝到POD
2019-03-07
Kubernetes中Pod間共享記憶體方案
2019-02-26
記憶體
kubernetes實踐之三十八：Pod排程
2018-05-13
Kubernetes筆記（五）：瞭解Pod（容器組）
2020-09-11
筆記
Kubernetes原始碼分析之Pod的刪除
2019-05-12
原始碼
重定向Kubernetes pod中的tcpdump輸出
2023-02-11
TCP
python kubernetes 獲取 pod 的 cpu 佔用率
2022-12-20
Python
kubernetes 載入pod出現ErrImageNeverPull錯誤
2022-11-01
使用describe命令進行Kubernetes pod錯誤排查
2018-11-20