在K8S中，Worker節點當機，Pods驅逐流程有哪些？

黄嘉波發表於2024-10-24

原文網址 : https://www.cnblogs.com/huangjiabobk/p/18499383

K8S

在Kubernetes（K8S）中，當Worker節點當機時，Kubernetes有一套處理流程來確保Pods的可用性和服務的連續性。以下是詳細的處理流程：

節點狀態檢測：Kubernetes透過kubelet元件定期向API伺服器報告節點狀態。如果節點當機，kubelet將無法傳送心跳，節點狀態將變為NotReady。
節點狀態更新：Kubernetes的控制器管理器（kube-controller-manager）會定期檢查節點狀態。如果節點在一定時間內（由node-monitor-grace-period引數控制，預設40秒）沒有狀態更新，控制器管理器將把節點狀態標記為ConditionUnknown。
Pod驅逐：一旦節點狀態被標記為ConditionUnknown，並且這種狀態持續了一定的時間（由unregistered-node-recovery-timeout引數控制，預設5分鐘），節點控制器會開始驅逐該節點上的Pods。這一過程遵循Pod的Disruption Budget，確保服務的高可用性。
服務恢復：在節點當機期間，如果服務部署了副本控制器（如Deployment），它會嘗試在其他健康的節點上重新建立Pods，以維持服務的可用性。
自動恢復：Kubernetes具有自我修復的能力，能夠自動替換失敗的Pod或者調整資源分配，使得整個系統具備極高的可靠性。
手動干預：如果自動恢復無法解決問題，管理員可以手動介入，使用kubectl delete pod <Pod名稱> --grace-period=0 --force命令強制刪除Pod，並將其重新排程到其他節點上。
節點替換：如果當機的節點無法修復，可以考慮替換節點。透過新增新節點並將工作負載遷移到新節點上來實現。確儲存儲卷和網路配置得到正確的遷移。
監控和告警：在部署Kubernetes叢集時，設定監控系統，以便及時檢測節點的當機情況。使用工具如Prometheus、Grafana等，配置警報規則，當節點當機時及時通知相關人員。
定期維護和更新：避免節點當機的最佳方法是進行定期的維護和更新。確保Kubernetes叢集和節點上的作業系統、Docker等元件都是最新版本，以獲得最新的安全性和穩定性修復。
Pod Disruption Budget (PDB)：PDB可以防止在緊急情況下服務不可用的問題，但它不會幫助Pod在其他可用節點上重建。理想情況下，PDB應該與kubectl-safe-drain專案一起使用，以確保Pods能夠安全地遷移到其他節點。

綜上所述，透過這些機制，Kubernetes能夠在Worker節點當機時，儘可能地保證服務的連續性和資料的完整性。

在K8S中，Worker節點加入叢集的全過程?
2024-10-15
K8S
如何優雅的維護 K8S Worker 節點
2020-04-30
K8S
在K8S中，CSI模型有哪些?
2024-10-15
K8S模型
在K8S中，Service的型別有哪些？
2024-08-08
K8S型別
一次詳細的RAC 節點例項驅逐分析文件
2021-05-06
在K8S中，Deployment 升級過程有哪些?
2024-10-09
K8S
在K8S中，主節點的作用是什麼？
2024-10-26
K8S
kubernetes驅逐機制總結
2023-11-05
kubernetes-pod驅逐機制
2020-07-05
獲取當前元素在兄弟元素節點中的索引
2019-01-15
索引
DOM節點的種類有哪些？
2024-12-06
在K8S中，Scheduler 作用及實現原理有哪些?
2024-10-11
K8S
在K8S中，Pod常見排程方式有哪些?
2024-10-09
K8S
在K8S中，資料持久化的方式有哪些?
2024-10-14
K8S持久化
什麼是海外節點伺服器?海外節點有哪些?
2023-02-09
伺服器
DRM特性引起的RAC節點當機
2023-02-08
k8s系列--node(k8s節點介紹，新增節點，移除節點）
2022-05-18
K8S
在K8S中，PV的生命週期狀態有哪些？
2024-08-08
K8S
在K8S中，DaemonSet型別的資源特性有哪些？
2024-08-08
K8S型別
在K8S中，Pod 如何實現對節點的資源控制?
2024-10-15
K8S
在K8S中，PV 生命週期內的有哪些階段?
2024-10-14
K8S
在K8S中，所支援的儲存供應模式有哪些?
2024-10-15
K8S模式
js獲取dom節點的方法有哪些
2021-09-11
JS
在K8S中，體系結構有哪些不同的組成部分?
2024-10-26
K8S
伺服器當機常見原因有哪些
2019-12-12
伺服器
伺服器經常當機有哪些原因
2023-02-23
伺服器
Kubernetes Pod驅逐策略
2020-11-02
k8s檢視指定pods裡面的容器
2024-05-25
K8S
Postgrsql 從節點當機，主節點執行DML語句出現等待情況
2020-11-26
SQL
在K8S中，ingress 有何作用？
2024-10-11
K8S
【故障公告】Kubernetes 叢集節點當機造成部落格站點故障
2023-03-03
通過設定DIAGWAIT值使得RAC中節點被驅逐的時候能夠記錄更多的診斷日誌
2019-01-05
AI
在Linux中，當使用者在瀏覽器當中輸入⼀個網站，計算機對dns解釋經過那些流程？
2024-07-12
Linux瀏覽器網站計算機DNS
在K8S中，映象下載策略有哪些?
2024-10-11
K8S
Java中在二叉搜尋樹中查詢節點的父節點
2024-03-11
Java
Service Worker 在 PWA 中的應用
2023-01-23
rancher新增k8s節點時顯示節點已新增
2024-05-21
K8S
oracle 11.2.0.4 rac節點異常當機之ORA-07445
2018-05-22
Oracle

在K8S中，Worker節點當機，Pods驅逐流程有哪些？

相關文章