【故障公告】沒有龍捲風，k8s叢集翻船3次，投用雙叢集恢復

部落格園團隊發表於2022-03-16

原文網址 : https://www.cnblogs.com/cmt/p/16012744.html

今天沒有龍捲風（異常的高併發請求），故障卻依然出現，問題非常奇怪。

某種異常情況會造成短時間內， k8s 叢集中大量 pod （超過60%）因健康檢查失敗而處於 CrashLoopBackOff 狀態，健康檢查失敗的錯誤是 connection refused

Liveness probe failed: Get "http://192.168.238.204:3501/v1.0/healthz": dial tcp 192.168.238.204:3501: connect: connection refused
Readiness probe failed: Get "http://192.168.238.204:3501/v1.0/healthz": dial tcp 192.168.238.204:3501: connect: connection refused

今天 k8s 叢集因此翻船3次，分別是

早上 10:00-10:15
中午 11:48-12:07
下午 14:20-14:35

第2次翻船後我們非常緊張，如果中午找不到有效的避免翻船的緊急措施，下午不知要翻多少次，而當前我們對這個從天而降的突發問題毫無頭緒。

中午我們想到了一招，既然1艘船扛不住，那我們用2艘，2艘同時翻的可能性小很多，而且翻掉的1艘過段時間自己也能恢復，即使2艘也扛不住，那故障的影響也會減小。

就在我們剛部署好新的叢集，14:20 左右開始又翻船了，加入新船後恢復了正常。

從2艘船並駕齊驅的情況看，我們相信可以扛住。

非常抱歉！這段時間的頻繁故障給大家帶來了很大的麻煩，請大家諒解！

Kubernetes 叢集相關資訊：

使用阿里雲伺服器自己搭建
k8s 版本是 1.23.3
網路用的是 calico

redis cluster 叢集故障恢復操作思路
2022-04-07
Redis
記一次Kafka叢集的故障恢復
2018-11-19
Kafka
K8s 叢集高可用 master 節點故障如何恢復? 原創
2024-03-17
K8SAST
【故障公告】Kubernetes 叢集節點當機造成部落格站點故障
2023-03-03
Elasticsearch叢集的備份與恢復
2020-08-19
Elasticsearch
WebSphere 叢集建立及故障排除
2020-04-07
Web
用 edgeadm 一鍵安裝邊緣 K8s 叢集和原生 K8s 叢集
2021-05-18
K8S
Zookeeper叢集 + Kafka叢集
2024-07-18
Kafka
RocketMQ雙主雙從叢集搭建
2020-09-24
MQ
搭建zookeeper叢集（偽叢集）
2020-11-22
KingbaseES 叢集運維典型案例 03 --“雙主” sys_rewind恢復機制
2024-07-26
運維
用Docker搭建RabbitMq的普通叢集和映象叢集
2021-11-17
DockerMQ
詳解叢集級備份恢復：物理細粒度備份恢復
2023-05-12
【故障公告】突然猛增的巨量請求沖垮一共92核CPU的k8s叢集
2021-11-16
K8S
RabbitMQ 雙機映象叢集模式
2024-12-03
MQ模式
刪除k8s叢集
2024-09-19
K8S
k8s 叢集升級
2024-06-06
K8S
python管理k8s叢集
2024-05-25
PythonK8S
Ansible部署K8s叢集
2022-02-28
K8S
多k8s叢集管理
2020-12-01
K8S
kubeadm部署K8S叢集
2021-01-18
K8S
k8s之叢集管理
2021-01-31
K8S
zookeeper叢集及kafka叢集搭建
2021-06-28
Kafka
【故障公告】k8s叢集2臺32核64G節點伺服器被釋放造成全站故障
2024-11-07
K8S伺服器
【故障公告】龍捲風繼續襲擊，伺服器們頑強抵抗
2022-03-14
伺服器
災備建設中，跨主機叢集恢復技術應用
2023-11-22
修復一個kubernetes叢集
2024-10-22
Oracle 12c叢集啟動故障
2018-04-14
Oracle
【Redis】Redis Cluster-叢集故障轉移
2022-06-19
Redis
基於Ubuntu部署企業級kubernetes叢集---k8s叢集容部署
2024-08-29
UbuntuK8S
教你用multipass快速搭建k8s叢集
2021-09-04
K8S
linux下搭建ZooKeeper叢集（偽叢集）
2019-03-27
Linux
redis偽叢集配置Cluster叢集模式
2019-04-09
Redis模式
Redis系列：搭建Redis叢集(叢集模式)
2020-09-23
Redis模式
教你如何搭建K8S叢集。
2024-02-12
K8S
k8s——搭建叢集環境
2024-05-06
K8S
k8s叢集搭建--kubeadm方式
2024-05-08
K8S
Kubeadm方式搭建K8S叢集
2023-09-22
K8S

【故障公告】沒有龍捲風，k8s叢集翻船3次，投用雙叢集恢復

相關文章