rancher 的 deployment does not have minimum availability 問題

地球沒有花發表於2018-12-30

原文網址 : https://blog.csdn.net/getyouwant/article/details/85346271

結論，沒找到原因，但有解決方案。

背景：

公司要進行服務容器化，經過一番考察決定使用rancher(2.0)進行容器化管理。

存疑點：在進行docker打包的時候，如果是大版本，我會打包一個新版本；如果是修復一個小bug的話，我會在已有版本上進行重複發版。比如之前釋出了一個版本1.8，如果後來及時發現小bug並修正的話，我會繼續在1.8上修復，然後upgrade pods：

docker build -t xxx:1.8 .

然後有一天增加了一臺伺服器，在upgrade pods之後發現pods並沒有按照batch size進行新建pod和舊pod銷燬，僅僅新建了batch size個pod之後就停滯了，舊的pod仍然是舊的replicaset版本。並且有一個紅色的提示：

“ReplicaSet "vplay-sock-678f59d96b" has timed out progressing.; Deployment does not have minimum availability.”

這是什麼意思？這是第一個問題。

第二個問題是，如果正常的話，所有的pod應該是執行的都是同一個replicaset版本，但是我現在是多個replicaset版本共存的，而且我想通過rancher刪掉舊的pod是刪不掉的，即使你刪掉它，它依然會自動重新建立一個被刪掉的舊版本。

對於第二個問題，我不知道為何會出現這樣的問題，所以我在上面提了一個“存疑點”，我懷疑所有的問題都是這個“存疑點”引起的。但我是通過如下的方法進行刪除的：

[root@rc02 ~]# kubectl get rs -n uc-hd
NAME                    DESIRED   CURRENT   READY   AGE
vplay-sock-5446b85b85   0         0         0       18h
vplay-sock-5b7d4c6f87   0         0         0       24d
vplay-sock-5b958c5cf7   0         0         0       2d
vplay-sock-5dcdb94b9b   0         0         0       17h
vplay-sock-64bc86bd68   0         0         0       18h
vplay-sock-64dbd48dc5   0         0         0       22d
vplay-sock-65bf7f85fb   0         0         0       9d
vplay-sock-66598896b9   0         0         0       17h
vplay-sock-66f6dd9bcb   0         0         0       18h
vplay-sock-694f79c576   0         0         0       18h
vplay-sock-69b4f8b5f    0         0         0       9d
vplay-sock-69c9bb9947   0         0         0       11d
vplay-sock-6f4d6df54    0         0         0       14d
vplay-sock-6f6d5f94     0         0         0       17h
vplay-sock-796dbc59cf   0         0         0       9d
vplay-sock-7d6df65f6b   30        30        15      15h
vplay-sock-856b56bb46   0         0         0       29d
vplay-sock-d8cd77597    0         0         0       29d
[root@rc02 ~]# kubectl get rs -n uc-hd|wc -l
19
[root@rc02 ~]# kubectl delete rs -n uc-hd vplay-sock-5b7d4c6f87
[root@rc02 ~]# kubectl get rs -n uc-hd|wc -l
18

在列出來的來的replicaset名稱裡，你找到要刪掉的舊版本，你可以通過AGE列來進行判斷哪個是舊版本。

刪除之後就不會再產生新的老版本了。這個問題算是解決了，但是不知道因為什麼。

關於問題一“Deployment does not have minimum availability”，看意思是“沒有滿足最小的部署要求”，那我們是哪裡沒滿足呢？查了關於quota配額的配置，我們都沒給pod設定配額，都是不限的。每次在我upgrade的時候，都會先提示“Deployment does not have minimum availability”，然後過幾分鐘，前面多了一句“ReplicaSet "xxxx" has timed out progressing.”，一起翻譯過來就是“沒有滿足最小的部署要求，導致副本集xxx處理超時”，所以我看到的是先產生batch size個pods，然後變成紅色的loading狀，最後變成綠色就部署ok了。但是！按理說，正常的情況是比如之前我又20個pods，那麼當我upgrade之後，應該會根據設定的rolling策略（我的策略是先建立batch size個新的pod，然後等ok了再關掉相應數量的久的pods）進行升級替換的，但並沒有，只是進行了一個批次就結束了。這個問題是最後也沒有找到原因，我懷疑還是我的存疑點導致的。

問題找不到原因，但也得解決啊，畢竟要過元旦放假了，不能每天守著，遇到問題就讓slb下線伺服器（這個可以作為一個），這不行。那我只能是重新再部署一個新的服務了，於是直接克隆了一個。

克隆的時候你要考慮的事情有幾點來保證服務：

1、之前我的服務是通過unix domain socket進行ipc的，那這個時候可能就要給克隆出來的部署一個新的sock路徑

2、修改nginx的upstream的共享目錄，指向克隆出來的那個新的sock路徑

3、其他的共享目錄路徑仔細排查

最後記錄一些links：

ref：

1、10個k8s部署常見的失敗情景：https://kukulinski.com/10-most-common-reasons-kubernetes-deployments-fail-part-2/

10. Does luck have anything to do with success?
2018-03-24
composer突然出現 minimum-stabilty問題
2020-12-26
Laravel Class env does not exist 問題排查
2021-10-21
Laravel
ubuntu apt update 提示 The repository ‘http://xxx Release‘ does not have a Release file
2024-07-04
UbuntuAPTHTTP
Your host does not meet minimum requirements to run VMware workstation with hyper-v or device/creden
2020-10-11
UIREMdev
屬性font-family:Font property font-family does not have generic default
2019-03-14
ValueError: Length of values (141) does not match length of index (4278)問題的解決
2024-03-06
ErrorIndex
Hadoop的mapreduce出現問題，報錯The auxService:mapreduce_shuffle does not exist
2020-12-24
HadoopUX
git中出現”the requested upstream branch ‘origin/master‘ does not exist“問題的解決
2020-12-17
GitAST
解決Sentinel module java.base does not “opens java.lang“ 問題
2022-03-15
Java
CodeForces - 976A:Minimum Binary Number(水題)
2020-12-12
LightDB Canopy 常見報錯問題分析（二）DETAIL: Distributed relations cannot have
2023-03-02
AI
Rancher 系列文章-Rancher 升級
2023-03-30
Overview of Availability in a CDB
2020-03-16
ViewAI
Load balancer does not contain an instance for the service service-B [503] during [POST] 問題解決
2024-07-18
AI
rancher
2018-03-30
Rancher 2022 關鍵主題與新年展望
2023-01-20
[每日一題]452. Minimum Number of Arrows to Burst Balloons
2019-03-04
每日一題
【Kubernetes】kubectl create/expose對deployment名字校驗前後不一致問題
2021-09-03
B - Minimum Sum
2024-08-11
Range Minimum Sum
2024-08-11
如何使用 Rancher Desktop 訪問 Traefik Proxy 儀表板
2022-03-01
Rancher 系列文章-Rancher 對接 Active Directory 實戰
2023-03-29
Performance and High-Availability Options
2020-03-24
ORMAI
High Availability (HA) in SQL Server
2024-10-04
AISQLServer
docker rancher搭建
2018-09-22
Docker
OpenStack 與 Rancher
2019-03-14
kubernetes物件之deployment
2019-06-07
物件
Kubernetes：瞭解 Deployment
2021-11-30
題解：AT_abc368_d[ABC368D] Minimum Steiner Tree
2024-12-06
rancher的一個神器Receiver hooks
2020-04-07
Hook
如何修改 Rancher Server 的 IP 地址
2022-04-20
Server
Availability Group On Linux 搭建後記
2018-08-29
AILinux
64. Minimum Path Sum
2018-05-03
HDU 1385 Minimum Transport Cost
2020-11-20
rancher安裝Openvpn
2020-04-03
Rancher RFO 正式 GA
2022-12-26
does not name a type 的可能性
2018-12-07

rancher 的 deployment does not have minimum availability 問題

相關文章