dubbo 協議的 K8s pod 存活探針配置

潘大慶發表於2021-12-06

協議K8S

背景

某專案採用微服務架構，dubbo 框架，K8s 方式部署。

其中 HTTP 協議由閘道器應用統一處理，大部分應用僅提供 dubbo 協議。

目標

應用某個例項(pod)狀態異常時，嘗試自動重啟恢復。

解決

K8s 提供了3種存活探針(livenessProbe)，以實現 pod 狀態異常時重啟。

HTTPGetAction 首先排除了，因為上文我們說了，HTTP 訪問由閘道器統一處理，應用本身沒有 HTTP 協議。

然後是 TCPSocketAction，該探針僅能確認 dubbo 埠是否為監聽狀態，無法實現應用狀態的的撥測。

最後是 ExecAction，該探針執行命令返回0判斷 pod 存活，非0則根據pod定義的重啟策略進行後續操作。

dubbo 框架從2.0.5 版本開始，支援通過 telnet 命令互動，我們可以使用 status 命令獲取應用本身即應用依賴的底層服務(註冊中心、資料庫等)的撥測結果。

我們只需要編寫一個簡單的 shell 指令碼，抓取 dubbo 的 status 命令結果，如果是 OK 或 WARN 則返回0，否則返回1，就可以使用 ExecAction 了。

#!/bin/bash

outputfile=/tmp/dubbo_health_check
dubbo_port=$1

(echo 'status -l'; sleep 1) | nc -w 3 127.0.0.1 ${dubbo_port} -o ${outputfile} > /dev/null

result=`grep summary ${outputfile}| awk '{print $4}' `

if [[ "${result}" == "OK" ]] || [[ "${result}" == "WARN" ]]
then
    exit 0
else
    exit 1
fi

pod yaml檔案中關於存活探針的部分如下所示

#(略)
        livenessProbe:
          exec:
            command:
            - /bin/bash
            - /opt/dubbo_health_check.sh
            - '20800'
          initialDelaySeconds: 600
          timeoutSeconds: 5
          periodSeconds: 60
          failureThreshold: 3
#（略）

注意點

按 dubbo 官方文件的說法，telnet 中執行 status 返回的結果應該和 status -l 中 summary 的結果一致，實際測試並非如此，建議使用 status -l
頻繁執行 status -l 可能會有效能上的隱患，參考 https://www.jianshu.com/p/f6376c148f2c

總結

dubbo 官方提供了與 pod 探針對齊的方法(參見下文)，但是在我們這個應用中因為閘道器和其他一些原因限制了 HTTP 協議，因此使用了上文這種替代方案。

每個專案/團隊都會有一些自己的特殊需求，本文只是提供一種思路，如果有更好的解決方案，歡迎在評論區提出討論(●ˇ∀ˇ●)

參考

容器探針
https://kubernetes.io/zh/docs/concepts/workloads/pods/pod-lifecycle/#container-probes

Dubbo 與 pod 探針對齊
https://dubbo.apache.org/zh/docs/references/lifecycle/brief/

Dubbo Telnet 命令
https://dubbo.apache.org/zh/docs/v3.0/references/telnet/#status

Pod存活性探測
2019-09-26
K8S使用就緒和存活探針配置健康檢查
2021-09-09
K8S
Kubernetes 存活、就緒探針
2020-09-09
Kubernetes學習筆記（二）：部署託管的Pod -- 存活探針、ReplicationController、ReplicaSet、DaemonSet、Job、CronJob
2020-05-21
筆記Controller
K8S配置存活、就緒和啟動探測器
2022-02-09
K8S
協議：SpringCloud VS Dubbo
2018-07-09
協議SpringGCCloud
聊聊dubbo協議2
2022-01-19
協議
dubbo註冊協議（三）
2018-10-14
協議
Dubbo-通訊協議
2020-11-28
協議
pod 的高階實現汙點親密性探針的實現
2024-10-17
Dubbo 支援哪些序列化協議？
2019-04-22
協議
K8s 裡多容器 Pod 的健康檢查探針工作機制分析
2023-12-12
K8S
五分鐘 k8s 實戰-應用探針
2023-11-27
K8S
kubernetes中的探針
2024-06-12
滲透&&探測 (之DNS協議)
2018-10-09
DNS協議
星海支援 TARS 和 Dubbo 協議啦~
2020-08-21
協議
Dubbo原始碼學習--Rmi協議（八）
2018-04-14
原始碼協議
Dubbo 3.0 前瞻之：常用協議對比及 RPC 協議新形態探索
2020-10-12
協議RPC
PoD-Tiny——實現零信任交易的最簡協議
2019-07-24
協議
k8s pod
2021-01-02
K8S
實驗四————RIP協議的配置
2018-05-27
協議
DHCP (Dynamic Host Configuration Protocol )協議的探討與分析
2021-02-19
Protocol協議
Pod就緒性探測
2019-09-29
IS-IS協議原理與配置
2020-10-18
協議
Dubbo的配置
2018-03-16
dubbo原始碼解析（三十）遠端呼叫——rest協議
2019-01-29
原始碼REST協議
Docker 與 K8S學習筆記（十九）—— Pod的配置管理
2022-01-22
DockerK8S筆記
Kubernetes 探針詳解！
2021-01-31
實驗七————EIGRP協議配置
2018-05-28
協議
實驗六——————OSPF協議配置
2018-05-28
協議
WebSphere配置https協議訪問
2020-10-21
WebHTTP協議
nginx配置https協議訪問
2020-10-21
NginxHTTP協議
nginx配置支援websocket協議wss
2024-07-03
NginxWeb協議
rdp(遠端桌面協議)配置
2023-02-02
協議
dubbo原始碼解析（三十一）遠端呼叫——rmi協議
2019-01-19
原始碼協議
dubbo原始碼解析（三十二）遠端呼叫——thrift協議
2019-01-19
原始碼協議
Ruby 探針的基本實現原理
2019-02-16
深入掌握K8S Pod
2020-07-20
K8S

dubbo 協議的 K8s pod 存活探針配置

背景

目標

解決

注意點

總結

參考

相關文章