VCS叢集狀態為 STALE_ADMIN_WAIT的解決
今天發現有一VCS叢集狀態變為 STALE_ADMIN_WAIT,解決方法如下:
1.首先檢視兩臺機器的當前狀態
cp-etl01:/etc/VRTSvcs/conf/config # hastatus -sum
-- SYSTEM STATE
-- System State Frozen
A cp-etl01 STALE_ADMIN_WAIT 0
A cp-etl02 STALE_ADMIN_WAIT 0
2.在兩臺機器上檢視當前的程式
cp-etl01:/etc/VRTSvcs/conf/config # ps -ef |grep had 檢視HA程式
root 7243 1 0 2009 ? 00:00:00 /opt/VRTSvcs/bin/hashadow
root 4683 1 0 Aug24 ? 00:00:02 /opt/VRTSvcs/bin/had -restart
root 19294 17911 0 11:21 pts/7 00:00:00 grep had
cp-etl02:~ # ps -ef | grep had
root 7278 1 0 2009 ? 00:00:00 /opt/VRTSvcs/bin/hashadow
root 23411 1 0 Aug24 ? 00:00:01 /opt/VRTSvcs/bin/had -restart
root 7012 6981 0 11:22 pts/0 00:00:00 grep had
可以看到兩臺機器的程式都正常啟動,但是had程式不是正常狀態,需要restart
3.看看能不能識別對方未尾是01
cp-etl01:/etc/VRTSvcs/conf/config # gabconfig –a
GAB Port Memberships
===============================================================
Port a gen 1bc510 membership 01
Port h gen 1bc51b membership 01
cp-etl02:~ # gabconfig –a 看看能不能識別對方未尾是01
GAB Port Memberships
===============================================================
Port a gen 1bc510 membership 01
Port h gen 1bc51b membership 01
可以看到兩臺機器都能識別到對方
4.重啟叢集,在任一臺機器上執行
cp-etl01:/etc/VRTSvcs/conf/config # hastop -all -force
cp-etl01:/etc/VRTSvcs/conf/config # ps -ef |grep had
root 20025 17911 0 11:25 pts/7 00:00:00 grep had
在兩臺機器上啟動叢集
cp-etl01:/etc/VRTSvcs/conf/config # hastart
cp-etl02:~ # hastart
5.檢視狀態
cp-etl01:/etc/VRTSvcs/conf/config # ps -ef |grep had
root 20034 1 0 11:25 ? 00:00:00 /opt/VRTSvcs/bin/had
root 20036 1 0 11:25 ? 00:00:00 /opt/VRTSvcs/bin/hashadow
root 20049 17911 0 11:26 pts/7 00:00:00 grep had
cp-etl01:/etc/VRTSvcs/conf/config # hastatus -sum
-- SYSTEM STATE
-- System State Frozen
A cp-etl01 STALE_ADMIN_WAIT 0
6.使用第一臺機器強制拉動叢集
cp-etl01:/etc/VRTSvcs/conf/config # hostname
cp-etl01
cp-etl01:/etc/VRTSvcs/conf/config # hasys -force cp-etl01
You have new mail in /var/spool/mail/root
cp-etl01:/etc/VRTSvcs/conf/config # hastatus -sum
-- SYSTEM STATE
-- System State Frozen
A cp-etl01 RUNNING 0
A cp-etl02 RUNNING 0
-- GROUP STATE
-- Group System Probed AutoDisabled State
B ETL01 cp-etl01 Y N PARTIAL
B ETL01 cp-etl02 Y N OFFLINE
B ETL02 cp-etl01 Y N OFFLINE
B ETL02 cp-etl02 Y N ONLINE
可以看到叢集已經是正常狀態了,但是現在叢集還不能保護應用,如果應用程式斷掉,則不會進行切換
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7490392/viewspace-1038636/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- MongoDB分片叢集節點狀態stateStr:RECOVERING解決MongoDB
- Elasticsearch叢集狀態健康值處於red狀態問題分析與解決(圖文詳解)Elasticsearch
- 替換OCR和表決磁碟後,重啟叢集,資料庫資源的叢集狀態為OFFLINE資料庫
- VCS中檢查Cluster中節點的狀態
- oracle RAC 診斷叢集狀態命令Oracle
- 設定gbase叢集節點離線狀態
- 解決叢集 Yellow 與 Red 的問題
- 在GI安裝完成後檢視叢集狀態時發現,磁碟組狀態不對
- Elasticsearch 叢集和索引健康狀態及常見錯誤說明Elasticsearch索引
- Docker容器的退出狀態碼及解決方法Docker
- Etcd叢集靜態配置
- 阿里雲註冊叢集+Prometheus 解決多雲容器叢集運維痛點阿里Prometheus運維
- 將Standard標準叢集修改為Flex叢集Flex
- Kubernetes叢集證書過期解決方案:使用kubeadm為證書續期
- 小知識:使用oracle使用者檢視RAC叢集資源狀態Oracle
- 叢集故障處理之處理思路以及健康狀態檢查(三十二)
- Airbnb的動態 Kubernetes 叢集擴縮容AI
- Elasticsearch上建立的index是yellow健康狀態的解決方案ElasticsearchIndex
- 解決SpringBoot連線Nacos叢集報400問題Spring Boot
- 伺服器異常狀態怎麼解決伺服器
- HTTP協議無狀態,該怎麼解決?HTTP協議
- 狀態機解決複雜邏輯及使用
- Portworx演示:在K8S叢集間遷移有狀態的應用和資料K8S
- 資料採集行業現狀及解決方案行業
- 行為型設計模式 - 狀態模式詳解設計模式
- 解決Vertica叢集某節點出現Clock skewed告警
- 為什麼要用Redis叢集?Redis
- 事件溯源:是來自事件的狀態與作為狀態的事件? - verraes事件
- 埠狀態詳解
- java執行緒的五大狀態,阻塞狀態詳解Java執行緒
- Zookeeper叢集 + Kafka叢集Kafka
- K8S線上叢集排查,實測排查Node節點NotReady異常狀態K8S
- 解決方案系列-叢集選主(基於 DB 唯一鍵)
- 如何快速解決叢集異常和機器效能波動
- TCP為什麼是有狀態的?TCP
- Kubernetes叢集日誌詳解
- 搭建zookeeper叢集(偽叢集)
- 資料採集標註行業現狀及解決方案行業
- HTTP狀態碼詳解HTTP