Ceph monitor故障恢復探討

YY哥發表於2014-08-20

1 問題

一般來說，在實際執行中，ceph monitor的個數是2n+1(n>=0)個，線上上至少3個，只要正常的節點數>=n+1，ceph的paxos演算法能保證系統的正常執行。所以，對於3個節點，同時只能掛掉一個。一般來說，同時掛掉2個節點的概率比較小，但是萬一掛掉2個呢？

如果ceph的monitor節點超過半數掛掉，paxos演算法就無法正常進行仲裁(quorum)，此時，ceph叢集會阻塞對叢集的操作，直到超過半數的monitor節點恢復。

If there are not enough monitors to form a quorum, the ceph command will block trying to reach the cluster. In this situation, you need to get enough ceph-mon daemons running to form a quorum before doing anything else with the cluster.

所以，

（1）如果掛掉的2個節點至少有一個可以恢復，也就是monitor的後設資料還是OK的，那麼只需要重啟ceph-mon程式即可。所以，對於monitor，最好執行在RAID的機器上。這樣，即使機器出現故障，恢復也比較容易。

（2）如果掛掉的2個節點的後設資料都損壞了呢？出現這種情況，說明人品不行，2臺機器的RAID磁碟同時損壞，這得多背？肯定是管理員嫌工資太低，把機器砸了。如何恢復呢？

2 恢復

其實，也沒有其它辦法，只能想辦法將故障的節點恢復，但後設資料已經損壞。幸好還有一個後設資料正常的節點，通過它可以恢復。

新增monitor的步驟：

$ ceph mon getmap -o /tmp/monmap # provides fsid and existing monitor addrs

$ ceph auth export mon. -o /tmp/monkey # mon. auth key

$ ceph-mon -i newname --mkfs --monmap /tmp/monmap --keyring /tmp/monkey

所以，只要得到monmap，就可以恢復monitor了。

為了模擬，考慮2個monitor節點，掛掉一個，此時通過網路訪問ceph的所有操作都會被阻塞，但monitor的本地socket還是可以通訊的。

NewImage

但是，讓人蛋疼的是通過socket不能進行monmap的匯出。不過，幸好有monmaptool工具，通過它，我們可以手動生成(注意fsid)：

# monmaptool --create --add vm2 172.16.213.134:6789 --add vm3 172.16.213.135:6789 --fsid eb295a51-ec22-4971-86ef-58f6d2bea3bf --clobber monmap

monmaptool: monmap file monmap

monmaptool: set fsid to eb295a51-ec22-4971-86ef-58f6d2bea3bf

monmaptool: writing epoch 0 to monmap (2 monitors)

將正常monitor節點的mon key拷貝過來：

# cat /var/lib/ceph/mon/cluster1-vm2/keyring

[mon.]

key = AQDZQ8VTAAAAABAAX9HqE0NITrUt7j1w0YadvA==

caps mon = "allow *"

然後初始化：

# ceph-mon --cluster cluster1 -i vm3 --mkfs --monmap /root/monmap --keyring /tmp/keyring

ceph-mon: set fsid to eb295a51-ec22-4971-86ef-58f6d2bea3bf

ceph-mon: created monfs at /var/lib/ceph/mon/cluster1-vm3 for mon.vm3

最後，啟動故障節點：

# ceph-mon --cluster cluster1 -i vm3 --public-addr 172.16.213.135:6789

NewImage

一切OK!

主要參考

［1］RECOVERING FROM CEPH-MON FAILURE

作者：YY哥
出處：http://www.cnblogs.com/hustcat/
本文版權歸作者和部落格園共有，歡迎轉載，但未經作者同意必須保留此段宣告，且在文章頁面明顯位置給出原文連線，否則保留追究法律責任的權利。

資料庫恢復原理探討
2009-04-26
資料庫
【北亞資料恢復】什麼是Ceph？Ceph資料恢復研究
2022-03-22
資料恢復
【北亞企安資料恢復】Ceph儲存原理&Ceph資料恢復流程
2023-09-26
資料恢復
資料備份方法及災難恢復探討(轉)
2007-08-17
Cisco常見路由器密碼和版本恢復方法探討
2007-08-01
路由器密碼
postgreSQL 恢復至故障點精準恢復
2019-01-01
SQL
3.6遷移故障恢復
2018-02-27
ORACLE 常見故障恢復
2013-12-18
Oracle
ceph儲存的monitor選舉流程
2024-06-27
SQLServer異常故障恢復(二)
2018-09-30
SQLServer
Oracle 不同故障的恢復方案
2013-04-06
Oracle
MySQL資料庫故障恢復
2024-06-22
MySql資料庫
用Windows XP故障恢復控制檯恢復系統(轉)
2007-08-11
Windows
Mysql：從一個USE DB堵塞故障展開的探討
2017-11-09
MySql
docker筆記40-ceph osd誤刪除恢復
2018-10-29
Docker筆記
docker筆記47-ceph建立快照以及快照恢復
2018-11-04
Docker筆記
Oracle資料庫故障恢復資料庫系統故障恢復效能優化指南大全
2013-12-26
Oracle資料庫優化
【北亞資料恢復】硬碟壞道故障如何恢復資料？
2022-11-18
資料恢復硬碟
Promise探討
2019-01-02
Promise
【伺服器資料恢復】機房意外斷電導致伺服器資料丟失的資料恢復案例探討
2022-05-09
伺服器資料恢復
解析ESX SERVER故障資料恢復方法
2019-07-16
Server資料恢復
redis cluster 叢集故障恢復操作思路
2022-04-07
Redis
「分散式技術專題」故障恢復
2023-02-14
分散式
MongoDB副本集故障恢復機制概述
2016-07-17
MongoDB
資料庫不同故障的恢復方式
2014-02-23
資料庫
Oracle資料庫Redo故障的恢復
2008-07-16
Oracle資料庫
用DUL恢復故障的資料庫
2012-08-02
資料庫
深入探討 Undefined
2018-10-23
Undefined
IsPostBack深入探討
2008-12-01
恢復伺服器故障硬碟的資料
2019-12-31
伺服器硬碟
Oracle ASM故障資料恢復解決方案
2019-11-08
OracleASM資料恢復
Windows XP 系統故障恢復寶典(轉)
2007-08-11
Windows
MySQL 組複製故障恢復的有效策略
2024-08-19
MySql
【伺服器資料恢復】xen server常見故障的資料恢復方案
2022-11-23
伺服器資料恢復Server
vsan儲存資料恢復過程—虛擬機器故障恢復過程
2019-12-25
資料恢復虛擬機
vertica單節點故障恢復 Startup Failed, ASR Required
2019-07-09
AIUI
Oracle 目錄許可權丟失故障恢復
2021-04-17
Oracle
記一次Kafka叢集的故障恢復
2018-11-19
Kafka

Ceph monitor故障恢復探討

2 恢復

相關文章