【北亞企安資料恢復】Ceph儲存原理&Ceph資料恢復流程
Ceph儲存基本架構:
Ceph儲存可分為塊儲存,物件儲存和檔案儲存。Ceph基於物件儲存,對外提供三種儲存介面,故稱為統一儲存。
Ceph的底層是RADOS(分散式物件儲存系統),RADOS由兩部分組成:OSD和MON。
MON負責監控整個叢集,維護叢集的健康狀態,維護展示叢集狀態的各種圖表,如OSDMap、MonitorMap、PGMap和CRUSHMap。
OSD負責儲存資料、複製資料、平衡資料、恢復資料,與其它OSD間進行心跳檢查等。通常情況下一塊硬碟對應一個OSD。
Ceph資料的儲存過程:
無論使用哪種儲存方式(物件、塊、檔案),儲存的資料都會被切分成物件(Objects)。
儲存池:
不同使用者因為不同的目的把物件儲存在不同的儲存池裡,這些物件分佈於OSD上。
物件儲存在不同的儲存池(Pool)中,是物件儲存的邏輯組,對應不同的使用者。儲存池管理著歸置組數量、副本數量、和儲存池規則集。
歸置組:
歸置組(PGPlacementGroup)是物件池的片段,Ceph根據物件的Oid和一些其他資訊做計算操作,對映到歸置組,無數的物件被劃分到不同的歸置組。PG是一個邏輯概念,它在資料定址時類似於資料庫中的索引。
每個物件都會固定對映進一個PG中,所以當我們要尋找一個物件時,只需要先找到物件所屬的PG,然後遍歷這個PG就可以了,無需遍歷所有物件。而且在資料遷移時,也是以PG作為基本單位進行遷移。
OSD:
最後PG會根據管理員設定的副本數量進行復制,然後透過crush演算法儲存到不同的OSD節點上,最終把PG中的所有物件儲存到OSD節點上。
BlueStore:
新版本中,Ceph預設以Bluestore儲存引擎,作為RADOS中OSD的ObjectStore儲存底層實現BlueStore整體架構。
儲存空間:
BlueStore將整個儲存空間分為3個部分:WAL,DB,SLOW
慢速(Slow)空間:主要用於儲存物件資料,由BlueStore管理。
高速(DB)空間:儲存blufs和rocksdb產生的資料,由BlueFS直接管理,如果不存在或者DB裝置空間不足,則選擇Slow型別裝置空間。
超高速(WAL)空間:主要儲存RocksDB的WAL(即.log)檔案,由BlueFS直接管理,如果不存在或者WAL裝置空間不足,則逐級降級選擇DB、SLOW分割槽。
Rocksdb:
BlueStore使用Rocksdb作為自己後設資料儲存的底層實現,將各種後設資料以kv型記錄的方式存在資料庫中。
寫入機制:任何後設資料的寫入都會先寫到WAL,然後再寫入MemoryTable(Memtable)。
當一個Memtable寫滿了之後,就會變成immutable的Memtable,RocksDB在後臺會透過一個flush執行緒將這個Memtableflush到磁碟,生成一個SortedStringTable(SST)檔案。
BlueFS:
BlueFS與通用檔案系統不同,是Bluestore專為Rocksdb所設計的精簡檔案系統。
BlueFS的檔案和目錄的後設資料以日誌事務的形式儲存在日誌檔案中,在上電過程中,replay日誌檔案中的事務,就可以載入所有的後設資料到記憶體中。
北亞企安針對Ceph的資料恢復流程:
1、製作磁碟映象,用於資料提取和備份。
2、提取BlueFS中資料庫檔案。從磁碟映象的分割槽獲取超級塊,得到日誌的節點資訊。回放整個日誌中的事務,得到目錄結構和資料庫檔案節點資訊,根據資料庫檔案節點資訊提取資料庫檔案。提取從每個OSD提取出來的資料庫中的object記錄。
3、對於損壞的資料庫,根據檔案格式提取資料庫完好檔案中的object記錄。
4、解析object記錄,從各映象上提取對應的object資料。
5、根據object的id按序組合卷檔案的所有object資料塊,還原整個卷資料。
6、修復卷的檔案系統和其中檔案。
對於損壞缺失程度不高的卷檔案系統,嘗試修復損壞的卷,得到卷中的檔案。
對於有固定格式的檔案,嘗試修復損壞檔案。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2986022/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【北亞資料恢復】什麼是Ceph?Ceph資料恢復研究資料恢復
- 北亞企安資料恢復-XSAN資料恢復案例資料恢復
- 【北亞資料恢復】IBM System Storage儲存lvm資訊丟失資料恢復方案資料恢復IBMLVM
- 【北亞資料恢復】硬碟壞道故障如何恢復資料?資料恢復硬碟
- 【北亞資料恢復】IBM FlashSystem儲存raid5多硬碟離線的資料恢復案例資料恢復IBMAI硬碟
- 【VSAN資料恢復】VSAN儲存資料恢復案例資料恢復
- 【北亞資料恢復】IBM DS系列儲存伺服器硬碟故障、對映出錯的資料恢復資料恢復IBM伺服器硬碟
- 【北亞資料恢復】昆騰系列儲存伺服器StorNext檔案系統資料恢復案例資料恢復伺服器
- 【儲存資料恢復】NetApp儲存誤刪資料夾的資料恢復案例資料恢復APP
- 【北亞資料恢復】sqlserver資料庫被加密的資料恢復案例分享資料恢復SQLServer資料庫加密
- 【儲存資料恢復】NetApp儲存誤刪除的資料恢復案例資料恢復APP
- HP EVA系列儲存資料恢復原理資料恢復
- 【北亞企安資料恢復】RAIDZ多塊磁碟離線導致崩潰的資料恢復案例資料恢復AI
- Vsan資料恢復—Vsan分散式儲存資料恢復案例資料恢復分散式
- 儲存崩潰資料恢復過程;資料恢復案例資料恢復
- EMC 儲存資料恢復案例詳解【資料恢復方案】資料恢復
- 【儲存資料恢復】EqualLogic PS系列儲存磁碟故障的資料恢復案例資料恢復
- 【伺服器儲存資料恢復】HP-Lefthand儲存資料恢復案例伺服器資料恢復
- 【伺服器資料恢復】HP EVA儲存資料恢復案例伺服器資料恢復
- 【北亞資料恢復】oracle資料庫執行truncate table命令怎麼恢復資料?資料恢復Oracle資料庫
- 【儲存資料恢復】HP EVA儲存誤刪除VDISK的資料恢復案例資料恢復
- 【儲存資料恢復】某品牌EqualLogic系列儲存介紹和資料恢復方法資料恢復
- 【北亞資料恢復】分散式儲存hbase和hive資料庫底層檔案被誤刪除的資料恢復案例資料恢復分散式Hive資料庫
- 【北亞資料恢復】行動硬碟不認盤怎麼恢復硬碟資料?資料恢復硬碟
- 【伺服器資料恢復】StorNext儲存系統資料恢復案例伺服器資料恢復
- 【伺服器資料恢復】infortrend ESDS系列儲存資料恢復案例伺服器資料恢復
- 【raid資料恢復】光纖儲存raid陣列資料恢復案例AI資料恢復陣列
- 【北亞資料恢復】MongoDB資料遷移檔案丟失的MongoDB資料恢復案例資料恢復MongoDB
- 【儲存資料恢復】H3C FlexStorage儲存卷被刪如何恢復資料?資料恢復Flex
- 【北亞伺服器資料恢復】IBM DS系列儲存硬碟故障導致RAID5崩潰的資料恢復伺服器資料恢復IBM硬碟AI
- 【儲存資料恢復】esx vmfs的互斥導致儲存資料丟失的資料恢復案例資料恢復
- 【北亞資料恢復】不認盤的行動硬碟怎麼恢復硬碟資料?資料恢復硬碟
- 【儲存資料恢復】IBM儲存檔案NTFS系統損壞的資料恢復案例資料恢復IBM
- 【北亞伺服器資料恢復】異常斷電導致ESXI系統無法連線儲存的資料恢復伺服器資料恢復
- 【北亞資料恢復】IBM-ds3512儲存伺服器raid5損壞導致資料丟失的資料恢復案例資料恢復IBMS3伺服器AI
- 分散式資料恢復-hbase+hive分散式儲存資料恢復方案分散式資料恢復Hive
- 【儲存資料恢復】WAFL檔案系統下raid資料恢復案例資料恢復AI
- 【伺服器raid資料恢復】光纖儲存raid資料恢復案例伺服器AI資料恢復