數棧資料安全案例:混合雲環境資料庫備份容災實現

數棧DTinsight發表於2021-04-08

本文整理自: 袋鼠雲技術薈 | 資料安全(1):混合雲環境資料庫備份容災實現

數棧是雲原生—站式資料中臺PaaS,我們在github上有一個有趣的開源專案: ,歡迎給我們點個 star star star


FlinkX是一個基於Flink的批流統一的資料同步工具,既可以採集靜態的資料,比如MySQL,HDFS等,也可以採集實時變化的資料,比如MySQL binlog,Kafka等,是全域、異構、批流一體的資料同步引擎,大家如果有興趣,歡迎來github社群找我們玩~

近些年,資料安全事件頻發。


作為企業的核心資產,資料的外洩、破壞都會導致不可挽回的經濟損失和核心競爭力缺失。規範的制度建設、許可權管理和變更流程是保證資料安全的重要落地措施。

袋鼠雲DBA團隊承接多個客戶的容災架構設計需求,制定可靠、有效的容災架構方案並推動落地。 備份重於一切。我們會優先考慮資料庫備份集的容災設計: 兩地三中心VS混合雲、許可權分配&監控告警&恢復演練。

基於混合雲的備份容災方案,已成功向多個客戶輸出。今天來談一下阿里雲— IDC混合雲場景下的備份容災設計:

1. 阿里雲RDS等資料庫產品,備份集、binlog保留在OSS物件儲存,下載後可見;同時提供備份/日誌API介面,用於程式設計開發;

2. 雲環境和IDC容災機房走了專線,頻寬根據備份、日誌量,傳輸時間視窗來規劃;

3. IDC容災機房重要是儲存的規劃:RAID&檔案保留期限&容量&許可權;

4. 備份集、日誌檔案的抽取、驗證程式;5. 運維監控平臺,收集、分析IDC容災機房程式日誌,發現、告警,運維及時響應。

具體實現:

1. 後設資料。阿里雲RDS提供了兩個API:備份檔案資訊DescribeBackups、日誌檔案資訊DescribeBinlogFiles,傳入引數instance_id即可獲取備份集、日誌檔案的基礎資訊:下載路徑、大小、檔名、checksum值等。

袋鼠雲智慧運維中臺可以準實時同步RDS後設資料資訊,確保備份集、日誌檔案的抽取時效。


2. 檔案抽取。依賴後設資料資訊,分為備份集和日誌檔案兩個抽取程式,每個程式均配置有檔案大小、checksum值雙重驗證。

對拉取程式超時、檔案不完整等問題,會自動重新拉取。

控制抽取程式併發數量,避免專線擁擠。

3. 運維監控平臺接入,分析同步任務執行日誌,配置抽取失敗、傳輸超時等告警;同時接入IDC儲存空間使用量、使用率變化趨勢 告警,對異常問題主動發現、及時處理。

4. 恢復演練。制定演練計劃,模擬以時間點恢復、資料誤操作等運維事件,收集操作過程,整理成冊。

5. IDC儲存管理由機房運維部門負責,雲平臺運維部門操作儲存需嚴格按照審批流程進行申請。

從架構設計、許可權管理到程式開發、告警響應、異常處理、恢復演練,多環節無死角確保備份集安全。

只要備份安全,資料一定能恢復。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69995740/viewspace-2767170/,如需轉載,請註明出處,否則將追究法律責任。

相關文章