本文分享自華為雲社群《GaussDB輕量化運維管理工具介紹》,作者: Gauss松鼠會小助手。
一、GaussDB 運維管理平臺簡介
開放生態層
- 友好Web介面,多雲皮膚個性化定製
- 豐富的原子API
- 公有云、合運營、HCSO、邊緣雲IES、HCS、輕量化、統一版本
基礎+智慧運維能力
- 豐富的基礎運維能力
- 打造端到端全鏈路的智慧自制運維平臺,覆蓋自監控、自診斷、自調優、自恢復和自安全全量功能,一鍵部署,精準實施;
標準化代理層
- 全方位多層安全防護,精細隔離設計
- 精準管理程序資源消耗控制,極少效能損耗
- 標準化南向介面規範各引警外掛化接入原子操作
透過授權,登入到GaussDB運維管理平臺,我們可以看到如下介面:
1、例項總覽介面
2、例項詳情頁面
二、GaussDB 運維管理平臺功能介紹
1、平臺管理功能
作為管控平臺,雲資料庫GaussDB管理平臺具備完善的安全防護策略。主要是透過使用者角色和使用者組劃分,細粒度的控制各個角色的訪問執行許可權,守護運維的安全。
基本功能:
1、管理使用者(user): 支援管理員對普通使用者進行增加、刪除、鎖定、重置密碼、使用者和例項(Instance)、使用者組的繫結等操作
2、管理使用者組(user_group): 可以將使用者加入使用者組中,針對整個使用者組可以設定統一的角色,使用者可以同時加到多個使用者組中
3、角色管理(Role): 可以自定義角色,增加對應的許可權(permission),支援細粒度許可權
4、管理活躍使用者會話: 可以檢視當前登入中的使用者,管理員可以結束會話
5、後臺功能: 提供鑑權、校驗弱密碼等介面,密碼會校驗規則和弱密碼,加密後存入元庫中。
2、例項管理功能
1、例項納管
2、例項解除納管
3、例項啟停
4、例項擴容
5、例項升級管理
6、例項容災管理
7、例項告警管理
8、例項巡檢管理
三、GaussDB管理平臺例項管理基本功能
1、納管例項
- 資料庫例項安裝完成後,狀態為Normal>則可以使用GaussDB管理平臺將例項進行納管。
- 納管前需將例項主機錄入主機管理中進行管理。
- 輸入例項節點任意一個管理IP地址,點選檢查例項節點,檢查主機是否已經錄入主機管理,主機狀態線上則已經錄入允許匯入,主機狀態離線則未錄入,無法執行匯入。
- 所有主機都線上後。輸入例項名稱,管理員使用者名稱,管理員密碼點選提交按鈕下發納管流程。
1.1 新增主機
1.2 納管例項
2、取消納管例項
- GaussDB 運維管理平臺可以取消納管已經匯入並納管的資料庫例項。
- 首先在主頁上找到要取消納管的例項
- 點選“更多”->“取消納管”
- 頁面彈出對話方塊進行管理員密碼的輸入
3、例項啟停
GaussDB 運維管理平臺支援對所納管的資料庫例項進行基本的啟停操作,主要包括停止例項啟動例項、重啟例項等。
- 在主頁找到需要管理的例項,點選“更多”–>“停止例項”來停止例項執行
- 對於已經停止執行的例項,點選“更多”–>“啟動例項”來啟動例項執行
- 也可以直接點選“更多”–>“重啟例項”來快速對例項進行重啟
4、例項解除安裝
GaussDB 運維管理平臺支援對所納管的資料庫例項進行一鍵式解除安裝。
注:刪除例項屬於高危操作,需要輸入“delete”進行二次確認。
- GaussDB 運維管理平臺可以一鍵式刪除已經匯入並納管的資料庫例項。
- 首先在主頁上找到要刪除的例項,然後點選“更多”->“刪除例項”。
- 頁面彈出對話方塊進行二次確認。
5、節點擴容
隨著業務的增長,資料庫在執行效能及儲存上逐漸會達到瓶頸。此時,需要透過增加節點來提升例項的效能及儲存能力。GaussDB支援節點擴容操作。擴容方案如下:
線上擴容主要分為加節點和資料重分佈兩個階段,除切換後設資料外均支援線上業務。
- 加節點階段:主要完成新的CN/DN節點的安裝、元資訊同步、啟動等操作。
- 資料重分佈階段:主要完成基線資料搬遷、增量資料搬遷(線上業務)、切換後設資料等操作。
注:同步元資訊的目的在於為後續資料重分佈做準備
向新增的DN、CN節點同步後設資料:
1、同步基礎元資訊:資料庫、模式、表空間
2、同步普通元資訊:使用者表、函式
3、建立新的nodegroup(為擴容後的新叢集)
4、元資訊同步完成後切換installation group為新建nodegroup
GaussDB 運維管理平臺支援對所納管的分散式資料庫例項進行節點擴容。
- “例項管理”介面,單擊具體例項名稱,進入“基本資訊”介面。
- 在“資料庫資訊”模組的“節點數量”後,單擊“新增”進入“節點擴容”頁面。
- 選擇節點數量和管理地址,管理地址數量需要與新增節點數量一致,管理地址可用區分佈需要符合部署方案。
- 確認“例項擴容過程中會有鎖表操作,可能會阻塞業務,屬於高危操作。請選擇在業務低峰期進行該操作。” 風險提示資訊,並勾選“我已確認閱讀上述風險提示”。
- 單擊“下一步”進入“規格確認”介面。
- 確認無誤後,單擊“提交”,進行擴容。
- 資料庫例項狀態將顯示為“新增節點中”,則說明擴容指令下發成功。
注意事項
- 擴容是指分片擴容,擴容的節點僅包含CN、DN,不含有其他元件。
- 擴容以節點組為單位,擴容節點的元件分佈形態與擴容前例項分佈規律相同。
- 主備版部署模式暫時不支援擴容。
- 存在故障節點的例項不允許擴容。
- 例項擴容過程中會有鎖表操作,可能會阻塞業務,屬於高危操作。請選擇在業務低峰期進行該操作。
- 擴容前,需要滿足所有DN節點剩餘可用空間大於DN節點的最大單表空間。
四、GaussDB管理平臺例項升級功能
1、GaussDB升級方式
升級過程涉及系統表和資料表變更,重啟程序,有版本相容風險和業務中斷問題,根據升級方式,業務中斷時間,風險評估對比如下:
大小版本升級方式比較
2、就地升級
- 找到需要升級的例項點選更多進行版本升級
- 版本升級選擇就地升級方式
- 選擇對應的目標版本
3、灰度升級
灰度升級分為兩種方式:
1、升級自動提交方式: 所有節點一起升級,在升級過程中有大概10秒的業務中斷
2、升級待觀察後提交方式: 將資料庫升級過程細分為升級待觀察和升級提交兩個階段
- 升級待觀察階段
升級待觀察階段可以按照AZ升級,也可以對升級的AZ進行回滾,所有AZ升級完成後可以對例項進行業務測試
- 升級提交階段
提交當前的升級,提交後不可回滾
3.1 灰度升級-升級自動提交
- 在例項管理主頁找到需要升級的例項點選“版本升級”。
- 在彈窗中選擇升級自動提交的操作方式和目標版本進行升級。
3.2 灰度升級-升級待觀察階段
- 灰度升級選擇升級待觀察
- 選擇升級可用區中AZ進行升級
- 選擇目標版本進行升級
3.3 灰度升級-升級待提交階段
- 升級完所有可用區的AZ之後,選擇提交升級,對例項進行真正的升級
- 觀察階段發現升級的版本有問題,可以選擇升級回退
五、GaussDB 運維管理平臺例項容災管理
GaussDB 運維管理平臺流式容災管理的主要功能:
- 容災搭建
- 容災狀態檢視
- 容災倒換
- 災備升主
- 容災解除
- 容災演練(規劃中)
- 容災快速加回(規劃中)
流式容災:基於流複製的容災解決方案
1、容災搭建
- 主資料庫例項配置災備資料庫例項資訊,等待災備資料庫例項連線過來進行全量複製
- 災備資料庫例項完成全量build之後,將與主資料庫例項建立流式複製進行日誌的增量複製
2、容災狀態檢視
在容災管理介面,可以檢視到已經建立好的容災關係組,並支援對容災例項進行容災倒換、災備升主、容災解除等操作。
如上圖,在容災詳情頁面,可以檢視容災基本資訊,容災RTO、RPO數值,以及災備狀態指標;災備例項分片日誌差距、災備例項分片日誌落盤速率、災備例項分片待回放日誌量、災備例項分片日誌回放速率。
3、容災倒換
- 可以透過容災倒換,將容災關係中主備例項角色互換,原來的主變為備例項,原來的備變為主例項
- 容災倒換命令不會解除容災關係
4、災備升主
可以透過災備升主,將容災備例項提升為一個包含主DN的例項,使其可以對外提供服務,升主成功後,之前的容災關係將失效。
5、容災解除
- 容災解除,是使得主例項清除維護的對端容災資訊。
- 清除後,主例項可以重新建立新的容災關係。
6、容災演練
1.準備兩個正常的例項
2.建立兩個例項的容災關係
3.主例項發生嚴重故障
4.對備例項進行升主,對外提供服務
5.對主例項進行維修,然後執行容災解除
6.重新搭建容災關係
7.進行容災倒換,恢復初始的容災關係
六、GaussDB管理平臺例項監控告警
1、告警統計
實時告警與歷史告警:
- 告警基本資訊:告警id,告警名稱,告警型別,告警狀態型別、告警例項
- 告警表現:告警時間、告警級別、告警描述、告警持續時間、告警節點IP、通知狀態
- 告警資料分析:告警可能原因、影響、最佳化建議
2、告警管理
告警模板管理:預設模板包括預設文字模板以及預設JSON模板
3、監控大盤
列表看板:
透過將例項進行平鋪展示的方式,橫向對比各個例項的基本指標資訊,包括CPU使用率、記憶體使用率等。
趨勢看板:
- 展示單個例項的全方位詳細監控指標。
- 指標範圍包括:CPU/記憶體、磁碟/儲存、網路、連線、業務負載鎖、同步狀態、程序資源等。
希望本節課程對大家對GaussDB運維管理平臺的工具有所瞭解,歡迎大家共同學習交流。
點選關注,第一時間瞭解華為雲新鮮技術~