手把手帶你認識GaussDB輕量化運維管理工具

华为云开发者联盟發表於2024-03-08

本文分享自華為雲社群《GaussDB輕量化運維管理工具介紹》,作者: Gauss松鼠會小助手。

一、GaussDB 運維管理平臺簡介

cke_152.png

開放生態層

  • 友好Web介面,多雲皮膚個性化定製
  • 豐富的原子API
  • 公有云、合運營、HCSO、邊緣雲IES、HCS、輕量化、統一版本

基礎+智慧運維能力

  • 豐富的基礎運維能力
  • 打造端到端全鏈路的智慧自制運維平臺,覆蓋自監控、自診斷、自調優、自恢復和自安全全量功能,一鍵部署,精準實施;

標準化代理層

  • 全方位多層安全防護,精細隔離設計
  • 精準管理程序資源消耗控制,極少效能損耗
  • 標準化南向介面規範各引警外掛化接入原子操作

透過授權,登入到GaussDB運維管理平臺,我們可以看到如下介面:

1、例項總覽介面

cke_153.png

2、例項詳情頁面

cke_154.png

二、GaussDB 運維管理平臺功能介紹

1、平臺管理功能

作為管控平臺,雲資料庫GaussDB管理平臺具備完善的安全防護策略。主要是透過使用者角色和使用者組劃分,細粒度的控制各個角色的訪問執行許可權,守護運維的安全。

cke_155.png

基本功能:

1、管理使用者(user): 支援管理員對普通使用者進行增加、刪除、鎖定、重置密碼、使用者和例項(Instance)、使用者組的繫結等操作

2、管理使用者組(user_group): 可以將使用者加入使用者組中,針對整個使用者組可以設定統一的角色,使用者可以同時加到多個使用者組中

3、角色管理(Role): 可以自定義角色,增加對應的許可權(permission),支援細粒度許可權

4、管理活躍使用者會話: 可以檢視當前登入中的使用者,管理員可以結束會話

5、後臺功能: 提供鑑權、校驗弱密碼等介面,密碼會校驗規則和弱密碼,加密後存入元庫中。

2、例項管理功能

cke_156.png

1、例項納管

2、例項解除納管

3、例項啟停

4、例項擴容

5、例項升級管理

6、例項容災管理

7、例項告警管理

8、例項巡檢管理

三、GaussDB管理平臺例項管理基本功能

1、納管例項

  • 資料庫例項安裝完成後,狀態為Normal>則可以使用GaussDB管理平臺將例項進行納管。
  • 納管前需將例項主機錄入主機管理中進行管理。
  • 輸入例項節點任意一個管理IP地址,點選檢查例項節點,檢查主機是否已經錄入主機管理,主機狀態線上則已經錄入允許匯入,主機狀態離線則未錄入,無法執行匯入。
  • 所有主機都線上後。輸入例項名稱,管理員使用者名稱,管理員密碼點選提交按鈕下發納管流程。

1.1 新增主機

cke_157.png

1.2 納管例項

cke_158.png

2、取消納管例項

cke_159.jpeg

  • GaussDB 運維管理平臺可以取消納管已經匯入並納管的資料庫例項。
  • 首先在主頁上找到要取消納管的例項
  • 點選“更多”->“取消納管”
  • 頁面彈出對話方塊進行管理員密碼的輸入

3、例項啟停

GaussDB 運維管理平臺支援對所納管的資料庫例項進行基本的啟停操作,主要包括停止例項啟動例項、重啟例項等。

cke_160.png

  • 在主頁找到需要管理的例項,點選“更多”–>“停止例項”來停止例項執行
  • 對於已經停止執行的例項,點選“更多”–>“啟動例項”來啟動例項執行
  • 也可以直接點選“更多”–>“重啟例項”來快速對例項進行重啟

4、例項解除安裝

GaussDB 運維管理平臺支援對所納管的資料庫例項進行一鍵式解除安裝。

cke_161.png

注:刪除例項屬於高危操作,需要輸入“delete”進行二次確認。

  • GaussDB 運維管理平臺可以一鍵式刪除已經匯入並納管的資料庫例項。
  • 首先在主頁上找到要刪除的例項,然後點選“更多”->“刪除例項”。
  • 頁面彈出對話方塊進行二次確認。

5、節點擴容

隨著業務的增長,資料庫在執行效能及儲存上逐漸會達到瓶頸。此時,需要透過增加節點來提升例項的效能及儲存能力。GaussDB支援節點擴容操作。擴容方案如下:

cke_162.png

cke_163.png

線上擴容主要分為加節點和資料重分佈兩個階段,除切換後設資料外均支援線上業務。

  • 加節點階段:主要完成新的CN/DN節點的安裝、元資訊同步、啟動等操作。
  • 資料重分佈階段:主要完成基線資料搬遷、增量資料搬遷(線上業務)、切換後設資料等操作。

cke_164.png

注:同步元資訊的目的在於為後續資料重分佈做準備

向新增的DN、CN節點同步後設資料:

1、同步基礎元資訊:資料庫、模式、表空間

2、同步普通元資訊:使用者表、函式

3、建立新的nodegroup(為擴容後的新叢集)

4、元資訊同步完成後切換installation group為新建nodegroup

GaussDB 運維管理平臺支援對所納管的分散式資料庫例項進行節點擴容。

cke_165.png

  • “例項管理”介面,單擊具體例項名稱,進入“基本資訊”介面。
  • 在“資料庫資訊”模組的“節點數量”後,單擊“新增”進入“節點擴容”頁面。

cke_166.png

  • 選擇節點數量和管理地址,管理地址數量需要與新增節點數量一致,管理地址可用區分佈需要符合部署方案。
  • 確認“例項擴容過程中會有鎖表操作,可能會阻塞業務,屬於高危操作。請選擇在業務低峰期進行該操作。” 風險提示資訊,並勾選“我已確認閱讀上述風險提示”。
  • 單擊“下一步”進入“規格確認”介面。

cke_167.png

  • 確認無誤後,單擊“提交”,進行擴容。
  • 資料庫例項狀態將顯示為“新增節點中”,則說明擴容指令下發成功。

注意事項

  • 擴容是指分片擴容,擴容的節點僅包含CN、DN,不含有其他元件。
  • 擴容以節點組為單位,擴容節點的元件分佈形態與擴容前例項分佈規律相同。
  • 主備版部署模式暫時不支援擴容。
  • 存在故障節點的例項不允許擴容。
  • 例項擴容過程中會有鎖表操作,可能會阻塞業務,屬於高危操作。請選擇在業務低峰期進行該操作。
  • 擴容前,需要滿足所有DN節點剩餘可用空間大於DN節點的最大單表空間。

四、GaussDB管理平臺例項升級功能

1、GaussDB升級方式

升級過程涉及系統表和資料表變更,重啟程序,有版本相容風險和業務中斷問題,根據升級方式,業務中斷時間,風險評估對比如下:

cke_168.png

大小版本升級方式比較

cke_169.png

2、就地升級

cke_170.png

  • 找到需要升級的例項點選更多進行版本升級
  • 版本升級選擇就地升級方式
  • 選擇對應的目標版本

3、灰度升級

灰度升級分為兩種方式:

1、升級自動提交方式: 所有節點一起升級,在升級過程中有大概10秒的業務中斷

2、升級待觀察後提交方式: 將資料庫升級過程細分為升級待觀察和升級提交兩個階段

  • 升級待觀察階段

    升級待觀察階段可以按照AZ升級,也可以對升級的AZ進行回滾,所有AZ升級完成後可以對例項進行業務測試

  • 升級提交階段

    提交當前的升級,提交後不可回滾

3.1 灰度升級-升級自動提交

cke_171.png

  • 在例項管理主頁找到需要升級的例項點選“版本升級”。
  • 在彈窗中選擇升級自動提交的操作方式和目標版本進行升級。

3.2 灰度升級-升級待觀察階段

cke_172.png

  • 灰度升級選擇升級待觀察
  • 選擇升級可用區中AZ進行升級
  • 選擇目標版本進行升級

3.3 灰度升級-升級待提交階段

cke_173.png

  • 升級完所有可用區的AZ之後,選擇提交升級,對例項進行真正的升級
  • 觀察階段發現升級的版本有問題,可以選擇升級回退

五、GaussDB 運維管理平臺例項容災管理

GaussDB 運維管理平臺流式容災管理的主要功能:

  • 容災搭建
  • 容災狀態檢視
  • 容災倒換
  • 災備升主
  • 容災解除
  • 容災演練(規劃中)
  • 容災快速加回(規劃中)

流式容災:基於流複製的容災解決方案

cke_174.png

1、容災搭建

cke_175.png

  • 主資料庫例項配置災備資料庫例項資訊,等待災備資料庫例項連線過來進行全量複製
  • 災備資料庫例項完成全量build之後,將與主資料庫例項建立流式複製進行日誌的增量複製

cke_176.png

2、容災狀態檢視

cke_177.png

在容災管理介面,可以檢視到已經建立好的容災關係組,並支援對容災例項進行容災倒換、災備升主、容災解除等操作。

cke_178.png

如上圖,在容災詳情頁面,可以檢視容災基本資訊,容災RTO、RPO數值,以及災備狀態指標;災備例項分片日誌差距、災備例項分片日誌落盤速率、災備例項分片待回放日誌量、災備例項分片日誌回放速率。

3、容災倒換

cke_179.png

  • 可以透過容災倒換,將容災關係中主備例項角色互換,原來的主變為備例項,原來的備變為主例項
  • 容災倒換命令不會解除容災關係

cke_180.png

4、災備升主

cke_181.png

可以透過災備升主,將容災備例項提升為一個包含主DN的例項,使其可以對外提供服務,升主成功後,之前的容災關係將失效。

cke_182.png

5、容災解除

cke_183.png

  • 容災解除,是使得主例項清除維護的對端容災資訊。
  • 清除後,主例項可以重新建立新的容災關係。

6、容災演練

1.準備兩個正常的例項

2.建立兩個例項的容災關係

cke_184.png

3.主例項發生嚴重故障

cke_185.png

4.對備例項進行升主,對外提供服務

cke_186.png

5.對主例項進行維修,然後執行容災解除

6.重新搭建容災關係

cke_187.png

7.進行容災倒換,恢復初始的容災關係

cke_188.png

六、GaussDB管理平臺例項監控告警

1、告警統計

實時告警與歷史告警:

  • 告警基本資訊:告警id,告警名稱,告警型別,告警狀態型別、告警例項
  • 告警表現:告警時間、告警級別、告警描述、告警持續時間、告警節點IP、通知狀態
  • 告警資料分析:告警可能原因、影響、最佳化建議

cke_189.png

2、告警管理

cke_190.png

告警模板管理:預設模板包括預設文字模板以及預設JSON模板

3、監控大盤

列表看板:

透過將例項進行平鋪展示的方式,橫向對比各個例項的基本指標資訊,包括CPU使用率、記憶體使用率等。

cke_191.png

趨勢看板:

cke_192.png

  • 展示單個例項的全方位詳細監控指標。
  • 指標範圍包括:CPU/記憶體、磁碟/儲存、網路、連線、業務負載鎖、同步狀態、程序資源等。

希望本節課程對大家對GaussDB運維管理平臺的工具有所瞭解,歡迎大家共同學習交流。

點選關注,第一時間瞭解華為雲新鮮技術~

相關文章