一文讀懂GaussDB(openGauss) 的六大關鍵技術特性

qwer1030274531發表於2020-11-04

GaussDB(openGauss)是深度融合華為在資料庫領域多年的經驗,結合企業級場景需求,推出的新一代企業級分散式資料庫,支援集中式和分散式兩種部署形態。

它面向金融網際網路交易和政企OA/辦公場景,具有安全可靠、超高效能、簡單易用等優勢。

華為雲資料庫產品部高階產品經理沈志鵬在1024程式設計師狂歡節的直播間,更為深入地介紹了GaussDB(openGauss)的關鍵特性、成功案例。

分散式or集中式,總有一個適合你

GaussDB(openGauss)定位為企業級雲分散式資料庫,架構上著重構築傳統資料庫的企業級能力和網際網路分散式資料庫的高擴充套件和高可用能力。

對比傳統形態,GaussDB(openGauss)能夠獲得:

高效能:支援分散式事務強一致性,同時32節點下能夠達到1200萬tpmC的效能實測指標;

高可用:支援同城跨AZ多活容災,兩地三中心金融級部署場景;

高擴充:當前支援最大256節點的線上擴容,同時保障客戶擁有卓越的效能線性增長,打破傳統DIY架構的效能天花板;

易運維:高度支援HTAP混合負載場景,極大的減少了業務改造成本,同時基於雲平臺獲線上監控,運維,升級等便利的能力。

GaussDB(openGauss)在華為雲上擁有兩種部署形態:集中式和分散式,分別面向企業核心交易和未來海量事務型場景,打造差異化競爭力。

集中式部署

集中式部署又包括單機和主備兩種型別。

以主備為例,支援1+2(最大保護)主備,基於資料庫日誌複製的熱備,在單機效能可滿足需求的情況下,提供高可用。

其中,1+1(最大可用)指的是,資料會同步寫往備機。但如果出現網路等影響,無法完成同步操作,會轉為非同步。後續網路恢復,會自動追上。在資料不同步期間,切換會有資料丟失。

1+2(最大保護)則意味著資料會同步寫往備機,且要求必須有一個確認,才向客戶端返回。可靠性高。

集中式版本擁有開源生態,使用者可以透過開源網站直接下載,作為國內唯一開源資料庫,也是華為開源、開放、不LOCKIN單一廠商的最佳證明。

分散式部署:

分散式部署方面,資料按shard劃分,讀寫負載準線性擴充套件,滿足大規模業務量場景,支援兩地三中心高可用部署。另外,分散式版本承載華為雲自研分散式元件體系,是傳統企業擁抱網際網路,面向未來海量事務型場景挑戰的有力保障。

下面是分散式架構中的一些 關鍵角色:

分散式架構又可以分為 獨立部署&混合部署。

混合部署方案適合通用客戶,其方案包括:1、各角色3副本,資料3副本部署;2、各角色程式合一部署,對外只體現資料庫節點;

這樣部署的優勢是組網簡潔明瞭,交付介面高效;起點配置要求低,適配場景比較通用;和未來的技術演進方向匹配。

另一個獨立部署方案適合高階客戶,它的方案包括:1、各角色3副本,資料3副本部署;2、關鍵角色程式分開部署,對外體現CMS、GTM、CN、DN主、DN備。

獨立部署方案下,使用者可以根據業務負載確定CN和DN的最佳比例,達成最高效的組網。

解讀GaussDB(openGauss)分散式關鍵特性

關鍵技術一:分散式執行框架

業務應用下發SQL給Coordinator,SQL可以包含對資料的增(insert)、刪(delete/drop)、改(update)、查(select)。Coordinator利用資料庫的最佳化器生成執行計劃,每個DN會按照執行計劃的要求去處理資料。

因為資料是透過一致性Hash技術均勻分佈在每個節點,因此DN在處理資料的過程中,可能需要從其他DN獲取資料,GaussDB 提供了三種stream流(廣播流、聚合流和重分佈流)來降低資料在DN節點間的流動。

DN將結果集返回給Coordinate進行彙總。Coordinator將彙總後的結果返回給業務應用。

關鍵技術二: GTM-Lite技術

GTM-Lite技術可以在保證事務全域性強一致的同時,提供高效能的事務處理能力,避免了單GTM的效能瓶頸。

這裡的高效能事務管理指的是無鎖、多版本、高併發事務技術。

而且分散式的GTM-Lite方案提供全域性事務快照和提交號管理,實現強一致性,且無中心節點效能瓶頸。

關鍵技術三:基於NUMA-Aware實現高效能事務處理

基於鯤鵬CPU的NUMA-Aware資料庫架構,效能更強。

關鍵技術四:叢集HA,多層級冗餘實現系統無單點故障

GaussDB(openGauss)透過硬體冗餘、例項冗餘、資料冗餘,實現整個系統無單點故障,高可用。

其中硬體高可用包括儲存磁碟RAID冗餘、網路雙交換機冗餘、多網路卡冗餘、主機UPS電源保護。

軟體高可用則包括協調節點CN例項多活冗餘、資料節點/全域性事務管理/ 叢集管理器例項Active-Standby冗餘。

除此之外,還支援軟硬體故障檢測,最終進一步保障資料庫的高可用。

關鍵技術五:跨AZ/Region容災技術帶來高可用

叢集內HA,資料不丟失,業務秒級中斷;同城跨AZ容災,資料不丟失,分鐘級恢復,以及兩地三中心部署。

除了同城跨AZ和兩地三中心,GaussDB(openGauss)還在探索異地多活,其主要特徵有:

  • 支援多中心統一查詢及全域性一致讀,整體資源利用率高;
  • 靈活的高可用方案:透過配置多副本,可以實現DC,AZ,Region級高可用容災策略;
  • 負載分擔及故障無縫切換;
  • 支援平滑線上擴容。

關鍵技術六:Scale-out線上橫向擴充套件帶來高擴充套件

GaussDB(openGauss)支援但叢集最大256節點,節點擴充套件下能夠獲得卓越的效能線性比

同時節點擴容能夠做到完全線上,對客戶透明,節點擴容完成後DN資料自動重分佈,CN自動完成負載均衡。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30239065/viewspace-2732123/,如需轉載,請註明出處,否則將追究法律責任。

相關文章