HTAP資料庫及應用場景分析

hongwei2021發表於2022-12-01


HTAP 資料庫,即事務分析混合負載 DB ,已經成為一個流行的新資料庫。這一概念不僅非常熱門,而且也逐漸成為除 OLTP OLAP 之外越來越多資料庫使用者的新選擇規範。但是,同時也存在一些現象 : 一是一夜之間,所有資料庫都變成了 ;二是除了 可以同時承載事務和分析 SQL” 的模糊理解外,基本沒有明確的定義。自然, HTAP 的應用場景也是多種多樣且不明確的。這些都導致了 HTAP 成為一個噱頭的趨勢。

1 HTAP 的定義

這裡認為 HTAP 資料庫要成為新的標準和規範,必須儘可能明確定義。實現這一目標最基本的原則是,它必須在技術上不同於過去的經典資料庫 ( 不僅僅是分散式的 ) ,它必須給客戶的數字化程式帶來創新和升級,這包括業務架構、應用架構、資料架構和技術架構。面對這一原則,其定義和界定可以繼續討論,但本文僅提出以下幾點供參考 :

(1) HTAP 資料庫在技術架構和設計目標上,不應該等同於經典的 Oracle MySQL ,或者分散式的 Oracle MySQL 類,因為如果經典的 Oracle MySQL 可以看作是 HTAP( 能夠同時承載事務和分析 SQL” 來衡量,肯定是 ) ,那麼 HTAP 的定義就沒有意義了;

(2 )/ kloc-0/ 的事務和分析任務的執行,應該是讓使用者透明使用,有互不影響的基礎,而不是 AP 多了對 TP 影響大, TP 多了對 AP 影響大,經典的 Oracle MySQL 就是這樣;

(3)HTAP 不應該面向幾個倉庫的純 OLAP 的需求。也就是說,其對企業資料架構的推廣,不應以現階段放棄資料倉儲系統為目標;

(4) Modern HTAP 資料庫,應該是分散式資料庫。

2 HTAP 應用場景

如前所述, HTAP 資料庫應該帶來的是業務和架構的創新和提升,而不僅僅是替換或者效能提升。因此,本文認為 HTAP 的應用場景主要集中在以下兩個方面 :

(1) 分析嵌入式 OLTP( 分析嵌入式 OLTP)

有了 HTAP 資料庫的能力,未來所有的事務型業務系統都應該在業務事務端,天生就有分析能力,不影響事務的效能和資料的一致性。比如風控、營銷或者其他原本需要透過後臺資料平臺端的資料遷移和同步來完成的能力,有相當一部分可以遷移到業務系統端實時完成,成為業務系統的內部功能,使其完成一定程度的業務閉環,這必然是技術驅動的現代業務發展的重要方向。

未來的業務系統應按照這一標準進行設計,這對現代交易系統業務能力的轉型升級具有重要意義。

(2) 為核心的資料超市。

資料倉儲系統大多為 管理 而生,應用很難享受到資料紅利。在大多數企業中,花費大量精力構建資料倉儲系統後,大部分業務系統和工作人員只能透過 請求技術人員協助完成 將資料匯入業務系統 兩種方式來使用資料。這種應用與資料分離的現象,是現在大部分企業長期以來非常關注的痛點。

面對資料消費,在現有資料平臺上構建基於 使用 管理 的資料服務平臺,即資料中心概念的正確解讀,已經成為眾多企業規劃實施中的關鍵創新和升級應用之一。與資料倉儲不同的是,它是為了儲存和管理,而是讓整個企業的使用者自由選擇和消費資料 ( 準確的說是業務整理後的資料資產,這不是本文的重點,讓整個企業享受資料紅利。因此,這裡稱之為資料超市更為恰當。但是,拋開資料資產體系的建立等架構和模型的內容,要用什麼樣的資料庫來託管這個超市呢?

面向資料消費的 SuperStore 不僅承載了來自整個企業的大量高併發面向服務的查詢需求 (QPS TP 型別 ) ,還承載了大量探索性的統計分析需求 (AP 型別 ) 。這個要求顯然不是純 OLAP 資料庫或者 OLTP 資料庫所能滿足的,顯然必須彈性分佈。因此,在過去,相當多的資料服務平臺是透過使用各種型別的資料庫來設計的,以滿足不同的需求。那麼, HTAP 資料庫應該是這個場景的最佳選擇。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70005384/viewspace-2926273/,如需轉載,請註明出處,否則將追究法律責任。

相關文章