雲原生時代,資料庫該何去何從?

qing_yun發表於2023-01-09

雲端計算在各行各業的應用越來越深入,雲正在加速重構IT基礎設施。Gartner預測,部署在雲原生平臺上的數字工作負載將由 2021 年的 30%增長至2025 年的95%。

資料庫作為IT基礎設施的底座,正搭乘雲時代的列車不斷前進。上雲成為非常明確的資料庫發展趨勢,根據IDC《2021年下半年中國關係型資料庫軟體市場跟蹤報告》顯示,2021下半年中國公有云關係型資料庫規模8.7億美元,同比增長48.7%。

在雲原生時代,客戶需要什麼樣的資料庫?資料庫會如何演進?日前,IT168&ITPUB與矩陣起源Global CTO田豐就相關問題展開了對話,他認為,雲原生時代,資料庫將向平臺化發展,MatrixOne所代表的超融合技術路線將大有可為。

長在雲上的超融合資料庫

資料成為新的生產要素,挖掘資料價值助力企業經營決策成為企業剛需。在雲原生時代,資料量爆炸式增長,需要更為高效的資料處理能力,對資料庫提出了更高的要求。

田豐指出,隨著企業上雲不斷深入,最終大部分業務應用可能都會上雲,這些應用中存在大量的事務、分析、流處理等資料處理需求。此外,隨著更多的新應用出現,尤其是IoT領域的新應用不斷髮展,物聯網裝置產生的資料呈爆發式增長。面對多樣化的資料處理需求,以及物聯網資料爆發帶來的新需求,企業需要增強資料處理能力,既可以透過部署多種資料中介軟體來擴充關係型資料庫的能力來解決,也可以選擇一個超融合資料庫來解決。

“企業希望所有的資料在一個統一的資料平臺裡進行統一管理,像是一個資料作業系統,我們希望透過融合為客戶複雜多樣的資料應用需求提供一種極簡的解決方案。”帶著以上這些思考,2021年成立的資料庫創業公司矩陣起源自研了MatrixOne超融合資料庫,並提出了HSTAP的超融合理念。

此前,IT168&ITPUB曾經報導過MatrixOne資料庫,矩陣起源所提的HSTAP中的“S”指的是串聯AP和TP的Streaming能力,即在HTAP資料庫內部實現了資料庫內建流處理能力。透過一種創新的架構實踐極簡理念,把資料庫的複雜度留給產品的研發階段,而把簡單、易用、好用的最終體驗帶給使用者。

實際上,MatrixOne是一款雲原生、分散式的超融合資料庫。今年,MatrixOne資料庫在工程方面取得了突破,最新版本MatrixOne 0.6在產品層面已經基本具備超融合能力,團隊的設計理念在工程上基本實現,架構層面儲存計算分離、分散式事務、資源隔離、分析查詢等資料庫基礎能力已經具備,MatrixOne進入到實際應用階段。

作為一款雲原生資料庫,MatrixOne可以很好地執行在K8S上,是長在雲上的資料庫,支援將資料持久化到共享儲存,相容不同的協議,如S3,HDFS,Ceph等。無論使用公有云、私有云還是混合雲,都可以接入合適的共享儲存。MatrixOne抽象出了一層FileService,它為上層提供一個統一的介面來訪問這些多樣化的儲存資源,對呼叫方遮蔽了不同儲存的差異和複雜性。MatrixOne可以根據雲上不同的硬體能力進行編排,充分利用雲的特性以獲取更優的效能和價效比。

在架構實現上,MatrixOne 採用存算分離架構並做了比較徹底的解耦,儲存層、資料層、計算層分離,使得 MatrixOne 在遇到系統資源瓶頸時,能夠靈活實現節點的擴容。同時,多節點的架構下,資源可以更高效分配,一定程度上避免了熱點與資源爭用。

作為一款融合型資料庫,資源隔離的挑戰非常大,是架構設計的重點和難點。目前,無論是TP與TP,AP與AP,TP與AP,MatrixOne 都實現了很好的隔離,最小化不同負載之間的干擾,獲得更好的效能。如,其分散式事務採用了樂觀事務與快照隔離,快照隔離級別比常見的Read Committed 讀已提交更加嚴格,既可以有效防止髒讀,又能夠更好地適配分散式樂觀事務。AP和TP不同的負載在不同物理節點執行,避免相互干擾,保證事務層級的正確性。

“我們希望最終能夠為客戶創造價值,從這個角度來講,MatrixOne 會往更高效、更一致的整合、更簡化的管理,以及資料治理方面發展,為客戶提供一個更好的價效比。”田豐強調,MatrixOne相比其它超融合資料庫,從第一天就更注重資料庫的自我管理、自適應、自調優,而且從頭開始研發沒有歷史包袱,進展會更快一些。

未來資料庫的演進方向

隨著MatrixOne在工程方面不斷進步,MatrixOne團隊對資料庫架構路線的發展越來越清晰。田豐指出,云為異構硬體帶來很大的自由度,不論私有云、公有云還是混合雲,會有各種不同功能的新硬體出現,比如CXL大記憶體系統,MatrixOne會與相關廠商合作,利用新硬體的特性實現資料庫更好的功能、效能,達到更好的價效比。此外,在利用物件儲存等雲平臺能力方面,MatrixOne也會加大投入以更好發揮雲的優勢。

長遠來看,客戶對分散式資料庫的靈活部署、動態擴充套件規模以及價效比都會有越來越高的需求。從應用上來講,分散式資料庫會越來越重要。MatrixOne會不斷加強其分散式能力,降低運維複雜度。

Serverless是資料庫技術發展的熱門話題,被認為是雲原生資料庫的下一站,所謂Serverless並不是沒有伺服器,而是伺服器無感知。田豐強調,MatrixOne本身是雲原生資料庫,但是也支援Serverless化,可以根據客戶需求按需部署。他指出,Serverless解決的實際是管理問題,對使用者遮蔽掉了硬體管理的細節。Serverless資料庫應該具有以下幾個特徵:

一是,Serverless資料庫不再繫結硬體,不論虛擬機器還是物理機,都不再繫結機器,可以實現動態擴縮容。二是,Serverless強調計算儲存分離。三是,Serverless要有比較好的容錯設計,當Server崩潰掉或者從一個地方挪到另一個地方,整個過程能夠平滑遷移。

未來,MatrixOne會繼續打磨產品,提高產品的效能和穩定性,為客戶提供真實的價值。“不管我們內部怎麼做,最終結果一定要簡化使用者(DBA、開發者)的工作,對使用者來講,他們是看到一個更簡單的資料平臺,我們把複雜度儘量內部消化。”田豐認為,客戶應用的複雜度主要有兩種,一種是業務邏輯自身比較複雜,另一種並不是業務邏輯本身產生,而是使用的平臺工具帶來的複雜度。MatrixOne希望把第二類非業務上的複雜度降到最低,給客戶提供一個簡單、易用、高效的資料庫,讓使用者把更多精力放到業務應用上。

把複雜留給產品,把簡單、易用留給客戶,這應該是所有資料庫廠商的願景,新的資料庫架構將會為這個市場帶來哪些驚喜,還需要在更多真實場景中試煉。目前,已經有很多工業、能源等海內外企業向MatrixOne提出了明確的需求,接下來MatrixOne會與客戶一同成長,一起打磨產品。我們期待明年MatrixOne 1.0版本正式釋出,MatrixOne能夠取得更大的突破。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69925873/viewspace-2931327/,如需轉載,請註明出處,否則將追究法律責任。

相關文章