金山雲資料庫之路

魚論發表於2022-06-16

DragonBase是金山雲研發的新一代分散式雲原生資料庫,這是金山雲新聞稿中的描述。

金山雲於2016年在公有云上釋出了DragonBase單機版,並在2020年釋出了DragonBase分散式2.0版本。在2020年以前,金山雲幾乎沒有對外宣傳過DragonBase資料庫產品,業內知道的人較少,這點通過搜尋引擎搜“DragonBase”就能一目瞭然。

2020年以來,金山雲在資料庫領域變得活躍,在加大其核心分散式資料庫產品DragonBase宣傳力度的同時,佈局資料庫細分領域生態合作,例如為優化資料庫產品體驗,與海量資料達成戰略合作,投資偶數資料庫等。

那麼,金山雲分散式資料庫DragonBase具體是什麼樣的資料庫?在資料庫領域默默耕耘五年的金山雲,為何在2020年變得活躍起來?金山雲針對資料庫的發展有怎樣的思考,在產品上又有什麼新的佈局?

近日,在DTCC2020大會上,老魚採訪了金山雲資料庫資深架構師張健。

上雲已經是大勢所趨。Gartner指出,雲將主導資料庫市場的未來,到2022年將有75%的資料庫遷移或部署在雲平臺。

對公有云廠商來說,作為三大系統軟體之一的資料庫,其重要性不言而喻。張健說,金山雲作為獨立的雲服務商,技術立業為本,構建完備的雲端計算基礎架構和運營體系,結合先進技術(如AI、大資料、物聯網、區塊鏈、邊緣計算等等)提供各行業服務解決方案。資料庫作為公有云的核心基礎產品之一,不僅起到承上啟下聯動SaaS和IaaS服務的作用,也能橫向貫通PaaS服務體系,應用極其廣泛,資料管理價值極其重要,資料庫技術投入是長期的技術價值儲備和業務價值佈局。

金山雲認為資料庫是雲廠商必備的核心技術能力。

2016年,金山雲開始佈局資料庫,併發布DragonBase單機版,2017-2018年,深度優化單機版本穩定性和效能,釋出資料庫遷移工具DTS,2019年釋出DragonBase分散式1.0版本,支援分散式事務、分散式計算、完善備份恢復體系,2020年釋出升級版本2.0,優化分散式事務,擴充套件分散式計算,優化高可用方案,提供彈性擴容、資料強一致、安全審計、雲管平臺和資料遷移等諸多核心能力,正在研發的DragonBase3.0版本將在Oracle相容、分散式計算引擎和自動化運維等方面進行迭代。

DragonBase,這個名字其實想了很久,張健說。飛龍在天,龍騰雲霄,龍寓意吉祥和力量,而金山雲是正好是家雲端計算公司,恰到好處,因此我們給資料庫命名為DragonBase,也包含了我們的產品願景。

事實上,金山雲正在全面佈局資料庫產品矩陣,在基礎資源相容方面,支援物理機、虛機和容器化部署,支援X86平臺和主流ARM平臺,儲存型別支援本地磁碟、雲盤和分散式儲存系統;在資料庫型別方面,包括關係型資料庫MySQL、PostgreSQL和SQL Server等,鍵值資料庫Redis、Memcache和Cassandra,文件型資料庫MongoDB,時序資料庫InfluxDB;在資料庫管理平臺建設方面,包括接入服務、管控服務和資料服務。

談到DragonBase的競爭優勢,張健表示,在分散式資料庫雲化能力建設方面,既可對標網際網路大廠,也可對標新型資料庫公司和傳統資料庫公司,金山雲具備原生的雲化部署能力,既支援自有平臺部署,也支援基於第三方平臺部署。

對於強依賴公有云基礎設施的資料庫產品,獨立私有化部署涉及關聯服務剝離,開發和維護成本很大。金山雲DragonBase實現公有云和私有云工程同源,雙線並行,減少外部依賴,降低運維成本,靈活對接公有云部署和私有云部署。

相比網際網路大廠的雲原生分散式資料庫,金山雲DragonBase有自己獨特的競爭優勢,憑藉其原生的雲化部署能力同時支援自有平臺和第三方平臺,基於同源工程低成本支援公有云和私有云部署,配合雲基礎設施優化效能實現高價效比,在多個應用場景下落地並取得不錯的成績。

相對於傳統資料庫公司,金山雲作為一家雲端計算公司,其完善的雲基礎設施,可提供包含資料庫在內的行業解決方案和服務能力,具備其先天的競爭優勢。

對於新型的NewSQL資料庫,把關係型和非關係型資料庫的特性相結合,在兼具兩者優勢的同時,也放棄了兩者的部分特性,有得有失。

張健強調,目前DragonBase已在金融、網際網路、公共服務、遊戲等多領域實踐應用。

專訪最後,對於分散式資料庫選型,張健還提供了三點建議:

第一,業務需求與分散式資料庫的匹配度。包含兩個方面,一方面是功能匹配度,包括資料庫功能支援範圍(如協議支援、語法支援、功能支援及擴充套件功能支援等等)和業務適配分散式資料庫的改造代價;另一方面是非功能性匹配,需要考查資料庫的擴充套件能力、併發吞吐能力、訪問時延、故障容災高可用能力和資料安全保障能力等方面;

第二,業務遷移成本。需要考慮新業務遷移到分散式資料庫的開發標準約束,原有業務遷移分散式資料庫的過程中,如何保證資料的正確性,如何控制對業務的影響範圍;同時,一般資料庫遷移會保持一段時間的雙系統並行執行一年甚至兩年的時間,業務相容分散式資料庫和原有資料庫的工程維護代價一般較大,原有資料庫到分散式資料庫間的資料同步挑戰也很大;此外,還需要控制分散式資料庫對硬體和環境的依賴成本;

第三,業務運維複雜度。需要考慮分散式資料庫運維平臺的對接,考查分散式資料庫自運維能力、審計能力、監控精確度和快速定位能力等。當無法自運維時,需要考查服務廠商後期能提供的運維服務和培訓服務。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/11310314/viewspace-2747428/,如需轉載,請註明出處,否則將追究法律責任。

相關文章