國產分散式資料庫怎麼選?我做了三張表格(一)

老魚筆記發表於2020-08-19

“有些資料庫的宣傳與我們實際評測的差距很大!目前,國內可以大規模商用的國產分散式資料庫(我認為)也就三個,從產品成熟度和運維能力來說,XX好些,從技術路線來說,XX好些,從資料庫效能來說,XX好些。

所以,有些猶豫不決,想和您聊聊。請您給我個意見,您認為應該選哪個?”

這是今年上半年某天,某銀行科技部負責人問我的一個問題,也是本選題的由來。

本篇為選題系列文章第一篇:產品佈局篇

科技無國界,被證明就是一個笑話!

晶片、作業系統、資料庫是現代資訊科技領域的三大核心基礎,今天,執行的絕大多數企業應用軟體都離不開資料庫的支援。

相比晶片、作業系統,資料庫是公認最有希望實現彎道超車的,無論是從技術還是市場維度看,都是如此。 傳送門:聊新基建、信創,資料庫不能少!

聊國產分散式資料庫,首先,需要了解國產分散式資料庫都有哪些,每家都有哪些產品和工具,能解決哪些應用場景問題,其產品成熟度及運維能力如何?每家在對資料庫要求最高的銀行業,又有哪些應用?這些問題,恐怕即使身處行業之中的人也未必都清楚。

據傳,國產資料庫產品多達200多個,如何選擇,顯然是個頭疼的問題。

即使真有200多個產品,我也不可能全部梳理一遍,精力有限,只能梳理我還算比較瞭解的一些主流廠商產品,沒有了解的則不在此列,當然如有遺漏也歡迎補充。

既然要梳理,就必須分類,是按應用型別來分?還是按儲存型別來分?還是按原始碼來源來分?這讓我很糾結。

客觀的說,國產關係型資料庫,多源自或者借鑑開源MySQL、PostgreSQL資料庫及其變種,或收購商業原始碼(例如Informix)+自研的方式;大資料平臺,多源自或直接整合開源大資料生態元件,純自研的國產資料庫還是少數。 傳送門:盤點2019:對國產資料庫的一點觀察和總結

按原始碼來分,或許很多人愛看,但可操作性很低,因為,很難核實,如果僅靠捕風捉影道聽途說去寫,顯然又不客觀。

因此,我只能基於應用型別(OLTP\OLAP\HTAP)和儲存型別(關係型\非關係型)來進行劃分。事實上,現在關係型資料庫與非關係型資料庫的邊界也越來越模糊。

根據廠商型別與成立時間不同,我又分了三類(排名不分先後):

第一類:傳統資料庫“老四家”

這一類成立於1999-2004年,屬於國內最早一批做資料庫的公司,與國外資料庫公司產學研分離不同,這批資料庫公司幾乎都是從高校孵化出來,再到市場進行打磨。

1999年,王珊教授領頭成立了國內第一家資料庫公司人大金倉。2000年,華中理工大學(現華中科技大學)教授馮裕才成立了武漢達夢。2004年,南大通用成立,是南開大學下屬的天津南開創元資訊科技有限公司之控股子公司。神舟通用與浙江大學、北航、北京大學、中科院軟體所等高校和科研院所都有深度合作。

從上表可以看出,“老四家”其實並不傳統,無論是OLTP(事務)、OLAP(分析)或是最時髦的HTAP(混合)場景,都有對應的產品或解決方案。如果你的認知,還停留在“老四家”只能應用於OLTP場景,沒有分散式資料庫,那就OUT了。

從產品佈局看,老四家特點很顯著,專注關係型資料庫市場,在非關聯式資料庫領域基本沒有什麼產品佈局,只有達夢有個圖資料庫。

達夢在OLTP方面,有DM8+DSC(對標Oracle RAC)和DM8+DataWatch(對標Oracle DataGuard),DSC+ DataWatch能做同城雙中心,DSC+DataWatch+DMHS能做兩地三中心。在OLAP大資料分析方面,達夢有DM8+MPP(對標Oracle Exadata)。去年,達夢分散式資料庫DMTDD與DM8一起釋出,今年,又釋出了雲資料庫產品啟雲資料庫。

人大金倉在OLTP方面,有KingBase ES,在OLAP方面,有KingBase Analystics DB,在HTAP方面,有分散式資料庫KSOne。去年,人大金倉獲2018年度國家科學技術進步二等獎。

南大通用在OLTP方面佈局的GBase 8s,具備兩地三中心高可用,實施了多個共享儲存叢集案例。在OLAP方面,有大家熟知的GBase 8a分散式並行資料庫。在HTAP方面,有GBase UP。在2018年至2019年,南大通用連續兩年入選Gartner分析型資料庫管理解決方案魔力象限。

神舟通用在OLTP方面,有神通資料庫,在OLAP方面,有神通Kstore+神通K-Cuber,在HTAP方面,有分散式關係型資料庫神通(MPP叢集版)。值得一提的是,2003年,神通公司以神舟軟體資料庫事業部啟動市場化運作,北斗全球運控系統及地面監測系統,就是以神通資料庫為後臺支撐。

其實,傳統“老四家”可以說就是國家隊,尤其是達夢、人大金倉、神舟通用,達夢背後是中國電子資訊產業集團(CEC),人大金倉背後是中國電子科技集團有限公司(CETC),神舟通用隸屬於中國航天科技集團(CASC)。

雖然雲資料庫有很多優勢,崛起之勢不可擋,但能夠進行國產替代的,我認為應該還是傳統資料庫為主,而非雲端資料庫,且大機率在黨政軍、事業單位等進行國產替代,特別是一些承擔民生、國防等核心資料的產業。

第二類:大廠雲集的“雲資料庫”

這一類因雲端計算的興起而出現,成立時間在2009-2011年,本文只列出頭部的三大玩家,其他雲端計算公司不是沒有資料庫,此處未列入,一是精力有限,二是與這三家相比,無論從資料庫產品線的豐富程度還是自研投入、產品成熟度、運維能力等各方面,都還有一定差距。

阿里雲、騰訊雲、華為雲等雲端計算巨頭的崛起,不僅帶動了各類基礎軟體開始雲化轉型之路,也讓資料庫的邊界開始變得模糊。在蠶食國外資料庫廠商市場份額的同時,傳統國產資料庫的一部分市場份額也在被雲企瓜分。

雲資料庫並非是一種全新的資料庫模型,與傳統資料庫區別在於銷售和交付模式不同,是以雲服務的方式來銷售及交付。雲資料庫天然具備靈活性,豐富多樣的產品體系、經濟高效的部署方式和按需付費的支付模式。

眾所周知,資料庫是最重要的基礎雲服務之一,已經成為雲服務商的核心競爭力之一,屬於兵家必爭之地。

從上表看,雲巨頭的資料庫產品線更完整,無論在關係型資料庫還是非關係型資料庫領域都有佈局,工具生態方面也很豐富,在品牌及技術宣傳方面更是要強於其它兩類企業。

阿里雲是國內去IOE先驅和成功典範,2018年,在Gartner釋出的資料庫魔力象限中,阿里雲是首個進入遠見者象限的中國公司。2019年,阿里雲連續進入Gartner資料庫魔力象限,獲得挑戰者象限第一名的位置。

在OLTP方面,阿里雲分別有自研的雲原生分散式資料庫PolarDB和螞蟻金服自研的分散式資料庫OceanBase,這2個產品都有雙11背書,風頭很勁。其中,OceanBase兩次重新整理了TPC-C的世界紀錄。在OLAP方面,有實時分析資料庫AnalyticDB,包攬TPC-DS、TPC-H全球第一。在HTAP方面,不僅有AnalyticDB,其實OceanBase也有HTAP特性。今年,OceanBase已經成立了獨立的公司。

在NoSQL方面,阿里雲有自研的GDB圖資料庫和TSDB時序資料庫。

騰訊雲在OLTP方面,有云原生分散式資料庫CynosDB和分散式資料庫TDSQL,也不可小覷。去年Gartner釋出的研報顯示,騰訊雲資料庫市場份額增速達123%,位列國內所有資料庫廠商之首。張家港農商銀行新一代核心系統就是基於TDSQL,在OLAP和HTAP場景方面,則有分散式HTAP資料庫TBase,並且在去年已經開源。

在NoSQL方面,騰訊有圖資料庫TGDB,也有CTSDB時序資料庫,還有TcaplusDB鍵值資料庫。

華為雲今年上半年最大的動作,是將GaussDB併入,並對自研資料庫進行品牌調整,在OLTP方面,華為雲有GaussDB(openGauss)(基於openGauss核心,增強分散式能力的商業版本)、GaussDB(for MySQL)(基於華為最新一代DFV分散式儲存,採用計算儲存分離架構)、GaussDB(for PostgreSQL)(基於華為最新一代DFV分散式儲存,採用計算儲存分離架構)。其中openGauss已經開源,在OLAP方面,有GaussDB(DWS)。

在HTAP方面,華為雲認為HTAP只是一種細分使用場景,並且不建議把OLTP和OLAP業務完全混合,認為在典型的OLTP處理場景就使用面向OLTP設計的資料庫,否則,既達不到OLAP的擴充套件性,又無法滿足OLTP的實時、高效能等要求。

在NoSQL方面,華為雲有自研的全分散式架構多模NoSQL資料庫GaussDB NoSQL(原名GeminiDB),支援四種資料模型文件、寬列、時序、K-V。

阿里雲、騰訊雲、華為雲都是大廠背景,資本雄厚,不缺資源,追求的是完善豐富的產品體系來滿足各種使用者的需求,更在意的是迅速佔領市場,拉開與對手的差距。

對於不能接受公有云的政企行業客戶,目前這些雲巨頭的解決方案大同小異,都是混合雲。混合雲的本質是用公有云的同一套架構或API來做混合雲。透過混合雲,不僅可以滿足客戶,機房、資料在本地,自主管理運維的需求,客戶還能在本地資料中心享受到與公有云一致的雲服務。

雖然雲資料庫在企業中的應用是大勢所趨,但要讓企業放下顧慮,積極上雲,甚至完全擁抱雲,還有很長的路要走。 傳送門:國內首份《雲資料庫選型及滿意度調查報告》

第三類:新興資料庫

這一類廠商既有專注於資料庫領域的初創公司,也有通訊、伺服器方面的巨頭跨界,但其企業成立時間或推出資料庫產品時間,普遍在2011年之後。新興資料庫公司不斷湧現,以及其他領域公司向資料庫跨界情況的增多,使國內資料庫市場更加繁榮和活躍。

從上表看,大部分新興資料庫公司,做資料庫的歷史或許不如“老四家”悠久,佈局也沒有云巨頭完整,但勝在更為聚焦,都有其獨特的競爭優勢。

目前,國內最火的分散式HTAP資料庫TiDB,理論基礎來源於2013年Google釋出的Spanner/F1論文 ,以及2014年Stanford工業級分散式一致性協議演算法Raft論文,並透過開源方式獲取全球使用者的信任,替其站臺的企業非常多,網上有大量遷移及應用實踐的教程文章,其創始人也經常撰文投稿。

易鯨捷,是今年上半年的人氣小生。4月1日,基於易鯨捷分散式資料庫搭建的貴陽銀行核心交易“沙箱”系統上線,在今年全國兩會期間,獲六名全國人大代表聯名提案,就是以易鯨捷資料庫在貴陽銀行核心系統上線為例,建議逐步擴大金融領域資料庫國產替代試點。

在OLTP方面,易鯨捷有分散式資料庫QianBase(錢庫),名字相當直白,定位就是金融級分散式資料庫。在HTAP方面,有分散式資料庫EsgynDB。

星環在新興資料庫公司中算是一個另類,是全球首個完整透過TPC-DS基準測試的公司,據說OceanBase都上門取經。並且,星環在新興資料庫公司中,是唯一一個在關係型資料庫和非關係型資料庫方面都有佈局的公司,在OLTP方面,有分散式交易資料庫KunDB,在OLAP方面,有Inceptor、分散式快閃記憶體資料庫ArgoDB。在NoSQL方面,StellarDB(圖資料庫)、NewSearch(文件資料庫、時空資料庫)、Hyperbase(鍵值資料庫)。

中興GoldenDB,定位金融級交易型分散式資料庫,聽名字就很清楚,顯然更偏重OLTP分散式資料庫方向,當前主攻市場是金融行業。

值得一提的是,在資料庫方面,中興有著17年的相關技術積累。早在2002年,中興就啟動了資料庫相關技術的研發,包括檔案資料庫、記憶體資料庫和分散式資料庫等產品,並已經大規模服務於電信和智慧城市領域。2014年,中興啟動GoldenDB的研發。產品應用於多家銀行的業務系統中。目前,中興擁有一支超過500人的資料庫研發團隊,累計申請核心專利100多件。

GoldenDB最出名的案例是中信銀行,產品應用於中信銀行賬務核心業務系統及銀聯資料信用卡核心專案。

浪潮分散式資料庫K-DB的優勢在於軟硬一體,起源於專為天梭K1小型機定製最佳化的資料庫,目前,已能夠支援X86平臺,以及飛騰、申威等國產晶片平臺。其推出的inData資料庫一體機,專為HTAP設計,實現近千萬級IOPS和微秒級延時響應。

曾經K-DB技術開放日北京站那句“你若赴約,我必不負!”想必很多人還記憶猶新。在這業內首場“DBA Party Show”上,邀請了眾多知名DBA對K-DB進行了體驗,其邀請函被大咖認為是技術領域最具詩意的邀請。

巨杉資料庫SequoiaDB,定位金融級分散式資料庫,自2011年起自研原生分散式引擎,核心團隊來自IBM DB2,基於計算儲存分離架構,提供I/O互不干擾HTAP能力,已連續三年入選Gartner資料庫報告。獨特的引擎級多模設計,基於同一份資料可支援MySQL、PostgreSQL、MongoDB、SparkSQL相容協議的跨引擎事務一致性。

熱璞,是一家專注分散式事務資料庫和關係型雲資料庫的產品研發公司,於2012年創始團隊自籌數千萬資金為天使,後於2017年獲得PreA、2018年A輪的融資,其產品HotDB定位於OLTP業務場景,在等同集中式資料庫的事務一致性和透明性、全域性唯一約束、分散式鎖、資料分片設計智慧AI、產品化等方面基礎功能做的紮實。其創始人參與主導分散式資料庫Cobar、中國聯通DaaS平臺、分散式資料庫MyCAT等,在金融等多個行業有頗多案例。

總的來說,三大類公司都有自己的分散式資料庫產品,唯一區別在側重的場景不同,這也導致產生了多個不同技術路線和技術流派,比如分散式柔性事務、分散式強一致性事務。比如:OceanBase、HotDB就屬於分散式強一致性事務。TDSQL、GoldenDB、GaussDB等就屬於分散式柔性事務。而TiDB、SequoiaDB、EsgynDB屬於專注HTAP多模資料庫產品。

下篇預告:

這些公司上半年都做了什麼?簽了哪些客戶?

這些公司產品都在哪些銀行的哪些業務應用?

很多內容將會是第一次被披露,敬請期待!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/11310314/viewspace-2712810/,如需轉載,請註明出處,否則將追究法律責任。

相關文章