萬里資料庫是一家怎樣的公司?

魚論發表於2022-06-16

       去年的一鳴驚人,讓萬里資料庫開始進入大眾視野。

  2020年7月15日,中移動資訊科技有限公司自主可控OLTP資料庫聯合創新專案公示中標候選人,其中主備式資料庫標包:南大通用、人大金倉、阿里雲端計算中標份額分別為50%、30%、20%;分散式標包:萬里開源、中興通訊中標份額分別為60%、40%。

  相比其它4家在資料庫領域耳熟能詳的公司,萬里資料庫公司就顯得有些陌生,但其在分散式標包中標份額高達60%,卻大大超出市場預期。因此,安信證券研報稱萬里資料庫是國產資料庫最大黑馬。

  2020年9月21日,萬里資料庫中標中國光大銀行“開源資料庫軟體現場服務選型入圍專案”。

  2020年12月,萬里資料庫中標2020-2021年聯通沃音樂大資料服務專案。

  2020年12月,萬里資料庫又入圍國網資訊通訊產業集團有限公司2021年度的框架採購專案。

  ……

  連續中標競爭激烈的知名大型企業,出現在一家名不見經傳的公司身上,讓人不禁好奇,萬里資料庫到底是家怎樣的公司?一鳴驚人的背後又有著怎樣不為人知的故事?

萬里資料庫是一家怎樣的公司?

  12月,萬里開源進行品牌升級,正式啟用“萬里資料庫”新品牌,英文名稱為“GreatDB”,藉此機會,老魚專訪了萬里資料庫聯合創始人林韶賓。

  雖然早就對林韶賓有所耳聞,但第一次真正見面還是在去年的12月。

  12月18日的北京,寒潮來襲,已經極為寒冷,但在建外SOHO東區B座32層的萬里資料庫多功能會議室內卻溫暖如春,略微有些凌亂的髮型、運動鞋,語速不快,真誠坦率,是老魚對林韶賓的第一印象。

  林韶賓,國內最早的分散式事務庫開發者及商業化實踐者之一,有著10年資料庫開發經驗和5年銷售經驗。2006年-2009年,一直從事MySQL Dev & Support工作,2010年-2013年,主導研發了萬里資料庫第一代Share Nothing 架構分散式資料庫。2013年,成為公司合夥人,後負責市場及銷售,開拓了通訊、金融、電力等行業客戶。2018年,迴歸技術,帶隊負責新版本雲原生分散式資料庫開發。

  “我是研發中最懂銷售的,銷售中最懂研發的。”林韶賓笑著說,也正因為如此,被同事親切的稱之為研發銷售的知心大哥。

    GreatDB前世今生

  萬里資料庫並不是一家新興企業,而是有20餘年積澱,專注於自主可控資料庫和作業系統研發和服務的老牌企業。

  或許是因為技術基因過重,公司更專注於產品研發,萬里資料庫的品牌知名度甚至還不如其控股的全資子公司拓林思(Turbolinux ,國內最早從事Linux產品化的公司)。

  很多人或許並不知道,萬里資料庫是國內最早從事國際主流資料庫核心研發的本地團隊,其資料庫技術底蘊主要來自於從2006年開始與MySQL AB合作成立的MySQL中國研發中心。

  2008年,MySQL被Sun收購,萬里資料庫繼續與Sun開展資料庫研發合作。在此期間,萬里資料庫技術團隊負責當時MySQL的Replication新功能開發、NDB Cluster新功能開發、大量BUG修復以及中文手冊的編譯等工作。

  2009年,Sun被Oracle收購,萬里資料庫繼續與Oracle合作研發一段時間後終止合作,並於2010年開始獨立自研分散式事務型資料庫(GreatDB)。這在當時是具有前瞻性的,因為國內還沒有一款分散式資料庫,還是一片藍海市場。

  林韶賓說,堅定的選擇分散式資料庫方向,主要基於業務和技術兩方面的考慮,技術上,主要是受到雲端計算的啟發,團隊認為彈性化、分散式是資料庫發展大勢。而當時MySQL的NDB Cluster資料庫是記憶體型資料庫,購自愛立信,是根據瑞典的人口基數設計的,因此,架構上決定了併發和資料量上限等不能滿足中國使用者的需要。

  從業務角度看,Oracle等傳統資料庫廠商已牢牢佔據集中式資料庫市場,只有另闢蹊徑才有新出路。

    GreatDB第一個客戶

  做基礎軟體,是個苦活累活。相比於應用軟體,基礎軟體的技術含量高得多,熬得年頭也長,累得死去活來,實際收益卻很低。

  從2010年開始研發到2013年上半年,是一段艱難的日子,萬里資料庫主要是依靠氣象局、UT斯達康等客戶的MySQL定製化開發和服務支援來支撐GreatDB的研發。

  好在2013年下半年, GreatDB終於迎來了第一個客戶——河南移動。在河南移動流量經營分析系統中,原始資料庫非常龐大,初步統計完的資料需要儲存到資料集市層,這樣的資料量級,單機資料庫解決不了。因此,當時決定使用萬里資料庫GreatDB。

  林韶賓說,當時應用廠商希望把這個專案作為標杆專案,向全國省移動去推廣。壓力挺大,因為當時的GreatDB並非現在,還並不成熟,很多功能都是現開發、現改BUG。那段時間,團隊幾乎與應用開發商天天吃住都在一起,每天只睡三四個小時,連續三個月。最終,產品滿足客戶需求,系統執行極其穩定。

  市場一旦開啟缺口,接下來就是水到渠成。繼河南移動之後,GreatDB在北京移動、四川移動、廣東電信、山東移動等客戶上相繼應用。

  基礎軟體需要時間積累,更需要不同場景的應用打磨。林韶賓說,GreatDB在多個客戶測試中效能領先,例如:在某超大型國企資料庫聯合創新專案中,我們的分散式資料庫在TPCC效能指標方面測試結果優良。

  “如果沒有之前在資料庫方面長時間的技術積累,短時間內是不可能做好的,因為效能不是一下子就能優化上去的。”林韶賓說。最終,GreatDB在綜合排名第一,滿足了客戶提出的效能要求。這從側面也證明了萬里資料庫的產品技術能力過硬。

    GreatDB混沌測試工具

  河南移動流量經營分析系統能穩定執行多年,在林韶賓看來,產品穩定是來源於充分的測試。

  對於林韶賓這樣的資料庫開發老炮,研發過程中最大的痛點不是解決問題,而是發現並重現問題,如何保障產品的穩定性?涉及分散式產品測試,與以往單機不同,分散式架構有許多故障組合,尤其是機器多了以後,計算、儲存節點,包含對上下游工具的相容等,都會導致一系列行為的不同。

  GreatDB追求的目標是極致易用、極致穩定、極致效能。易用能提升客戶體驗感,穩定是資料庫的剛需,高效是對效能的極致追求。林韶賓說。

  因此,GreatDB追求與單機資料庫相同的使用者體驗,但分散式架構會導致故障複雜度呈指數級變化。最初,團隊選擇一些測例去跑,但這並不能反映實際業務場景,因此,林韶賓覺得需要一種全新思路去做測試。

  其次,效率是個大問題,因為,人工測試做起來效率太低,故障組合根本測不完。

  為此,林韶賓帶著團隊研發攻關了很久,最終倒騰出了一個牛逼的東西“混沌測試工具DBomb”,通俗的說是一個分散式測試框架,它解決了分散式資料庫測試的大難題,能隨機模擬各種故障,不僅包含了各種故障測例,更包含了使用者提出的各種奇葩測試,通過開發介面,能讓產品測試自動化,非常靈活。林韶賓說。

  萬里資料庫的理念是“資料丟失0容忍、業務波動0容忍”,通過這些年在眾多企業級客戶的POC和應用部署,萬里資料庫積累了大量的應用場景和實踐經驗,團隊都會將行業標準POC和使用者測試用例整合到DBomb中。

  每一次產品的迭代更新,都會使用DBomb模擬不同的場景和故障,歷經非常多的測試,為GreatDB產品在穩定性上提供了極大的保障。

    GreatDB的進化

  GreatDB現在是原生分散式資料庫。

  從國內分散式事務的實現角度,林韶賓認為是從開源資料庫+中介軟體(1代)到原生分散式(2代)的演進。

  1代中介軟體型,是GreatDB早期嘗試過的一個形態,有長期適用的場景,有些場景下效能更有優勢,靈活性更好;但是中介軟體型分散式對應用開發限制較大,比如SQL語法支援差、儲存過程等資料庫物件支援較差、資料需要強制分佈等。其次,中介軟體型的分散式易用性也較差,運維複雜,對於事務支援不完整代價極大。

  林韶賓說,GreatDB現在進化到了2代原生分散式,在SQL語法、資料庫物件等更易實現。事務完整性得到更好解決,對應用開發幾乎無限制。

  GreatDB還針對中國企業級市場的需求,改進了事務模型,從吞吐和延時兩個維度改進了效能。從使用者角度出發,對2代原生分散式資料庫進行了增強,林韶賓把它定義為新一代分散式資料庫。

  雖然GreatDB已經是原生分散式資料庫。但林韶賓卻並沒有否定中介軟體型分散式的存在價值。

  林韶賓說,“我們不能去否定中介軟體這種架構,因為它有生存空間。比如:對於某些業務查詢比較簡單,中介軟體在效能上可能會更好,因為對事務的損耗會小些。”

  從長期來看,如果原生分散式資料庫發展越來越好了,中介軟體形態的分散式遲早是要消亡的。但絕不是在兩三年之內,林韶賓說。

    GreatDB機遇與挑戰

  進入到2018年,越來越多的巨頭進入到資料庫賽道,打破了萬里資料庫“小而美”的生存發展模式,這讓林韶賓及其團隊產生了極強的危機感,如果不能快速的做大做強,GreatDB必然會被淹沒在競爭的洪流當中。

  與此同時,林韶賓也看到信創的機會越來越明顯。根據民生證券的研究報告,因為國產替換將帶來十倍以上的資料庫增長空間:假設至2024年完成替換,按100%替換計算,則合計市場增量為626億;若按50%替換計算,則新增空間235億。

  從這兩點看,引入資本就成為必然的選擇。在綜合考慮之後,萬里資料庫引入了創意資訊作為股東。

  創意資訊是A股上市公司,不僅為萬里資料庫帶來資本加持,同時作為大型的系統整合商,也給萬里資料庫帶來了更大的市場和渠道,兩者目標客戶有重合,可以相互借力,這就是萬里資料庫引入創意資訊的緣由。

  有了好的產品,過硬的技術團隊,又有上市公司資金加持,這讓萬里資料庫具備了與巨頭競爭的實力。

  對於萬里資料庫的定位和市場機會,林韶賓有著清晰的認知,國內資料庫市場未來會形成至少2個梯隊。第1梯隊是網際網路巨頭,萬里資料庫的目標是做第2梯隊領頭羊。

  為什麼網際網路巨頭之外,還能有第2梯隊,林韶賓指出,客戶去O是為了避免被外資大廠捆綁,同樣也不願意接下來被另外的巨頭捆綁,這就給萬里資料庫這樣的獨立資料庫廠商提供了市場空間。

  當前,對於萬里資料庫而言,最重要的是做好產品與服務,滿足客戶需求,提升客戶滿意度。

  截至目前,萬里資料庫已在中國移動智慧中臺(西藏工程)專案、山東移動資料中臺等專案完成上線。與光大銀行、光大科技基於GreatDB原始碼聯合研發了EverDB資料庫,並在光大銀行雲繳費、統一支付等系統進行推廣應用。與國網聯合研發的自主可控資料庫已經支撐國家電網眾多業務系統建設,覆蓋了集團總部、27家網省公司及節能服務公司、信產集團等直屬單位,服務於國網營銷、發展、人資、財務、信通等多個業務部門。

  如今國內資料庫市場格局,哪家能笑到最後,現在還無法妄斷,但越到最後,勢必競爭就會越激烈越殘酷。

  對於已經初露崢嶸的萬里資料庫,你們怎麼看?



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70018962/viewspace-2900977/,如需轉載,請註明出處,否則將追究法律責任。

相關文章