浪潮云溪資料庫陳磊:國產資料庫足以撐起高階市場大梁!

資料庫頻道發表於2021-10-21

“國產資料庫現在應該能夠挑起國內高階市場的大梁,只是這些高階的應用對國產資料庫廠商需要有一個驗證、建立信任的過程,應用也需要改造,這個過程可能比較長或成本比較高。我覺得可能用不了五年,就能夠有些成功的案例。”浪潮云溪資料庫研發副總經理兼產品負責人陳磊在參加第十二屆DTCC中國資料庫技術大會時發出了這樣的看法。

作為一款由浪潮集團自主研發的國產化雲原生分散式資料庫,浪潮云溪資料庫已經是第二次亮相DTCC的大會舞臺,云溪資料庫自立項釋出以來就聲音不斷,尤其在今年更是捷報不斷:今年3月份,浪潮云溪資料庫成功中標國家工業網際網路分散式資料庫專案;4月份西電-浪潮資料庫創新實驗室正式成立;今年上半年云溪資料庫也進行了開源...

在剛剛結束的DTCC大會現場,浪潮云溪資料庫研發副總經理兼產品負責人陳磊以《浪潮云溪分散式資料庫3.0》為題發表了精彩分享,又透露出一個大訊息:浪潮云溪資料庫3.0版本將於明年年初正式釋出。

浪潮云溪資料庫研發副總經理兼產品負責人 陳磊

很多朋友也比較關心浪潮云溪資料庫近兩年的市場動向、未來的發展規劃以及對於資料庫市場的獨特見解,為此小編也趁此機會對陳磊進行了簡單的採訪,以下為訪談實錄:


IT168 : 云溪資料庫從2019年研發立項至今有兩年多的時間,在這兩年多的時間中我們都得到了怎樣的市場反饋?取得了怎樣的成績?

陳磊:在市場方面,我們正式的推向外部市場是在2020年開始,在2020年之前,2019年作為研發主要在浪潮內部單位使用,2019年到2020年時市場反饋還是比較強烈的。市場使用者對我們產品的可用性、擴充套件性比較認可,我們本身產品的擴充套件性以及可用性就很好,目前在政府、健康醫療、工業網際網路等方面獲得一些客戶,反饋比較好。


IT168 : 去年貴司釋出了云溪資料庫的1.0版本,今年推出了2.0版本,並將在明年推出3.0版本,基本上保持一年一個大版本的迭代速度,相比友商來講,迭代速度還是很快的,簡單概括下每個版本都有哪些側重點?即將推出的3.0版本又有哪些亮點?

陳磊:我們的1.0版本主要是實現了分散式資料庫基礎的能力,比如對資料庫協議的支援,實現分散式事務、計算、儲存、副本排程等核心功能,具備線上彈性伸縮、高可用等特性。

2.0版本對產品做了一些完善,在分割槽、索引等方面進行了開發,做了一些效能的增強,譬如在平行計算、向量計算等層面。

3.0版本,主要是我們推向市場之後,2020年下半年定下了物聯網以及工業網際網路的主要方向,我們決定要進一步增強對於大資料量的分析,所以開發了列存的引擎、海量資料的寫入、單一叢集的異地分散式部署。目前我們一套叢集可以在全國多箇中心部署,實現資料的互相訪問、就近訪問,對大資料生態進行了整合,如Spark和Kafka。


IT168 : 未來產品的迭代速度是會一直保持這種速度(一年一個大版本)還是會隨著產品的逐步完善而逐步放緩?

陳磊:首先我們是定立了敏捷開發和devops的研發模式,這也得益於我們浪潮本身的研發基礎設施,因為你快速的開發就涉及到快速的驗證,這要求有很強的持續整合的能力以及足夠驗證的環境。雖然我們釋出的版本比較快,但每個版本都要經過大量的測試,包括自動化的功能的測試、混沌測試、場景測試、疲勞測試等。

後續我覺得可能會放慢一些。因為隨著我們做的東西越來越深入,相對來講它對於技術的挑戰會越來越大,可能不太會保持每年都這樣的節奏。


IT168 : 這幾年,大家都在談雲原生,貴司資料顯示,云溪的3.0版本是物聯時代的雲原生資料庫,貴司的雲原生的架構演進之路與競品有什麼不同?真正的雲原生和偽原生之間如何區分,有沒有什麼評判標準?

陳磊:首先說資料庫雲原生的演進,我們資料庫一開始立專案時就是要做雲原生的東西,面向於浪潮的公有云、私有云,因為雲環境可能不穩定,如基礎資源經常發生變化,能不能很好的容錯。還有擴充套件性,因為雲給使用者帶來的便利是資源隨著彈性的收縮,我的資料庫在收縮的時候會不會對使用者獲得連續性造成影響,能夠實現不停機的線上的伸縮。

另一方面,除技術之外從部署上也能很容易的分辨出來,你的資料庫部署的時候是在雲上的部署還是說你可以提供非雲的方式的部署。首先我們資料庫也支援非雲的部署,但是我們預設會把它部署在K8S裡。


IT168 : 有人說目前的所謂的雲原生資料庫都算不上真正的雲原生資料庫,您怎麼看?

陳磊:只要是它在設計的時候,可能剛開始沒有考慮過雲的生態或者說做得比較早的時候沒有考慮過雲的環境,後面比如它進行了改造了,針對雲進行改造,這時它在說自己是雲原生的時候,我們也可以稱它為雲原生,但可能不是那麼徹底。因為畢竟它有些元件在雲上的時候不能實現完全的伸縮。

如有的資料庫必須要有一箇中心節點,不能進行擴充套件,而且是它不掛掉,它掛載完就把叢集掛掉了。有的伸縮只能針對儲存或SQL計算節點,並且擴充套件節點極限較底。而我們資料庫所有的節點都能夠大規模擴充套件,能夠大於2000節點。


IT168 : 工業網際網路是云溪資料庫的主賽道,您認為面向工業網際網路領域的資料庫產品和其他行業的資料庫相比有哪些差異化?

陳磊:先說相同的地方,就是都要求海量資料管理、高可用、HTAP。因為業網際網路來講,首先它對於業務的連續性要求很高,如資料庫斷掉可能就不能生產了,甚至有些工業場景需要進行工業控制的,比如火車、飛機的訊號,要判斷要哪個訊號開,哪個訊號關的時候,也是很關鍵的業務場景,所以它對業務的連續性要求很高。

不同的地方在於工業網際網路沒有過重的負擔和歷史包袱。當有一個新的底層技術時可以針對底層技術長出來一個更新型的應用,能夠更好的去服務工業網際網路。

這也是我們現在把主要賽道定位在工業網際網路的原因。


IT168 : 云溪資料庫在工業網際網路領域以及數字能源市場的優勢體現在哪些層面?

陳磊:有幾方面,首先從技術方面來講,我們的定位是分散式資料庫,工業網際網路和數字能源的場景它大部分是分散式的,最起碼我們看到分散式居多,比如農村的光伏發電,各地的風力發電。你可以不是分散式的,各個單點都是獨立的資料庫,再做資料整合也可以,但是對於工業網際網路或者工業場景來講,我們認為它就是分散式的場景,它不是集中性的場景,所以更加適合於分散式資料庫,這個是從技術角度來講。

從集團角度來講,本身浪潮也會做很多的數字能源的業務,比如會有獨立的做數字能源的公司,浪潮內部兄弟單位本身就提供了很多解決方案,對於我們內部適配或者推薦起來更加便捷、容易。


IT168 : 除了工業網際網路和數字能源市場外,還有哪些市場領域是云溪資料庫未來的進擊方向?

陳磊:後期我們當然也會進行擴充套件,但目前可能不是我們的主要方向,所謂擴充套件主要是依靠於我們的合作伙伴,我們合作伙伴如果在某個方向上比較擅長,我們就去鼓勵它去做,但是說我們自己的團隊,市場也好、技術也好,或者研發也好,主要面向的是數字能源場景的需求去做。

我們認為隨著合作伙伴技術的發展或者本身業務方向的發展,可能也慢慢會走向分散式,兩條線互相會有交點,我們本身在分散式場景以及技術上會不斷去完善。其他的方向或市場上,他們本身對分散式的需求可能會越來越旺盛,這時可能會互相走到一起。包括剛才提到的銀行或者一些傳統行業,可能他們未來也會隨著技術的發展,也會去做這種分散式的改造,他們系統有新的需求以後,雙方的點就能合到一起了。



IT168 : 今年4月份,西電-浪潮資料庫創新實驗室正式揭牌成立,推動了產學研的發展程式,目前實驗室的工作有哪些新進展?

陳磊:首先我們與西電的合作屬於雙方的強強聯合,我們最開始本著生態建設的意願,促進產學研的合作。西電後來和我們也達成了更廣大的願景,希望能夠成立一個實驗室,老師們能夠更加深入的參加。

目前來講,我們已經組建了老師、學生、博士、碩士大概30人左右的團隊。現在已經開始進入正常的開發階段,我們這邊有什麼技術點,他們那邊認為這個東西是有價值的,他們就會去進行開發。目前雙方的合作已經度過磨合期開始步入正軌,雙方的合作包括開發、溝通交流都比較順利。


IT168 : 實驗室能夠為云溪資料庫提供哪些便利條件?未來實驗室的主攻方向有哪些?

陳磊:實驗室的主攻方向和云溪資料庫團隊的方向是一致的,目前來講主要做的是SQL的優化器、軟硬體的結合,以及資料庫自治的開發。這些方向,我們本身團隊要做,他們也要做,雙方會進行頻繁的溝通交流,和我們異地研發中心是一個意思。

當然他們未來的主要側重點不能像我們公司一樣完全去做開發。他們還是要去關注資料庫前沿的方向,包括一些核心技術的突破,我們再去吸收引入進來。未來這個實驗室的定位就是服務核心的重大技術攻關。

IT168 : 很多人都認為目前是國產資料庫發展最好的時代,您認為目前國產資料庫的市場機遇在哪裡?

陳磊:資料庫市場的發展機遇與技術的發展相關,比如雲端計算出現之後雲資料庫算一個機遇,當大資料發展起來之後像數倉、資料中心也是一種機遇,所以我認為隨著數字能源的發展,能源行業分散式場景也是一種機遇,未來資料量一定是越來越大,中國地大物博,我們認為分散式的技術,分散式的場景就是未來的市場發展機遇之一。


IT168 : 如今國產資料庫雖然落地應用越來越多,但在高階市場的核心業務應用還特別少,因此,我的問題是,國產資料庫能不能挑起高階市場的大梁?如果能?那你認為需要多久?

陳磊:國產資料庫現在應該能夠挑起國內高階市場的大梁,只是這些高階的應用對國產資料庫廠商需要有一個驗證、建立信任的過程,應用也需要改造,這個過程可能比較長或成本比較高。我覺得可能用不了五年,就能夠有些成功的案例。

當然,國產資料庫在滿足非功能需求方面還有差距,如可靠性,但我認為可以通過應用和基礎計算資源去彌補,核心業務應用支撐不僅僅是資料庫的事情,也需要給與我們更多機會。

我覺得高階的應用需要去更加大膽進行一些適配,或者是針對於資料庫的技術特點去改造它的一些應用。因為它之前所做的那些業務系統,是根據當時的技術底座做出來的。現在,我們有了新的技術之後,如分散式、雲端計算、微服務等,我覺得如重新做應用,來去適配新的底層技術,應該能完全滿足高階市場業務需求,從應用或計算環境彌補國產資料庫非功能需求的差距,只是成本有點大或者說過程風險比較大。

目前我看到了很多高階應用的廠商或者說客戶,他們也開始去適配或者說去改造,包括與資料庫廠商進行聯合的開發。我覺得可能用不了五年,2至3年的適配與改造,在2年驗證,應該能夠有些成功的案例。


IT168 : 云溪資料庫未來在產品層面又有怎樣的發展規劃?

陳磊:雖然我們現在支援了工業資料的寫入,但是它對於資料的壓縮還是有一定的空間,還包括資料入庫的效率,所以我們要著手去完善資料庫的時序資料引擎。還有支援圖資料庫方面,因為支援工業資料的挖掘,包括實時的計算,我認為圖計算還有圖的儲存也是很重要的一些點。

此外要完善我們資料庫本身對於AI的能力,在分散式的場景下AI也很重要,通過AI能夠更好的去做資源的排程,還有各種引數的優化、故障的處理等。


IT168 : 您怎樣看待DTCC大會?對於DTCC您有哪些想說的?

陳磊:我認為這個大會做得很好,因為我們能看到這麼多的友商坐在一起去交流,溝通彼此研發的方向,一些技術點包括一些解決方案。還有很多的客戶來現身說法,講一講他們的需求,他們看重廠商的哪些點,我覺得這些都很好。無論是對於我們產品研發還是對於客戶的需求,我覺得都是有很大的幫助的,希望DTCC能夠越來越好!


IT168:感謝陳總對我們大會的肯定,也感謝您能夠在百忙之中參加我們的大會並接受我們的採訪。我們也期待明年2月份3.0版本的正式推出能夠更好的滿足使用者更多的需求!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545814/viewspace-2838538/,如需轉載,請註明出處,否則將追究法律責任。

相關文章