汪源做客阿里雲大咖說,論道資料庫開源與儲存生態

網易數帆發表於2022-04-01

開源對於生態對接的重要性是什麼?

開源生態建設對於To B客戶的意義在哪裡?

開源是否是實現國產化替代的合適路徑?

近日,網易副總裁、杭州研究院執行院長、網易數帆總經理汪源受邀參加阿里雲“大咖說*對話開源”,與阿里雲資料庫開源戰役負責人、阿里雲智慧資料庫產品事業部架構組負責人曲山(黃貴)展開精彩對話,以Data Infra(資料基礎設施)為例,就開源生態、商業化及國產化等一系列問題進行了深入探討。

Curve 開源儲存,意在全場景支援

汪源是資深的開源技術實踐者,2006年,初到網易的他面對業務增長帶來的挑戰,採用分庫分表的方案推進開源MySQL對Oracle的替代。這比後來影響巨大的“去IOE”行動還要早,而這套技術現在依然執行良好。

汪源介紹,網易開源之路可以分為用好開源、增強回饋、自主開源這三步,即首先充分利用開源技術發揮價值,而後將對其不完善之處的增強貢獻給社群,最後是將自研專案開源,解決已有技術架構力不能及的問題。

開源雲原生軟體定義儲存系統Curve就是第三步的產出,是網易數帆突破開源儲存效能瓶頸的努力,也是網易數帆和阿里雲在資料庫領域合作,為開源PolarDB for PostgreSQL提供分散式共享儲存的主角。曲山表示,穩定性、可靠性和可用性這些是儲存的基本需求,資料庫業務有更高的要求,如對一寫多讀的架構,要支援多點掛載、閃回查詢等能力,PolarDB for PostgreSQL和Curve 完成了對接。

Curve的目標,是打造一個高效能、易運維、全場景支援的通用儲存系統,包括支援PostgreSQL、MySQL等多種雲原生資料庫,包括在塊儲存之外還提供檔案儲存,汪源認為,這將使得整個技術棧能夠發揮更好的效益。

開源是基礎軟體成功的必要條件

在目前的基礎軟體領域,尤其是Data Infra,開源越來越流行,汪源認為,開源是成功的必要條件,以Curve為例,要想和Ceph分庭抗禮,不開源是不行的。

曲山同樣認為,開源是打造行業標杆產品的必選項。曲山表示,商業產品獲得客戶需要付出比較高昂的成本,只有做到開放才能跟各種生態去對接。

曲山解釋說,開源軟體採用開放的標準的介面,對於打通生態實現基礎軟體構架體系一體化很重要,如PolarDB和Curve等開源軟體的對接都是基於標準的介面,在實踐中並不需要耗費很多精力。

To B技術需要通盤考慮技術生態位

網易數帆的開源實踐,始於服務網易業務,星辰大海卻在To B市場,通過網易數帆為更多客戶提供服務。汪源表示,這需要每一項技術通盤考慮能否與上下游構成一個健康的技術生態鏈,動態地發展,不斷提升和改進,每一層都有多重技術選項和多個服務商來提供產品,最後組成一個很好的解決方案給客戶。

良好的技術生態意味著要有一個繁榮的社群,有不同行業和企業的貢獻者,而不是隻有一家公司唱獨角戲,從而為企業有效分散供應鏈的風險。

那麼,軟體開源了,是否影響商業化的推進?汪源和曲山都認為,如資料庫這樣的複雜的基礎軟體產品,真正在工業級場景下大規模應用,企業是需要專業團隊來提供技術保障的。

汪源表示,專心做好產品,把客戶基礎做得足夠大,生意自然能做大,“不用著急,至少在你的開源專案沒有達到一定的狀態之前,不用過早地去關注這個事情。”

曲山表示,通過雲服務把已經驗證過的產品開放出去,也是一條較好的商業化途徑,如Databricks、Snowflake就是典型的例子。

解決卡脖子問題,開源比閉源成長更好

在今天基礎軟體國產化替代、解決卡脖子問題的趨勢下,開源模式獲得了空前的關注,但開源真的比傳統的閉源研發模式更有優勢嗎?

在2003年就參與研發國產資料庫神舟OSCAR的汪源對此深有感觸。他表示,神舟OSCAR當年在科技部測評中得分遠超第二名,但到今天看來發展得不甚理想。雖然國內的開源資料庫和Spark、Snowflake等Data Infra技術相比體量仍然差距巨大,也不能說特別成功,但對比非開源國產資料庫和現在開源的國產資料庫最初三五年的發展,汪源認為開源更勝一籌。

“還是能夠明顯地看出來,開源資料庫至少前期的成長過程,比原來非開源的(資料庫)要高很多,用開源的方式去做,成功的概率會更大。”汪源說。

更多精彩觀點,請觀看本期採訪視訊,掃下圖二維碼或戳原文連結即可直達。

視訊連結:https://talk.aliyun.com/live?...
Curve專案地址:https://github.com/opencurve/...
網易數帆開源主頁:https://sf.163.com/opensource

相關文章