Neon 期待點亮雲 Postgres 市場

qing_yun發表於2024-02-06

說到關係型資料庫,Postgres 是至高無上的,尤其是在雲端計算領域。然而,以現代雲方式執行這種開源資料庫還有待改進。這正是 NewSQL 資料庫資深專家Nikita Shamgunov希望透過他的最新創業公司 Neon 來填補功能空白。

Shamgunov是MemSQL的聯合創始人之一,後來擔任執行長。MemSQL是一種分散式SQL資料庫,可以同時處理分析和事務性工作負載。Shamgunov說,這種超可擴充套件性資料庫現在被稱為SingleStore,繼續服務於高階市場。但是,在關聯式資料庫的大部分事務性工作負載方面,Postgres 是當之無愧的贏家。

“Postgres在這一點上基本上是不可阻擋的。”Shamgunov在上週接受Datanami採訪時說,“它正在成為 Linux。”

資料無疑證明了這一點。上個月,Postgres 被 DB-Engines.com 評為 2023 年度最佳資料庫。在 Stack Overflow 的 2023 年開發者調查中,Postgres 資料庫名列第一,力壓 MySQL、SQL Server 和 MongoDB 等資料庫中堅力量。

外掛架構使 Postgres 能夠快速、輕鬆地處理不同的資料型別,如時間序列、地理位置和向量嵌入,這使 Postgres成為關聯式資料庫中的瑞士軍刀。唯一缺少的是用於分析工作負載的列儲存,Shamgunov說:“Postgres生態系統最終可能會解決這個問題。”

三大雲巨頭都提供 Postgres 作為服務,但在這一領域,AWS 是無可爭議的重量級冠軍。根據 Shamgunov 的說法,Amazon Aurora 每年的收入達到 40 億美元,而 Amazon 關聯式資料庫服務(RDS)每年的收入達到 70 億美元,加起來佔到了 Gartner 估計 2023 年全球資料庫市場 1000 億美元的 11%。“其他所有東西都只是個小數目,”這位前 Microsoft SQL Server 工程師說。

Shamgunov說,雖然Postgres在雲端計算領域佔據主導地位,但該資料庫卻沒有人們在當今時代所期望的功能和效能。AWS 和谷歌雲(Google Cloud)等公司已經完成了在其 Postgres 產品中分離計算和儲存的工程工作,這使它們能夠提供Serverless Postgres 例項,可以隨時啟動和關閉。不過,這些都不是開源產品。到 2024 年底,Aurora Serverless V1 將停止服務,該產品可以一直縮減到零,這讓客戶非常懊惱。

Shamgunov說,資料庫市場缺乏的是一種Serverless Postgres產品,開發人員可以輕鬆地在雲中啟動它,同時它又是開源的,並與龐大的開源Postgres生態系統保持完全相容。這就是Shamgunov與Postgres貢獻者Heikki Linnakangas和Stas Kelvich於2021年共同創立的Neon公司的基本目標。

這家於 2022 年 6 月公開亮相的初創公司,早期專注於將資料庫中的計算與儲存分離的艱苦工程工作,這是提供Serverless體驗所必需的。該公司為 Postgres 開發了自己的儲存引擎,使其能夠使用Amazon S3 作為資料庫的後端網路儲存,同時不引入資料流的不相容性。

“我們將儲存分離出來,使用專為Postgres定製的網路附加儲存。”Shamgunov說,“API 不是檔案系統 API。它是 Postgres 可以理解的 API。”

Shamgunov說,Neon儲存引擎以“極低階別”與Postgres連線,這是實現與Postgres完全相容的關鍵因素。

Neon 儲存引擎由兩部分組成:根據Neon GitHub頁面的介紹,Pageserver元件是位於計算節點旁邊的可擴充套件儲存後端,而Safekeepers則作為冗餘的預寫日誌(WAL)服務,接收來自計算節點的WAL,並將其持久儲存,直到Pageserver處理完畢並上傳到雲伺服器。

Shamgunov說,只要Neon儲存引擎在預期時間內返回資料,查詢引擎就不會知道其中的差別。他說,這意味著Postgres堆疊中的任何其他部分都不會受到影響,Postgres的所有擴充套件和應用都能正常工作。

“對我們來說,100%相容Postgres是非常重要的,”他補充說,“我們也將自己定位為Postgres,而不是其他資料庫。”

Shamgunov 說,這種方法有幾個好處,首先是幾乎無限的可擴充套件性。他說,由於 Neon 建立在共享儲存架構之上,而不是其他 Postgres 相容資料庫使用的無共享架構,因此它基本上可以根據只讀副本的數量進行線性擴充套件。

“像我們、Amazon Aurora 和 Google Cloud AlloyDB 這樣的共享儲存系統,每個查詢的計算是由單個節點完成的,”Shamgunov 解釋說。“你可以有多個只讀副本,但每個單獨的查詢都是由單個節點計算處理的。但那個計算節點連線到分散式儲存,所以你基本上可以將你的 IOPS 推送到分散式儲存上。現在你的 IOPS 幾乎是無限的。”

Shamgunov 說,開發人員也能從這種方法中受益。得益於 Neon 的Serverless特性,像克隆或分支資料庫這樣的開發者活動變得相對微不足道。他說,這使得 Neon 對開發者來說更容易使用。

“你看現在的資料庫,根本找不到它們。它們不是為現代雲消費而構建的,也不是根據現代開發人員生命週期構建的,”Shamgunov 說。“其基礎功能是分支能力。就像 Git 允許你分支一樣,Neon 也允許你分支。因此,你可以在生產中擁有一個資料庫,而資料庫就是 URL。因此,我們有一個 URL,它代表你在雲中的資料庫。你可以對其進行分支。現在,你有了一個不同的 URL,就可以立即擁有該資料的完整副本,並有一個獨立的端點,該端點也是隔離的。”

Neon 執行長說,當開發人員構建應用程式時,他們可以在每次拉取請求甚至每次提交時對資料庫進行分支。他說,“因此,現在你有了麵包屑。”他說:“你可以構建隔離環境,如果沒有這項功能,成本會高得驚人。”Shamgunov說,Neon與GitHub和Vercel整合,用於原始碼管理,其API可以使用Jenkins等工具輕鬆整合到CI/CD管道中。

曾在 SQL Server 團隊工作過的 Shamgunov 說,微軟的 SQL Server Hyperscale 也提供了類似的以開發人員為中心的功能。不過,該資料庫與 Postgres 不相容,這使它在當今的資料庫市場上處於劣勢。

Neon 資料庫在 Neon GitHub 專案下提供,該專案擁有超過 11000 個星標,並且採用寬鬆的 Apache 2.0 許可證。使用者可以自由下載原始碼並編譯自己的 Postgres 資料庫。Shamgunov 表示,甚至連 Snowflake 也已經將開源的 Neon 引入到了 Snowpark 中。

他說,除了開源部分,公司還提供了企業版 Neon,在雲中為客戶託管,就像 MongoDB 或 Databricks 模式一樣。“這是 Postgres 的 Mongo Atlas。”他說。

另外,開發人員也可以在Neon Free Tier下建立自己的託管資料庫,該層作為技術預覽版提供。免費層客戶可以擁有一個 Neon 專案,最多 10 個分支,每個分支有 3GB 的儲存空間。該公司表示,Neon 目前管理著 50 多萬個資料庫環境。

Shamgunov 終於建立了一個資料庫,它保留了他認為現代資料庫必須具備的兩個最關鍵的特徵:一個是雲架構,它提供了可擴充套件性;另一個是開源,它消除了鎖定(或對鎖定的恐懼)。SingleStore/MemSQL 具有云的可擴充套件性,但該資料庫從未開源。Shamgunov說,價值40億美元的Postgres巨頭Amazon Aurora同樣沒有開放原始碼,這使它很容易受到要求開放的Postgres使用者的攻擊。

在如此短的時間內取得如此大的發展勢頭,Neon 的前景無疑是光明的。該公司目前還沒有盈利,但正在快速註冊新使用者,希望能將他們轉化為穩定的付費使用者。迄今為止,該公司已透過五輪融資籌集了 1.04 億美元,其中包括 2023 年 8 月由 Menlo Ventures 領投,Databricks、Snowflake 和谷歌的風險投資部門參與的 4600 萬美元的 B 輪融資。

“這個架構恰到好處,然後價值就像樂高積木一樣開始在這個架構上分層。”Shamgunov說。“它在很大程度上受到了Amazon Aurora 的啟發,但可以把它想象成 Aurora 的 V3。如果說 V1 儲存是 Aurora,V2 儲存是 Microsoft SQL Server Hyperscale,那麼 V3 就是對這兩個系統的重新實施,它吸取了這兩個系統的所有經驗教訓,並提出了一種現代儲存實施方案。”

作者: Alex Woodie

來自 “ https://www.datanami.com/2024/02/05/neon-looks-to- ”,原文連結:https://blog.itpub.net/69925873/viewspace-3006491/,如需轉載,請註明出處,否則將追究法律責任。

相關文章