2021年資料庫回顧 - OtterTune

banq發表於2021-12-30

對於資料庫行業來說,這是瘋狂的一年,隨著年底的臨近,在我們進入 2022 年時值得反思和評估。以下是一些亮點以及我對它們對資料庫領域可能意味著什麼的一些想法。
 

PostgreSQL 的統治地位
開發人員的傳統觀念已經轉變:PostgreSQL 已成為新應用程式的首選。這是可靠的。它具有許多功能,並且還在不斷新增更多功能。2010 年,PostgreSQL 開發團隊改用更激進的釋出計劃,每年釋出一個新的主要版本 (H/T Tomas Vondra )。當然,PostgreSQL 是開源的。
PostgreSQL相容性是現在許多系統的顯著特徵。這種相容性透過支撐PostgreSQL的SQL方言(實現DuckDB),有線協議(QuestDB,資料HyPer),或整個前端(亞馬遜極光,YugaByte,Yellowbrick)。大玩家紛紛加入。谷歌在 10 月份宣佈他們在 Cloud Spanner 中新增了PostgreSQL 相容性。同樣在 10 月,亞馬遜宣佈了Babelfish功能,用於將 SQL Server 查詢轉換為 Aurora PostgreSQL。
資料庫受歡迎程度的一種衡量標準是DB-Engine 排名。這個排名並不完美,分數也有些主觀,但它是前 10 名系統的合理近似值。截至 2021 年 12 月,該排名顯示,雖然 PostgreSQL 仍然是第四大最受歡迎的資料庫(僅次於 Oracle、MySQL 和 MSSQL),但它在過去一年中縮小了與 MSSQL 的差距。
另一個需要考慮的趨勢是 PostgreSQL 在線上社群中被提及的頻率。最常提到的前 10 個 DBMS:

 PostgreSQL | 656
 MySQL | 317
 MongoDB | 266
 甲骨文| 222
 SQLite | 213
 Redis | 88
 EleaticSearch| 70
 Snowflake| 52
 DGraph | 46
 Neo4j | 42


它清楚地表明,在過去的一年裡,人們提到 Postgres 的次數比其他系統都要多。經常有開發人員發帖詢問他們的新應用程式使用什麼 DBMS,社群的回應幾乎總是 Postgres。
  

基準效能測速大比拼
今年有三場主要的街頭鬥爭因基準結果而升溫。

  • Databricks vs. Snowflake
    Databricks 宣佈他們的新 Photon SQL 引擎在 100TB TPC-DS 中創造了新的世界紀錄。Snowflake 予以回擊,稱其資料庫速度提高了 2 倍,並且 Databricks 錯誤地執行了 Snowflake。Databricks 反駁,聲稱他們的 SQL 引擎提供了優於 Snowflake 的執行和價效比。
  • Rockset vs. Apache Druid vs. ClickHouse

    ClickHouse 出現了搖擺不定的情況,稱與 Druid 和 Rockset 相比,它的成本效率更高。但沒那麼快:Imply對更新版本的 Druid 進行了測試並宣佈獲勝。Rockset 也加入了進來,稱其在實時分析方面的效能優於其他兩個。

  • ClickHouse 與 TimescaleDB暗鬥的血腥:
    Timescale 加入了競爭。他們給出了自己的基準測試結果,並藉此機會指出了 ClickHouse 技術的弱點。關於第三方基準測試的討論在 Hacker News 上火了

 

大資料迎來大資金
自 2020 年下半年以來,價值至少 1 億美元的風險投資輪次數量一直在穩步增加。 2020 年有 327 筆此類大型交易(僅不到 VC 交易總額的一半)。截至 2021 年 1 月,有超過 100 輪風險投資支援的投資輪,價值 1 億美元或更多。
2021 年,大量投資資金投向了資料庫公司。在運營資料庫方面,CockroachDB 在今年年初以1.6億美元的融資領跑了融資排行榜,然後在 2021 年 12 月又籌集了 2.78 億美元。Yugabyte 獲得了 1.88億美元的 C 輪融資。PlanetScale為其託管版本的Vitess 籌集了 2000 萬美元的 B輪融資。相對較老的 NoSQL 堅定的 DataStax 也在其 Cassandra 業務的風險投資中籌集了 3760 萬美元。
儘管這些數量令人印象深刻,但分析資料庫市場卻更加火爆。TileDB於 2021 年 9 月籌集了一筆未公開的金額。 StarTree 從隱身狀態中脫穎而出,並宣佈了2400 萬美元的融資,以將 Apache Pinot 商業化。Imply為基於 Apache Druid 的資料庫服務籌集了 7000 萬美元。SingleStore在 2021 年 9 月籌集了 8000 萬美元,使他們離 IPO 又近了一步。今年年初,Starburst Data為其 Trino 系統(前身為 PrestoSQL)籌集了 1 億美元。Firebolt 是另一家隱身的 DBMS 初創公司,宣佈他們為其基於 ClickHouse 分支的新雲資料倉儲籌集了 1.27 億美元。一家新公司 ClickHouse, Inc.籌集了驚人的 2.5 億美元用於圍繞該系統建立一家新公司(以及從 Yandex 獲得使用 ClickHouse 名稱的權利)。
但今年最大一輪融資的明顯贏家是 Databricks,他在 2021 年 8 月籌集了高達 1.6 億美元的資金,讓其他所有人都大吃一驚。
我們正處於資料庫的黃金時代。今天有很多很棒的選擇。投資者正在尋找能夠成為下一個類似Snowflake的 IPO 的資料庫初創公司。
  

告別過去
遺憾的是,在過去的一年裡,我們告別了一些資料庫朋友。

  • ServiceNow 收購了 Swarm64。
    該公司最初是一家 FPGA 加速器,用於在 PostgreSQL 上執行分析工作負載。然後,他們轉而使用擴充套件成為 PostgreSQL 的純軟體加速器。但他們未能獲得吸引力,尤其是與其他資金充足的雲資料倉儲相比。在 ServiceNow 被收購之後,Swarm64 產品是否會繼續存在仍然沒有任何訊息。
  • Splice Machine 破產了
    Splice 正在推出一種混合 (HTAP) DBMS,它結合了 HBase 用於操作工作負載和 Spark SQL 用於分析。然後,他們推動為操作/實時 ML 應用程式提供平臺。但是,由於專用 OLTP 和 OLAP 系統的主導地位,一體化混合系統未能進入資料庫市場。
  • 私募股權公司收購了 Cloudera
    自從過去十年的後半階段,世界逐漸遠離 MapReduce 和 Hadoop 技術以來,Cloudera 未能在雲資料倉儲市場上擁有同樣的吸引力。Impala和Kudu 的大部分原始工程團隊已經離開公司,儘管這些專案仍在開發中併發布新版本。該股自 2018 年以來已跌至低於其 IPO 價格。其新投資者能否扭轉公司局面仍有待觀察。


 

相關文章