本文作者是 David Kjerrumgaard，目前任職於 Splunk，Apache Pulsar 和 Apache NiFi 專案貢獻者。譯者為 Sijia@StreamNative。原文連結：https://searchdatamanagement.... ，翻譯已獲授權。

關於 Apache Pulsar
Apache Pulsar 是 Apache 軟體基金會頂級專案，是下一代雲原生分散式訊息流平臺，集訊息、儲存、輕量化函式式計算為一體，採用計算與儲存分離架構設計，支援多租戶、持久化儲存、多機房跨區域資料複製，具有強一致性、高吞吐、低延時及高可擴充套件性等流資料儲存特性。
GitHub 地址：http://github.com/apache/pulsar/

相比於 Kafka 等資料處理中介軟體，分散式訊息平臺 Apache Pulsar 如何儲存資料？本文基於架構，對比了 Apache Kafka 等傳統資料處理中介軟體和分散式訊息平臺 Apache Pulsar 的優劣勢，供大家參考。

儲存可擴充套件

Apache Pulsar 的多層架構將訊息服務層與儲存層完全解耦，從而使各層可以獨立擴充套件。傳統的分散式資料處理中介軟體（如 Hadoop、Spark）則在同一叢集節點/例項上處理和儲存資料。這種設計可以降低通過網路進行傳輸的資料量，使得架構更簡潔，效能也有所提升，但同時擴充套件性、彈性、運維受到了影響。

Pulsar 的分層架構在雲原生解決方案中獨樹一幟。如今，大幅提升的網路頻寬為此架構提供了堅實基礎，有利於計算和儲存的分離。Pulsar 的架構將服務層與儲存層解耦：無狀態 broker 節點負責資料服務；bookie 節點負責資料儲存（如圖 1）。

圖 1. 服務層與儲存層解耦

服務層與儲存層解耦的架構有很多優勢。首先，各層都可以彈性擴充套件，彼此之間互不影響。藉助雲和容器等環境的彈效能力，各層可以自動擴縮容，動態適應流量高峰。其次，通過顯著降低叢集擴充套件和升級複雜性，提高了系統可用性和可管理性。再次，這種設計還屬於容器友好型設計，使 Pulsar 成為託管雲原生流系統的最佳方案。Apache Pulsar 使用高可擴充套件的 BookKeeper 作為儲存層，實現了強大的持久保證與分散式資料儲存和複製，並原生支援跨地域複製。

多層設計可以輕鬆實現分層儲存，從而可以將訪問頻率較低的資料解除安裝到低成本的持久化儲存（如 AWS S3、Azure 雲）中。Pulsar 支援配置預定義的儲存大小或時間段，自動將儲存在本地磁碟的資料解除安裝至雲端儲存平臺，釋放本地磁碟，同時安全備份事件資料。

Pulsar vs. Kafka

Apache Pulsar 和 Apache Kafka 都具有類似的訊息傳遞概念。客戶端通過 topic（邏輯上分為多個分割槽）與二者進行互動。通常而言，寫入 topic 的無限資料流會被分為分割槽（特定數量、大小相等的分組），從而使資料均勻分佈在系統中，並被多個客戶端同時使用。

Apache Pulsar 和 Apache Kafka 之間的本質區別在於儲存分割槽的基礎架構。Apache Kafka 是基於分割槽的釋出/訂閱系統，旨在作為整體架構執行，服務層和儲存層位於同一節點上。

圖 2. Kafka 分割槽

Kafka 儲存：基於分割槽

在 Kafka 中，分割槽資料作為 leader 節點上的單個連續資料儲存，然後複製到副本節點上（副本節點可預配置），實現資料多副本。這種設計通過兩種方式限制了分割槽的容量，並擴充套件了 topic。首先，由於分割槽只能儲存在本地磁碟中，分割槽大小取決於主機上最大的單個磁碟大小（“新”安裝使用者的磁碟大小約為 4 TB）；其次，由於必須複製資料，所以分割槽的大小不能超過副本節點上最小磁碟空間的大小。

圖 3. Kafka 故障和擴容

假設可以將 leader 儲存在新節點上，磁碟大小為 4 TB 且只用於分割槽儲存，兩個副本節點的儲存容量都為 1 TB 。在向 topic 釋出 1 TB 資料後，Kafka 將檢測到副本節點無法繼續接收資料，並且在副本節點釋放空間之前，不能繼續向該 topic 釋出訊息（如圖 3）。如果 producer 在中斷期間無法緩衝訊息，則可能會造成資料丟失。

面對這一問題，有兩種解決方案：刪除磁碟上的資料，儲存現有副本節點，但由於來自其他 topic 的資料可能還沒有被消費，可能會導致資料丟失；或為 Kafka 叢集新增新節點並“重平衡”分割槽，將新增節點用作副本節點。但是這需要重新複製整個 1 TB 的分割槽，耗時、易出錯，對網路頻寬和磁碟 IO 要求高，且代價高昂。此外，對於具有嚴格 SLA 的程式而言，離線複製的方案並不可取。

使用 Kafka，不僅在擴充套件叢集時需要重新複製分割槽資料，其他故障也可能需要重新複製分割槽資料，如副本故障、磁碟故障、計算機故障等。如果沒有在生產環境中出現故障，我們通常會忽視 Kafka 的這一弊端。

圖 4. Pulsar 分片

Pulsar 儲存：基於分片

在基於分片的儲存架構（如 Apache Pulsar 使用的架構）中，分割槽被進一步分成分片，可以根據預先配置的時間或大小進行滾動。分片均勻分佈在儲存層的 bookie 中，實現資料多副本和擴容。

當 bookie 磁碟空間用盡，不能繼續向其中寫入資料時，Kafka 需要重新複製資料，Pulsar 如何應對這種場景呢？由於分割槽被進一步分成分片，因此無需複製整個 bookie 的內容到新增 bookie 中。在新增新 bookie 前，Pulsar 可以繼續接收新資料分片，並寫入儲存容量未滿的 bookie 中。新增新 bookie 時，新節點和新分割槽上的流量立即自動增加，無需重新複製舊資料。

圖 5. Pulsar 故障和擴容

如圖 5 所示，在第 4 個 bookie 節點不再繼續接收新訊息分片時，訊息分片 4-7 被路由到其他活躍 bookie 上。新增 bookie 後，分片自動被路由到新 bookie 上。整個過程中，Pulsar 始終在執行，並且可以為 producer 和 consumer 提供服務。在這種情況下，Pulsar 的儲存系統更加靈活，高可擴充套件。

相關閱讀

點選連結，獲取 Apache Pulsar 硬核乾貨資料！

譯文 | 科普：Pulsar 和 Kafka 架構對比

關於 Apache Pulsar

儲存可擴充套件

Pulsar vs. Kafka

Kafka 儲存：基於分割槽

Pulsar 儲存：基於分片

相關閱讀

相關文章