StreamNative將Kafka整合到基於Apache Pulsar的雲中
StreamNative是由Apache Pulsar和Apache BookKeeper提供支援的雲原生事件流平臺的製造商,最近宣佈了其StreamNative cloud for Kafka產品的測試版,該產品在雲產品中整合了Apache Kafka和Pulsar。StreamNative簡要介紹了這兩個看似競爭激烈的流媒體平臺如何融合在一起。
StreamNative於2019年由前雅虎同事Sijie Guo和Apache Pulsar的原始開發者Matteo Merli建立。這兩人自10年前該技術問世以來一直在研究該技術。當時的目標是構建一個訊息平臺,將所有Yahoo服務集中在一個系統中,並允許可擴充套件的工作負載排隊。當時可用的訊息傳遞系統沒有滿足Yahoo的要求,包括跨工作負載處理大量訊息傳遞主題,以及提供多租戶架構以簡化基礎設施管理。這些正是Apache Pulsar的主要功能。
裡面是什麼
Pulsar是一個開源的分散式訊息傳遞系統,可以在廣泛的用例中使用,透過將儲存底層訊息資料的資源與處理訊息分發的計算資源分離,具有足夠的可擴充套件性,可以輕鬆移動大量資料。
Pulsar包括一個管理元件,支援內建多租戶和地理複製,以便跨訊息傳遞基底複製資料。這種多層方法使Pulsar特別適合於雲環境和容器環境,這兩種環境都將計算和儲存分離作為一項關鍵原則。
Pulsar vs.Apache Kafka:我們必須做出選擇嗎?
StreamNative Cloud for Kafka為在Apache Kafka(一種幾乎無處不在的分散式事件儲存和流處理平臺)上有重大投資的組織帶來了這些功能,以及對大量主題的支援。StreamNative Cloud for Kafka允許使用者保留和使用Kafka的API、wire協議甚至其聯結器,同時能夠在後端充分利用Apache Pulsar及其自身的功能。
兩年前,StreamNative用Kafka on Pulsar(KoP)播下了StreamNative Cloud for Kafka的種子。Kafka on Pulsar(KoP)是開源Pulsar的先驅功能。現在,StreamNative Cloud for Kafka也將此功能整合到StreamNative的雲平臺中。
Kafka式挑戰
StreamNative與許多投資於Apache Kafka的組織合作,並表示這些組織已經看到了挑戰。例如,StreamNative表示,在Kafka內部以原生方式實現多租戶可能很困難,因為不同的組織或團隊可能使用完全不同的Kafka叢集,這反過來會帶來巨大的管理開銷。
StreamNative的首席架構師Addison Higham評論道,“在微服務世界中,你有許多不同的應用程式,客戶有各種各樣的用例;例如,他們需要對大量主題的支援”,這是出於合規性和其他原因。”
對於Kafka,“如果你新增更多的主題,可能會導致效能下降”,Pulsar可以支援數百萬個主題。”StreamNative還解釋說,Pulsar提供了一個工作佇列,使用者可以在其中連線任意多個使用者,而Kafka需要連線分割槽或主題,這通常會使複雜的計算變得困難,特別是在機器學習場景中,會施加很大的限制。
StreamNative認為,其新的Kafka/Pulsar產品可能會吸引已經投資Kafka的組織,原因有很多。Higham說:“對於一些組織來說,這更多的是關於功能,而對於一些組織來說,這更多的是關於管理方面,對於其他組織來說,這是他們向更雲原生戰略邁進的一部分。在所有情況下,我們都看到Pulsar是一種解決他們問題的技術,現在我們支援Kafka的能力有助於簡化遷移過程。”
簡化流程
StreamNative將Cloud for Kafka產品視為將開源技術引入其完全管理的雲服務並提供更完整解決方案的下一步。它認為該產品縮短了Pulsar的價值實現時間,因為它使客戶能夠使用其現有的應用程式,避免了Kafka生態系統的投資損失。
雖然激發Apache Pulsar建立的最初需求沒有十年前那麼緊迫,但Pulsar的許多核心價值主張仍然具有相關性——對於一些組織來說,可能甚至比以前更加重要。毫不奇怪,StreamNative相信,流媒體資料市場將看到Pulsar應用的加速趨勢。
Pulsar的份額可能會增加,也可能不會增加,但有一點是明確的:即使Kafka沒有被用作原生訊息傳遞後端,其API、協議和聯結器生態系統共同構成了事實上的行業標準。越來越多看似有競爭力的技術和公司可能會支援這一標準。主要的雲提供商已經這樣做了,現在StreamNative也這樣做了。
來自 “ 開源雲中文社群 ”, 原文作者:開源雲中文社群;原文連結:https://mp.weixin.qq.com/s/UU7pnbQQ_JzVWxjdjhSFtQ,如有侵權,請聯絡管理員刪除。
相關文章
- Kafka-on-Pulsar 實現了偏移更好支援kafka - StreamNativeKafka
- 選擇Apache Pulsar而不是Kafka的理由 - KafkaesqueApacheKafka
- 周邊生態|StreamNative 聯合 Cloudera 開源 Apache Pulsar+Apache NiFi 整合處理器CloudApacheNifi
- 簡單比較 Apache Kafka 和 Apache Pulsar要點 - JaroslawApacheKafkaJARROS
- StreamNative 聯合傳智教育推出免費 Apache Pulsar 中文視訊教程Apache
- Apache Pulsar 與 Apache Kafka 在金融場景下的效能對比分析ApacheKafka
- 博文推薦|Apache Pulsar 基於 Log4j2+Kafka+ELK 實現日誌的快速檢索ApacheKafka
- 個推基於 Apache Pulsar 的優先順序佇列方案Apache佇列
- 智聯招聘基於Apache Pulsar打造企業級事件中心Apache事件
- 優步分享基於Apache Kafka的Presto使用經驗ApacheKafkaREST
- Apache Pulsar 與 Kafka 效能比較:延遲性(測試方法)ApacheKafka
- 比較Apache Pulsar 和Apache Kafka:統一排隊和流式傳輸 - splunkApacheKafka
- KMQ:基於Apache Kafka的可靠性訊息佇列MQApacheKafka佇列
- 雲原生時代頂流訊息中介軟體Apache Pulsar部署實操之Pulsar IO與Pulsar SQLApacheSQL
- 將.Net AI外掛整合到自己的程式中AI
- Sqlstream:將MySQL複製事件流化到Apache KafkaMySql事件ApacheKafka
- Apache Kafka不適用於Event Sourcing!ApacheKafka
- 案例實踐|Apache Pulsar 在移動雲智慧運維平臺的實踐Apache運維
- Apache Pulsar分散式事務機制Apache分散式
- 選擇 Pulsar 而不是 Kafka 的 7 大理由Kafka
- 將測試人員整合到敏捷團隊中敏捷
- 博文|Apache Pulsar 在自研資料管道中的技術實踐Apache
- Apache Kafka教程--Kafka新手入門ApacheKafka
- Apache Kafka 的基本概念ApacheKafka
- 技術探究:Apache Pulsar 的事務型事件流Apache事件
- 開源Apache KafkaApacheKafka
- Flume將 kafka 中的資料轉存到 HDFS 中Kafka
- 譯文 | 科普:Pulsar 和 Kafka 架構對比Kafka架構
- 基於Apache Doris的湖倉分析Apache
- apache kafka系列之在zookeeper中儲存結構ApacheKafka
- 阿里雲 MSE 基於 Apache APISIX 的全鏈路灰度方案實踐阿里ApacheAPI
- Spotify如何從Apache kafka遷移到雲平臺的pub/sub系統ApacheKafka
- 基於Apache Hudi在Google雲構建資料湖平臺ApacheGo
- 博文乾貨|Apache InLong 使用 Apache Pulsar 建立資料入庫Apache
- 最佳實踐|Apache Pulsar 在拉卡拉的技術實踐Apache
- DevOpsSOP 基於阿里雲VPC搭建Storm+Kafka+Zookeeper叢集dev阿里ORMKafka
- Apache Kafka在大型應用中的20項最佳實踐ApacheKafka
- 如何克服 Apache Kafka中的資料順序問題 - DATAVERSITYApacheKafka