筆記:初識Kafka

假裝鎮定發表於2018-09-30

Kafka

簡介

.
Kafka是由Apache軟體基金會開發的一個開源流處理平臺,由Scala和Java編寫。Kafka是一種高吞吐量的分散式釋出訂閱訊息系統,它可以處理消費者規模的網站中的所有動作流資料。 這種動作(網頁瀏覽,搜尋和其他使用者的行動)是在現代網路上的許多社會功能的一個關鍵因素。 這些資料通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。 對於像Hadoop的一樣的日誌資料和離線分析系統,但又要求實時處理的限制,這是一個可行的解決方案。Kafka的目的是通過Hadoop的並行載入機制來統一線上和離線的訊息處理,也是為了通過叢集來提供實時的訊息。
.

1.特性

Kafka是一種高吞吐量的分散式釋出訂閱訊息系統,有如下特性:
	通過O(1)的磁碟資料結構提供訊息的持久化,這種結構對於即使數以TB的訊息儲存
也能夠保持長時間的穩定效能。
	高吞吐量:即使是非常普通的硬體Kafka也可以支援每秒數百萬的訊息。
	支援通過Kafka伺服器和消費機叢集來分割槽訊息。
	支援Hadoop並行資料載入。

相關文章