Kafka選型
版本
kafka經歷了 0.7,0.8,0.9,0.10,0.11,1.0,2.0等大版本,1.0以上的版本一般上是升級優化了kafka的流處理。若將kafka當做訊息佇列差別不大。目前我司使用的是kafka2.0版本
一般上我們使用的kafka都是Apache Kafka即社群版的
作業系統
作業系統無腦選Linux
磁碟
磁碟分為機械硬碟和固態硬碟,當然固態硬碟效能比機械好很多,但是kafka是追加寫,所以一般使用機械硬碟其實也夠用。但是具體問題具體分析
磁碟容量
需要根據公司業務進行實際規劃。需要幾個資料才能衡量
- 平均每條訊息的大小
- 平均每天傳送訊息數
- 訊息持久化時間
- 副本數
比如每天1億條訊息,每條1kb,儲存兩份,儲存兩週(訊息數,儲存時間,備份數,訊息大小)
1億*1kb*2/100/100=200GB
再加上其他型別的資料,如索引等等,因此要多預留10%以上即220GB(預留空間)
220GB*14天=3TB
kafka支援壓縮,假設壓縮比是0.75(是否啟用壓縮)
0.75*3=2.25TB
頻寬
Kafka是通過網路大量資料傳輸的框架,因此頻寬是一個瓶頸。Kafka效能出現問題有很大程度可能是因為頻寬。頻寬一般使用兩種 1Gbps (千兆網)和10Gbps(萬兆網)。我們需要根據頻寬來規劃Kafka伺服器的數量。
比如一個業務,需要1小時內處理1TB的業務資料,name需要多少臺Kafka伺服器?
每臺伺服器上應用最多也就70%(1.考慮不可能一臺伺服器就只部署一個kafka,2.當頻寬佔比太高了會有網路丟包的可能)。那麼一臺伺服器大約700Mb的頻寬資源。留給卡夫卡的1/3已經算很多了,那最多就是240Mbps(30MB/s,這個已經算很多了,其實可以再往下估計一點)。
1h處理1TB資料,則1s需要處理2336Mb資料。2336Mb/240Mbps =10臺伺服器。若總共有三個副本,則10*3=30臺伺服器
相關文章
- RabbitMQ與Kafka選型對比MQKafka
- IM系統的MQ訊息中介軟體選型:Kafka還是RabbitMQ?MQKafka
- RabbitMQ和Kafka到底怎麼選?MQKafka
- 訊息中介軟體選型分析:從Kafka與RabbitMQ的對比看全域性KafkaMQ
- Kafka科普系列 | 原來Kafka中的選舉有這麼多?Kafka
- Kafka控制器選舉流程剖析Kafka
- RabbitMQ和Kafka到底怎麼選(二)?MQKafka
- Kafka 與 RabbitMQ 如何選擇使用哪個?KafkaMQ
- ASP.NET Core - 選型系統之選型配置ASP.NET
- 電阻選型
- [Mysql]索引選型MySql索引
- 教育OA如何選型?教育OA系統選型必看技巧
- 選擇Apache Pulsar而不是Kafka的理由 - KafkaesqueApacheKafka
- 代理型別升級,APISIX 支援 Kafka 作為上游型別APIKafka
- PDM選型介紹
- 技術選型指南
- 再談ERP選型
- Swift 可選型別Swift型別
- Blog 技術選型
- 聊聊技術選型
- Oracle MySQL PG選型OracleMySql
- 選型必看——SaaS CRM
- 選擇 Pulsar 而不是 Kafka 的 7 大理由Kafka
- 中小企業OA系統如何選型?OA軟體選型必看技巧
- CRM系統如何選型?
- 如何消除ERP選型困惑
- 熱繼電器選型
- MQ選型對比文件MQ
- 開源OLAP引擎選型
- 技術選型的藝術
- mysql 貨幣型別 選擇MySql型別
- 洛谷題型摘選(三)
- SpringCloud微服務技術選型SpringGCCloud微服務
- 記憶體快取選型記憶體快取
- 關於技術的選型
- 訊息中介軟體選型
- kafka-ngx_kafka_moduleKafka
- 你以為共模電感選型只是簡單的選個型號嗎gujing