Kafka實戰－資料持久化

smartloli發表於2016-04-25

1.概述

　　經過前面Kafka實戰系列的學習，我們通過學習《Kafka實戰－入門》瞭解Kafka的應用場景和基本原理，《Kafka實戰－Kafka Cluster》一文給大家分享了Kafka叢集的搭建部署，讓大家掌握了叢集的搭建步驟，《Kafka實戰－實時日誌統計流程》一文給大家講解一個專案（或者說是系統）的整體流程，《Kafka實戰－Flume到Kafka》一文給大家介紹了Kafka的資料生產過程，《Kafka實戰－Kafka到Storm》一文給大家介紹了Kafka的資料消費，通過Storm來實時計算處理。今天進入Kafka實戰的最後一個環節，那就是Kafka實戰的結果的資料持久化。下面是今天要分享的內容目錄：

結果持久化
實現過程
結果預覽

　　下面開始今天的分享內容。

2.結果持久化

　　一般，我們在進行實時計算，將結果統計處理後，需要將結果進行輸出，供前端工程師去展示我們統計的結果（所說的報表）。結果的儲存，這裡我們選擇的是Redis＋MySQL進行儲存，下面用一張圖來展示這個持久化的流程，如下圖所示：

　　從途中可以看出，實時計算的部分由Storm叢集去完成，然後將計算的結果輸出到Redis和MySQL庫中進行持久化，給前端展示提供資料來源。接下來，我給大家介紹如何實現這部分流程。

3.實現過程

　　首先，我們去實現Storm的計算結果輸出到Redis庫中，程式碼如下所示：

package cn.hadoop.hdfs.storm;

import java.util.HashMap;
import java.util.Map;
import java.util.Map.Entry;

import redis.clients.jedis.Jedis;
import cn.hadoop.hdfs.util.JedisFactory;
import backtype.storm.task.OutputCollector;
import backtype.storm.task.TopologyContext;
import backtype.storm.topology.IRichBolt;
import backtype.storm.topology.OutputFieldsDeclarer;
import backtype.storm.tuple.Tuple;

/**
 * @Date Jun 10, 2015
 *
 * @Author dengjie
 *
 * @Note Calc WordsCount eg.
 */
public class WordsCounterBlots implements IRichBolt {

    /**
     * 
     */
    private static final long serialVersionUID = -619395076356762569L;

    OutputCollector collector;
    Map<String, Integer> counter;

    @SuppressWarnings("rawtypes")
    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
        this.collector = collector;
        this.counter = new HashMap<String, Integer>();
    }

    public void execute(Tuple input) {
        String word = input.getString(0);
        Integer integer = this.counter.get(word);
        if (integer != null) {
            integer += 1;
            this.counter.put(word, integer);
        } else {
            this.counter.put(word, 1);
        }
        for (Entry<String, Integer> entry : this.counter.entrySet()) {
           // write result to redis
            Jedis jedis = JedisFactory.getJedisInstance("real-time");
            jedis.set(entry.getKey(), entry.getValue().toString());
            
            // write result to mysql
            // ...
        }
this.collector.ack(input);
    }

    public void cleanup() {
        // TODO Auto-generated method stub
        
    }

    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        // TODO Auto-generated method stub

    }

    public Map<String, Object> getComponentConfiguration() {
        // TODO Auto-generated method stub
        return null;
    }

}

　　注：這裡關於輸出到MySQL就不贅述了，大家可以按需處理即可。

4.結果預覽

　　在實現持久化到Redis的程式碼實現後，接下來，我們通過提交Storm作業，來觀察是否將計算後的結果持久化到了Redis叢集中。結果如下圖所示：

　　通過Redis的Client來瀏覽儲存的Key值，可以觀察統計的結果持久化到來Redis中。

5.總結

　　我們在提交作業到Storm叢集的時候需要觀察作業執行狀況，有可能會出現異常，我們可以通過Storm UI介面來觀察，會有提示異常資訊的詳細描述。若是出錯，大家可以通過Storm UI的錯誤資訊和Log日誌列印的錯誤資訊來定位出原因，從而找到對應的解決辦法。

6.結束語

　　這篇部落格就和大家分享到這裡，如果大家在研究學習的過程當中有什麼問題，可以加群進行討論或傳送郵件給我，我會盡我所能為您解答，與君共勉！

【許曉笛】EOS 資料庫與持久化 API —— 實戰
2018-11-20
資料庫持久化API
Redis資料持久化—RDB持久化與AOF持久化
2021-05-20
Redis持久化
從0到1使用Kubernetes系列（六）：資料持久化實戰
2019-04-10
持久化
Sentinel 實戰-規則持久化
2019-01-09
持久化
fabric資料持久化
2019-03-08
持久化
Docker資料持久化
2024-09-08
Docker持久化
Redis 資料持久化
2021-04-07
Redis持久化
Docker之資料持久化
2018-12-12
Docker持久化
【Unity】資料持久化PlayerPrefs
2024-10-10
Unity持久化
Redis的資料持久化
2022-12-20
Redis持久化
資料的序列化&持久化
2019-06-27
持久化
Redis穩定性之戰：AOF日誌支撐資料持久化
2024-03-12
Redis持久化
iOS資料持久化設計
2019-03-04
iOS持久化
鴻蒙資料持久化sqlite
2024-10-11
鴻蒙持久化SQLite
可持久化資料結構
2024-07-26
持久化資料結構
Docker --volume-資料持久化
2020-12-23
Docker持久化
詳解 ZooKeeper 資料持久化
2021-03-18
持久化
flutter 持久化儲存-----資料庫sqflite｜8月更文挑戰
2021-08-01
Flutter持久化資料庫
可持久化資料結構1
2024-08-20
持久化資料結構
iOS資料持久化儲存-CoreData
2018-04-04
iOS持久化
Milvus 2.0 資料插入與持久化
2022-03-31
持久化
Kubernetes 持久化資料儲存 StorageClass
2021-09-08
持久化
Python–Redis實戰：第四章：資料安全與效能保障：第2節：快照持久化
2019-02-16
PythonRedis持久化
Python–Redis實戰：第四章：資料安全與效能保障：第3節：AOF持久化
2018-11-16
PythonRedis持久化
HarmonyOS資料管理與應用資料持久化（一）
2023-11-01
持久化
Kubernetes 持久化儲存之 NFS 終極實戰指南
2024-07-22
持久化NFS
EMQX+HStreamDB 實現物聯網流資料高效持久化
2023-03-17
MQ持久化
鴻蒙首選項資料持久化
2024-10-10
鴻蒙持久化
redis原始碼分析（五）：資料持久化
2021-09-09
Redis原始碼持久化
Kafka 原理和實戰
2019-08-20
Kafka
kafka實戰教學
2018-03-26
Kafka
LaravelZero 從零實現區塊鏈（三）資料持久化與 CLI
2020-05-02
Laravel區塊鏈持久化
MVVM的資料持久化（一）——ROOM的整合
2018-11-07
MVVM持久化OOM
MVVM的資料持久化（二）——ROOM的使用
2018-11-07
MVVM持久化OOM
Redis——Redis用作資料庫（持久化/RDB/AOF）
2020-10-03
Redis資料庫持久化
在 React-Native 中持久化 redux 資料
2019-06-06
React持久化Redux
Docker系列教程14-Docker資料持久化
2018-03-23
Docker持久化
rabbitmq 如何在 docker 下做資料持久化？
2023-03-06
MQDocker持久化
Room-資料持久化儲存(入門)
2021-06-28
OOM持久化