大資料6.1 - 實時分析（storm和kafka）

項羽齊發表於2018-04-08

原文網址 : https://www.cnblogs.com/xiangyuqi/p/8743195.html

大資料ORMKafka

訊息佇列：

　　kafka只有一種模式：topic主題模式

　　kafka已經成為大資料業界主流

storm簡介

　　storm是一個分散式的實時資料分析系統，底層基於zeroMQ做資料傳輸。使用clojure語言開發核心模組

　　storm速度非常快，能達到亞秒級（200sm）

　　同類產品：

　　　　sparkStreaming：也是做實時分析的，速度是秒級：1s-5s。

　　問題：

　　　　flume連線kafka？

　　　　kafka連線storm？

　　storm元件：

　　　　Nimbus：老大，storm的發號施令者。（相當於hadoop中的namenode）

　　　　Supervisor（管理人，檢查員）：小弟，具體業務執行者。（相當於hadoop中的datanode）

　　　　zookeeper：叢集資源管理者，監聽整個叢集的健康狀態。

　　核心四大要素

　　　　topology：拓撲，代表整修同整個資料處理過程

　　　　spout：噴嘴，就是資料來源

　　　　tuple：資料載體，內部類似map(key,value)，value型別一旦定義，不能存放其他型別的資料。Tuple不太一樣，key一般是string型別，value型別不定，資料結構不定。

　　　　　　　　Tuple的切割時間不是任意確定的。需要經過多次的嘗試。沒有最好的時間，只有最合適的時間。

　　　　bolt：（閃電）運算元，內部需要我們自己定義一些處理邏輯，而且一個topology中可以有多個bolt。並且一個bolt可以接受多個資料來源，並且有多個出處。

　　　　jvm？java虛擬機器，隨著技術的發展，java有很多衍生語言。scala、clojure。同樣編譯成.class，通過jvm來執行。

　　1、安裝storm

　　　　解壓即可

cd /usr/local/src/storm/apache-storm-0.9.3/conf
vi storm.yaml

storm.zookeeper.servers:
     - "hadoop01"
     - "hadoop02"
     - "hadoop03"
# 
 nimbus.host: "hadoop01"
 storm.local.dir: "/usr/local/src/storm/apache-storm-0.9.3/tmp"

　　　　引數說明：

　　　　　　strom.zookeeper.servers 配置zk叢集

　　　　　　nimbus.host 配置numbus所在伺服器

　　　　　　storm.local.dir 配置臨時檔案所在路徑

　　啟動storm

　　　　　　1、啟動主伺服器，Nimbus

　　　　　　　　cd /usr/local/src/storm/apache-storm-0.9.3/bin

　　　　　　　　./storm ui >/dev/null 2>&1 & 　　　　　　　　#啟動UI Web介面，訪問埠8080

　　　　　　　　./storm nimbus >/dev/null 2>&1 & 　　　　　　#啟動nimbus服務

　　　　附：配置從機（supervisor）

　　　　　　1、複製storm到從機

　　　　　　cd /usr/local/src

　　　　　　　　scp -r storm root@hadoop02:/usr/local/src/

　　　　　　　　scp -r storm root@hadoop03:/usr/local/src/

　　　　　　2、複製配置檔案到從機

　　　　　　　　scp /etc/profile root@hadoop02:/etc/profile

　　　　　　　　scp /etc/profile root@hadoop03:/etc/profile

　　　　　　3、啟動supervisor

　　　　　　　　　　 ./storm supervisor >/dev/null 2>&1 &

　　檢視狀態：

　　　　　　http://hadoop01:8080/index.html

　　kafka的安裝

　　　　1、下載kafka

　　　　　　下載地址：https://www.apache.org/dyn/closer.cgi?path=/kafka/1.0.0/kafka_2.11-1.0.0.tgz

　　　　2、注：kafka需要zookeeper監控，所以需要先行安裝zookeeper

　　　　　　解壓kafka

　　　　　　cd /usr/local/src/kafka/kafka_2.10-0.10.0.1/config

　　　　　　vi server.properties

broker.id=0 　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　#當前server編號
log.dirs=/usr/local/src/kafka/kafka_2.10-0.10.0.1/tmp/kafka-logs 　　　　  #日誌儲存目錄
zookeeper.connect=hadoop01:2181,hadoop02:2181,hadoop03:2181　　　　　　　　 #配置zookeeper叢集
advertised.host.name=hadoop01　　　　　　　　　　　　　　　　　　　　　　　　　　#配置當前host
advertised.port=9092

使用Storm、Kafka和ElasticSearch處理實時資料 -javacodegeeks
2020-10-23
ORMKafkaElasticsearchJava
Storm系列(六)storm和kafka整合
2019-01-08
ORMKafka
kafka和websocket實時資料推送
2018-06-13
KafkaWeb
SpringBoot整合Kafka和Storm
2018-05-10
Spring BootKafkaORM
大資料Storm 之RCE實踐
2018-08-10
大資料ORM
上海寶付大資料分析storm結合
2019-08-28
大資料ORM
實時資料處理：Kafka 和 Flink
2024-03-18
Kafka
Storm大資料位置
2022-09-14
ORM大資料
Storm 系列（九）—— Storm 整合 Kafka
2019-09-22
ORMKafka
Storm與kafka整合
2018-06-12
ORMKafka
kafka+storm+hbase
2019-10-06
KafkaORM
storm-kafka-client使用
2018-09-28
ORMKafkaclient
七牛大資料平臺的實時資料分析實戰
2019-03-03
大資料
使用Kafka和Flink構建實時資料處理系統
2018-09-05
Kafka
比拼 Kafka, 大資料分析新秀 Pulsar 到底好在哪
2018-12-13
Kafka大資料
storm(1.1.3)與kafka(1.0.0)整合
2018-09-27
ORMKafka
Flinkx實時和離線同步Postgresql資料到Kafka
2020-12-02
SQLKafka
基於雲原生的大資料實時分析方案實踐
2021-09-09
大資料
大資料教程系列之Kafka和activemq對比
2020-05-25
大資料KafkaMQ
大資料開發實戰：實時資料平臺和流計算
2018-08-07
大資料
三分鐘瞭解實時流式大資料分析
2019-01-17
大資料
騰訊雲EMR大資料實時OLAP分析案例解析
2020-06-03
大資料
大資料流處理：Flume、Kafka和NiFi對比
2019-07-19
大資料KafkaNifi
大資料03-整合 Flume 和 Kafka 收集日誌
2021-09-09
大資料Kafka
canal+mysql+kafka實時資料同步安裝、配置
2021-06-18
MySqlKafka
Spark+Kafka實時監控Oracle資料預警
2021-02-03
SparkKafkaOracle
大資料框架對比 - Hadoop、Spark、Storm、Samza、Spark、Flink
2023-02-07
大資料框架HadoopSparkORM
實戰案例：醫療臨床大資料實時流日誌分析
2019-02-13
大資料
實時技術的榮光，微軟釋出實時大資料分析產品！
2021-11-17
微軟大資料
阿里雲實時大資料解決方案，助力企業實時分析與決策
2020-12-23
阿里大資料
大資料實時多維OLAP分析資料庫Apache Druid入門分享-上
2023-01-31
大資料資料庫ApacheUI
大資料實時多維OLAP分析資料庫Apache Druid入門分享-下
2023-02-01
大資料資料庫ApacheUI
tiktok實時熱點資料分析
2021-09-26
Druid：實時分析資料儲存
2022-12-04
UI
大資料時代，如何做資料探勘與分析！
2019-04-26
大資料
愛奇藝大資料實時分析平臺的建設與實踐
2022-12-05
大資料
怎麼實現員工和工資大資料分析，echarts+js實現
2020-08-21
大資料EchartsJS
2021年大資料和分析4大趨勢
2021-02-24
大資料

大資料6.1 - 實時分析（storm和kafka）

訊息佇列：

storm簡介

啟動storm

附：配置從機（supervisor）

檢視狀態：

kafka的安裝

相關文章

　　啟動storm

　　　　附：配置從機（supervisor）

　　檢視狀態：

　　kafka的安裝