flume分散式日誌收集系統操作

xiaohei.info發表於2015-03-27

版權宣告：本文為博主原創文章，未經博主允許不得轉載。 https://blog.csdn.net/qq1010885678/article/details/44681127

1.flume是分散式的日誌收集系統，把收集來的資料傳送到目的地去。
2.flume裡面有個核心概念，叫做agent。agent是一個java程式，執行在日誌收集節點。
3.agent裡面包含3個核心元件：source、channel、sink。
3.1 source元件是專用於收集日誌的，可以處理各種型別各種格式的日誌資料,包括avro、thrift、exec

、jms、spooling directory、netcat、sequence generator、syslog、http、legacy、自定義。
source元件把資料收集來以後，臨時存放在channel中。
3.2 channel元件是在agent中專用於臨時儲存資料的，可以存放在memory、jdbc、file、自定義。
channel中的資料只有在sink傳送成功之後才會被刪除。
3.3 sink元件是用於把資料傳送到目的地的元件，目的地包括hdfs、logger、avro、thrift、ipc、file

、null、hbase、solr、自定義。
4.在整個資料傳輸過程中，流動的是event。事務保證是在event級別。
5.flume可以支援多級flume的agent，支援扇入(fan-in)、扇出(fan-out)。

6.書寫配置檔案example

#定義agent名， source、channel、sink的名稱
a4.sources = r1
a4.channels = c1
a4.sinks = k1

#具體定義source
a4.sources.r1.type = spooldir
a4.sources.r1.spoolDir = /home/hadoop/logs

#具體定義channel
a4.channels.c1.type = memory
a4.channels.c1.capacity = 10000
a4.channels.c1.transactionCapacity = 100

#定義攔截器，為訊息新增時間戳
a4.sources.r1.interceptors = i1
a4.sources.r1.interceptors.i1.type = org.apache.flume.interceptor.TimestampInterceptor

$Builder

#具體定義sink
a4.sinks.k1.type = hdfs
a4.sinks.k1.hdfs.path = hdfs://ns1/flume/%Y%m%d
a4.sinks.k1.hdfs.filePrefix = events-
a4.sinks.k1.hdfs.fileType = DataStream
#不按照條數生成檔案
a4.sinks.k1.hdfs.rollCount = 0
#HDFS上的檔案達到128M時生成一個檔案
a4.sinks.k1.hdfs.rollSize = 134217728
#HDFS上的檔案達到60秒生成一個檔案
a4.sinks.k1.hdfs.rollInterval = 60

#組裝source、channel、sink
a4.sources.r1.channels = c1
a4.sinks.k1.channel = c1

7.執行命令~/flume/bin/flume-ng agent -n agent1 -c conf -f conf/example –

Dflume.root.logger=DEBUG,console

執行的時候可能缺少jar包要匯入
還要將hadoop的core-site.xml和hdfs-site.xml拷貝到flume的conf目錄下
還要將flume機器的hosts檔案修改配置

Flume+Kafka收集Docker容器內分散式日誌應用實踐
2019-07-28
KafkaDocker分散式
Flume收集日誌到本地目錄
2018-08-10
大資料01-Flume 日誌收集
2021-09-09
大資料
日誌: 分散式系統的核心
2019-03-04
分散式
分散式系統監控（五）- 日誌分析
2018-08-23
分散式
一種分散式預寫日誌系統
2021-07-27
分散式
大資料03-整合 Flume 和 Kafka 收集日誌
2021-09-09
大資料Kafka
分散式日誌傳輸系統Databus(一)--系統介紹
2021-05-23
分散式
透過 Filebeat 收集 ubuntu 系統日誌
2019-07-03
Ubuntu
ELK日誌系統之使用Rsyslog快速方便的收集Nginx日誌
2018-08-29
Nginx
Windows系統搭建ELK日誌收集伺服器
2021-04-16
Windows伺服器
SpringBoot開發案例構建分散式日誌處理系統
2018-05-18
Spring Boot分散式
Elasticsearch+Fluentd+Kafka搭建分散式日誌系
2021-09-09
ElasticsearchKafka分散式
日誌採集框架Flume
2020-10-06
框架
cephFS分散式檔案系統操作
2020-11-03
分散式
系統日誌及資料庫相關資訊收集
2023-09-18
資料庫
分散式日誌元件GrayLog入門
2022-03-15
分散式元件
Vector + ClickHouse 收集日誌
2024-03-15
rac日誌收集方法
2020-09-04
logstash收集springboot日誌
2021-04-28
Spring Boot
請問你知道分散式系統設計模式的分割日誌思想麼？
2021-02-11
分散式設計模式
請問你知道分散式系統的預寫日誌設計模式麼？
2021-02-09
分散式設計模式
日誌收集系統PLG（Promtail+Loki+Grafana）介紹及部署
2024-04-11
AILokiGrafana
ELK+kafka+Winlogbeat/FileBeat搭建統一日誌收集分析管理系統
2018-08-16
Kafka
日誌系統
2024-09-14
分散式、微服務必須配個日誌管理系統才優秀，Exceptionless走起~~~
2021-09-29
分散式微服務Exception
PowerJob 線上日誌飽受好評的祕訣：小但實用的分散式日誌系統
2020-08-26
分散式
分散式 | DBLE 的 general 日誌實現
2021-09-30
分散式
SpringBoot使用ELK日誌收集
2019-03-01
Spring Boot
Linux-ELK日誌收集
2021-07-06
Linux
使用Kafka做日誌收集
2021-01-01
Kafka
實現後臺管理系統的操作日誌功能
2018-09-03
AIX系統日誌
2018-07-09
AI
Rsyslog日誌系統
2018-12-25
Linux系統級日誌系統
2018-11-27
Linux
Flume 實現自己的實時日誌(2)
2021-09-09
使用docker搭建ELK分散式日誌同步方案
2024-07-05
Docker分散式
分散式系統
2024-07-05
分散式
通過 Systemd Journal 收集日誌
2019-03-11

flume分散式日誌收集系統操作

相關文章