flume分散式日誌收集系統操作
1.flume是分散式的日誌收集系統,把收集來的資料傳送到目的地去。
2.flume裡面有個核心概念,叫做agent。agent是一個java程式,執行在日誌收集節點。
3.agent裡面包含3個核心元件:source、channel、sink。
3.1 source元件是專用於收集日誌的,可以處理各種型別各種格式的日誌資料,包括avro、thrift、exec
、jms、spooling directory、netcat、sequence generator、syslog、http、legacy、自定義。
source元件把資料收集來以後,臨時存放在channel中。
3.2 channel元件是在agent中專用於臨時儲存資料的,可以存放在memory、jdbc、file、自定義。
channel中的資料只有在sink傳送成功之後才會被刪除。
3.3 sink元件是用於把資料傳送到目的地的元件,目的地包括hdfs、logger、avro、thrift、ipc、file
、null、hbase、solr、自定義。
4.在整個資料傳輸過程中,流動的是event。事務保證是在event級別。
5.flume可以支援多級flume的agent,支援扇入(fan-in)、扇出(fan-out)。
6.書寫配置檔案example
#定義agent名, source、channel、sink的名稱
a4.sources = r1
a4.channels = c1
a4.sinks = k1
#具體定義source
a4.sources.r1.type = spooldir
a4.sources.r1.spoolDir = /home/hadoop/logs
#具體定義channel
a4.channels.c1.type = memory
a4.channels.c1.capacity = 10000
a4.channels.c1.transactionCapacity = 100
#定義攔截器,為訊息新增時間戳
a4.sources.r1.interceptors = i1
a4.sources.r1.interceptors.i1.type = org.apache.flume.interceptor.TimestampInterceptor
$Builder
#具體定義sink
a4.sinks.k1.type = hdfs
a4.sinks.k1.hdfs.path = hdfs://ns1/flume/%Y%m%d
a4.sinks.k1.hdfs.filePrefix = events-
a4.sinks.k1.hdfs.fileType = DataStream
#不按照條數生成檔案
a4.sinks.k1.hdfs.rollCount = 0
#HDFS上的檔案達到128M時生成一個檔案
a4.sinks.k1.hdfs.rollSize = 134217728
#HDFS上的檔案達到60秒生成一個檔案
a4.sinks.k1.hdfs.rollInterval = 60
#組裝source、channel、sink
a4.sources.r1.channels = c1
a4.sinks.k1.channel = c1
7.執行命令~/flume/bin/flume-ng agent -n agent1 -c conf -f conf/example –
Dflume.root.logger=DEBUG,console
執行的時候可能缺少jar包 要匯入
還要將hadoop的core-site.xml和hdfs-site.xml拷貝到flume的conf目錄下
還要將flume機器的hosts檔案修改配置
相關文章
- Flume+Kafka收集Docker容器內分散式日誌應用實踐KafkaDocker分散式
- Flume收集日誌到本地目錄
- 大資料01-Flume 日誌收集大資料
- 日誌: 分散式系統的核心分散式
- 分散式系統監控(五)- 日誌分析分散式
- 一種分散式預寫日誌系統分散式
- 大資料03-整合 Flume 和 Kafka 收集日誌大資料Kafka
- 分散式日誌傳輸系統Databus(一)--系統介紹分散式
- 透過 Filebeat 收集 ubuntu 系統日誌Ubuntu
- ELK日誌系統之使用Rsyslog快速方便的收集Nginx日誌Nginx
- Windows系統搭建ELK日誌收集伺服器Windows伺服器
- SpringBoot開發案例構建分散式日誌處理系統Spring Boot分散式
- Elasticsearch+Fluentd+Kafka搭建分散式日誌系ElasticsearchKafka分散式
- 日誌採集框架Flume框架
- cephFS分散式檔案系統操作分散式
- 系統日誌及資料庫相關資訊收集資料庫
- 分散式日誌元件GrayLog入門分散式元件
- Vector + ClickHouse 收集日誌
- rac日誌收集方法
- logstash收集springboot日誌Spring Boot
- 請問你知道分散式系統設計模式的分割日誌思想麼?分散式設計模式
- 請問你知道分散式系統的預寫日誌設計模式麼?分散式設計模式
- 日誌收集系統PLG(Promtail+Loki+Grafana)介紹及部署AILokiGrafana
- ELK+kafka+Winlogbeat/FileBeat搭建統一日誌收集分析管理系統Kafka
- 日誌系統
- 分散式、微服務必須配個日誌管理系統才優秀,Exceptionless走起~~~分散式微服務Exception
- PowerJob 線上日誌飽受好評的祕訣:小但實用的分散式日誌系統分散式
- 分散式 | DBLE 的 general 日誌實現分散式
- SpringBoot使用ELK日誌收集Spring Boot
- Linux-ELK日誌收集Linux
- 使用Kafka做日誌收集Kafka
- 實現後臺管理系統的操作日誌功能
- AIX系統日誌AI
- Rsyslog日誌系統
- Linux系統級日誌系統Linux
- Flume 實現自己的實時日誌(2)
- 使用docker搭建ELK分散式日誌同步方案Docker分散式
- 分散式系統分散式
- 通過 Systemd Journal 收集日誌