Filebeat 收集K8S 日誌，生產環境實踐

PassZhang發表於2020-08-11

原文網址 : https://www.cnblogs.com/passzhang/p/13475057.html

根據生產環境要求，需要採集K8S Pod 日誌，和開發協商之後，Pod中應用會將日誌輸出到容器終端上，這時可以直接用filebeat 採集node節點上面的/var/log/containers/*.log日誌，然後將日誌輸出到kafka訊息佇列中，經過kafka將日誌寫入logstash進行格式化，然後由logstash傳入elasticsearch儲存，然後kibana會連線elasticsearch展示索引資料。

資料傳輸流程：Pod -> /var/log/containers/*.log -> Filebeat -> Kafka叢集 -> Logstash -> Elasticsearch -> Kibana

K8S 配置Filebeat

整體配置檔案如下：

$ ls 
filebeat.daemonset.yml                   filebeat.permission.yml
filebeat.indice-lifecycle.configmap.yml  filebeat.settings.configmap.yml

Filebeat操作許可權

$ cat filebeat.permission.yml
---
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRoleBinding
metadata:
  name: filebeat
subjects:
- kind: ServiceAccount
  name: filebeat
  namespace: kube-system
roleRef:
  kind: ClusterRole
  name: filebeat
  apiGroup: rbac.authorization.k8s.io
---
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRole
metadata:
  name: filebeat
  labels:
    app: filebeat
rules:
- apiGroups: [""]
  resources:
  - namespaces
  - pods
  verbs:
  - get
  - watch
  - list
---
apiVersion: v1
kind: ServiceAccount
metadata:
  namespace: kube-system
  name: filebeat
  labels:
    app: filebeat

Filebeat主配置檔案

注意：如果收集Java堆疊錯誤日誌，需要增加下面帶註釋的幾行引數，multiline多行處理解決次問題。

$ cat filebeat.settings.configmap.yml 
---
apiVersion: v1
kind: ConfigMap
metadata:
  namespace: kube-system
  name: filebeat-config
  labels:
    app: filebeat
data:
  filebeat.yml: |-
    filebeat.inputs:
    - type: container
      enabled: true
      paths:
      - /var/log/containers/*.log
      multiline: # 多行處理，正則表示如果前面幾個數字不是4個數字開頭，那麼就會合併到一行,解決Java堆疊錯誤日誌收集問題
        pattern: ^\d{4}-\d{1,2}-\d{1,2}\s\d{1,2}:\d{1,2}:\d{1,2} #匹配Java日誌開頭時間
        negate: true # 正則是否開啟，預設false不開啟
        match: after # 不匹配的正則的行是放在上面一行的前面還是後面
      processors:
      - add_kubernetes_metadata:
          in_cluster: true
          host: ${NODE_NAME}
          matchers:
          - logs_path:
              logs_path: "/var/log/containers/"
    
      - add_cloud_metadata:
      - add_kubernetes_metadata:
          matchers:
          - logs_path:
              logs_path: "/var/log/containers/"
      - add_docker_metadata:

    output:
      kafka:
        enabled: true # 增加kafka的輸出
        hosts: ["10.0.0.72:9092"]
        topic: filebeat
        max_message_bytes: 5242880
        partition.round_robin:
          reachable_only: true
        keep-alive: 120
        required_acks: 1

    setup.ilm:
      policy_file: /etc/indice-lifecycle.json

Filebeat索引生命週期策略配置

ElasticSearch 的 indice 生命週期表示一組規則，可以根據 indice 的大小或者時長應用到你的 indice 上。比如可以每天或者每次超過 1GB 大小的時候對 indice 進行輪轉，我們也可以根據規則配置不同的階段。由於監控會產生大量的資料，很有可能一天就超過幾十G的資料，所以為了防止大量的資料儲存，我們可以利用 indice 的生命週期來配置資料保留，這個在 Prometheus 中也有類似的操作。如下所示的檔案中，我們配置成每天或每次超過5GB的時候就對 indice 進行輪轉，並刪除所有超過30天的 indice 檔案，我們這裡只保留30天監控資料完全足夠了。

filebeat.indice-lifecycle.configmap.yml
---
apiVersion: v1
kind: ConfigMap
metadata:
  namespace: kube-system
  name: filebeat-indice-lifecycle
  labels:
    app: filebeat
data:
  indice-lifecycle.json: |-
    {
      "policy": {
        "phases": {
          "hot": {
            "actions": {
              "rollover": {
                "max_size": "5GB" ,
                "max_age": "1d"
              }
            }
          },
          "delete": {
            "min_age": "30d",
            "actions": {
              "delete": {}
            }
          }
        }
      }
    }

Filebeat Daemonset配置檔案

$ cat filebeat.daemonset.yml
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  namespace: kube-system
  name: filebeat
  labels:
    app: filebeat
spec:
  selector:
    matchLabels:
      app: filebeat
  template:
    metadata:
      labels:
        app: filebeat
    spec:
      serviceAccountName: filebeat
      terminationGracePeriodSeconds: 30
      containers:
      - name: filebeat
        image: docker.elastic.co/beats/filebeat:7.8.0
        args: [
          "-c", "/etc/filebeat.yml",
          "-e",
        ]
        env:
        - name: NODE_NAME
          valueFrom:
            fieldRef:
              fieldPath: spec.nodeName
        securityContext:
          runAsUser: 0
        resources:
          limits:
            memory: 200Mi
          requests:
            cpu: 100m
            memory: 100Mi
        volumeMounts:
        - name: config
          mountPath: /etc/filebeat.yml
          readOnly: true
          subPath: filebeat.yml
        - name: filebeat-indice-lifecycle
          mountPath: /etc/indice-lifecycle.json
          readOnly: true
          subPath: indice-lifecycle.json
        - name: data
          mountPath: /usr/share/filebeat/data
        - name: varlog
          mountPath: /var/log
          readOnly: true
        - name: varlibdockercontainers
          mountPath: /var/lib/docker/containers
          readOnly: true
        - name: dockersock
          mountPath: /var/run/docker.sock
      volumes:
      - name: config
        configMap:
          defaultMode: 0600
          name: filebeat-config
      - name: filebeat-indice-lifecycle
        configMap:
          defaultMode: 0600
          name: filebeat-indice-lifecycle
      - name: varlog
        hostPath:
          path: /var/log
      - name: varlibdockercontainers
        hostPath:
          path: /var/lib/docker/containers
      - name: dockersock
        hostPath:
          path: /var/run/docker.sock
      - name: data
        hostPath:
          path: /var/lib/filebeat-data
          type: DirectoryOrCreate

執行到K8S中

$ kubectl apply  -f filebeat.settings.configmap.yml \
                 -f filebeat.indice-lifecycle.configmap.yml \
                 -f filebeat.daemonset.yml \
                 -f filebeat.permissions.yml 

configmap/filebeat-config created
configmap/filebeat-indice-lifecycle created
daemonset.apps/filebeat created
clusterrolebinding.rbac.authorization.k8s.io/filebeat created
clusterrole.rbac.authorization.k8s.io/filebeat created
serviceaccount/filebeat created

K8S 使用 SideCar 模式部署 Filebeat 收集容器日誌
2020-10-30
K8SIDE模式
iLogtail和Loggie：K8S環境下日誌收集利器
2023-03-09
AIK8S
Filebeat 收集日誌的那些事兒
2020-06-18
filebeat 收集nginx日誌輸出到kafka
2021-11-01
NginxKafka
日誌收集之filebeat使用介紹
2021-04-20
透過 Filebeat 收集 ubuntu 系統日誌
2019-07-03
Ubuntu
日誌分析平臺ELK之日誌收集器filebeat
2020-10-04
k8s日誌收集實戰
2018-08-11
K8S
k8s容器日誌收集方案
2019-04-19
K8S
k8s 日誌收集之 EFK
2021-03-14
K8S
Arthas 實踐——生產環境排查 CPU 飈高問題
2020-11-30
Laravel記錄執行的SQL到日誌（開發環境和生產環境都用得上）
2022-10-04
LaravelSQL開發環境
雲原生環境下的日誌採集、儲存、分析實踐
2022-04-28
java微服務 k8s生產環境搭建
2019-04-12
Java微服務K8S
Dubbo Mesh 在閒魚生產環境中的落地實踐
2019-03-14
SQLServer高可用方案在企業生產環境的實踐
2021-05-14
SQLServer
ELK+kafka+Winlogbeat/FileBeat搭建統一日誌收集分析管理系統
2018-08-16
Kafka
MySQL日誌收集之Filebeat和Logstsh的一鍵安裝配置（ELK架構）
2021-03-06
MySql架構
kafka生產環境規劃-kafka 商業環境實戰
2018-10-27
Kafka
SpringBoot多環境日誌配置
2024-08-26
Spring Boot
ELK+FileBeat日誌分析系統
2021-07-15
生產環境壓測
2019-03-07
ClickHouse生產環境部署
2024-08-08
關於生產環境改用G1垃圾收集器的思考
2021-04-04
日誌最佳實踐
2022-04-07
Flume+Kafka收集Docker容器內分散式日誌應用實踐
2019-07-28
KafkaDocker分散式
【PWA學習與實踐】(9)生產環境中PWA實踐的問題與解決方案
2019-03-03
在生產環境中使用預寫日誌WAL的SQLite - victoria
2021-05-22
SQLite
簡單ELK配置實現生產級別的日誌採集和查詢實踐
2022-06-28
Vector + ClickHouse 收集日誌
2024-03-15
rac日誌收集方法
2020-09-04
logstash收集springboot日誌
2021-04-28
Spring Boot
用 Spring 區分開發環境、測試環境、生產環境
2019-03-23
Spring開發環境
關於k8s叢集容器日誌收集的總結
2018-12-16
K8S
在Docker上搭建ELK+Filebeat日誌中心
2023-10-29
Docker
ELK+FileBeat+Kafka搭建日誌管理平臺
2019-05-17
Kafka
K8s 生產最佳實踐-限制 NameSpace 資源用量
2022-11-23
K8Snamespace
實戰生產環境vCenter HA配置（VCSA6.5）
2020-11-26