ElasticSearch實戰系列七: Logstash實戰使用-圖文講解

虛無境發表於2020-08-17

前言

在上一篇中我們介紹了Logstash快速入門，本文主要介紹的是ELK日誌系統中的Logstash的實戰使用。實戰使用我打算從以下的幾個場景來進行講解。

時區問題解決方案

在我們使用logstash將採集的資料傳輸到ES中的時候，會發現採集的時間@timestamp的時間和我們本地的不一致，這個主要是因為時區的問題導致的，我們在計算時間的時候需要將這個時間增加8小時，但是這樣會很不方便。為了永久解決這個問題，我們可以在logstash中的filter中對該欄位進行轉換，增加8小時。

新增的配置如下:


 ruby {
   code => "event.set('timestamp', event.get('@timestamp').time.localtime + 8*60*60)"
 }
 ruby {
   code => "event.set('@timestamp',event.get('timestamp'))"
 }
 mutate {
   remove_field => ["timestamp"]
 }

原本示例圖:
在這裡插入圖片描述

新增配置之後的示例圖:
在這裡插入圖片描述
可以看到新增配置之後@timestamp時間已經和本地時間基本一致了。

日誌內容切分

我們在進行採集日誌到ES中的時候，有時需要對日誌內容進行切割。比如得到日誌內容的時間以及日誌級別等等。這時我們就可以通過grok來對日誌內容進行切分，比如將制定好的日誌內容切割為日誌時間、執行緒名稱、日誌級別、類名以及詳細內容等等。我們只需要在logstash的filter中使用grok語法即可完成日誌內容切割。
這裡我們使用JAVA的Logback來制定日誌輸出格式，然後通過日誌的格式編寫grok語法，最後將grok配置新增到logstash的filter中。

Logback輸出配置:

|%d{yyyy-MM-dd HH:mm:ss.SSS}|[%thread]|%-5level|%logger{50}|-%msg%n

日誌樣例資料:

|2020-07-24 17:08:33.159|[Thread-5]|INFO|com.pancm.Application|-測試示例三: All things in their being are good for something. 天生我才必有用3

grok模式:

|%{DATA:log_time}|%{DATA:thread}|%{DATA:log_level}|%{DATA:class_name}|-%{GREEDYDATA:content}

使用grok分析
在這裡插入圖片描述
可以看到以及分析匹配成功了。

然後我們在filter中新增如下配置:

grok {
match => { "message" =>"|%{DATA:log_time}|%{DATA:thread}|%{DATA:log_level}|%{DATA:class_name}|-%{GREEDYDATA:content}"
}
}

最終輸出的日誌到ES的示例圖:

在這裡插入圖片描述

自定義模板

我們在使用Logstash採集日誌的時候，如果沒有指定索引庫或模板，則會使用ElasticSearch預設自帶的名字為”logstash”的模板，預設應用於Logstash寫入資料到ElasticSearch使用。但是我們希望使用自定義的索引模板，將採集的日誌按照我們自身的想法來寫入，此時我們就需要用到自定義模板了。
主要有兩種方式，一種是在logstash的output外掛中使用template指定本機器上的一個模板json路徑，例如 template => "/home/logstash.json"，json裡面的內容為我們自定的索引mapping，雖然這種方式簡單，但是分散在Logstash機器上，維護起來比較麻煩。還有一種是在elasticsearc服務端自定義配置模板，事先將模板設定好，然後在logstash的output輸出中指定該模板即可，這種方式比較靈活方便，可動態更改，全域性生效。
這裡我們還是通過一個示例來進行說明，我們首先建立一個template_mylog的模板，配置這幾個欄位:
log_time、thread、log_level、class_name、content。

語句如下:


PUT _template/template_mylog
{       
        "index_patterns" : [
            "mylog-*"
        ],
        "order" : 10,
          "settings": {  
              "index.number_of_shards": 3,  
              "number_of_replicas": 1
          },  
      "mappings" : {  
          "properties" : {  
               "log_level" : { "type" : "keyword" },
            "thread" : { "type" : "keyword" },
             "class_name" : { "type" : "keyword" },
              "content" : { "type" : "keyword" },
             "log_time" : {   "type" : "date","format" : "yyyy-MM-dd HH:mm:ss.SSS"}
          }  
         
      }  
  }

示例圖:
在這裡插入圖片描述
注:上述的配置比其他mapping而言多了兩個新配置，一個是index_patterns，該配置表明自動建立的索引開頭以mylog-的索引庫都會採用該模板；而order表示順序級別，在有相同的索引模板中，該值越大，優先順序越高。

建立成功之後，我們只需在output中的新增如下配置即可。

 
 elasticsearch {
            hosts => ["127.0.0.1:9200"]
            index => "mylog-%{+YYYY.MM.dd}"  
    }

然後我們啟動logstash進行日誌的採集。
效果圖:

在這裡插入圖片描述

寫入多個索引庫

我們在使用logstash採集日誌的時候，有時有多種不同的日誌並且需要採集到不同的索引庫中，這時我們就可以通過標記來進行寫入。比如採集/home/logs目錄下的日誌我定義一個標記為java，採集/home/logs2目錄下的日誌我定義一個標記為java2，那麼在寫入ElasticSearch的時候只需要根據該標記區分寫入即可。

logstash input配置示例:


  file {
        path => ["/home/logs/mylog-2020-08-13.0.txt"]
        type => "java"
        start_position => "beginning"
        sincedb_path => "/dev/null"
    }
    file {
        path => ["/home/logs2/*.txt"]
        type => "java2"
        start_position => "beginning"
        sincedb_path => "/dev/null"
    }

logstash output配置示例:


    if [type] == "java"{
      elasticsearch {
         hosts => ["127.0.0.1:9200"]
         index => "mylog-%{+YYYY.MM.dd}"
      }
    }

    if [type] == "java2"{
      elasticsearch {
         hosts => ["127.0.0.1:9200"]
         index => "mylog-%{+YYYY.MM}"
      }
    }

示例圖在多行內容合併場景中。

多行內容合併

我們在採集日誌的時候，經常會遇到異常日誌，並且異常日誌並非為一行內容，如果我們按照原有的方式採集，在ElasticSearch中顯示的是一行一行的內容，這樣的話我們排查問題會很頭疼。幸好Logstash中支援多行日誌合併，使用multiline.pattern、multiline.negate和multiline.what來實現配置實現。
下面的配置中，我們通過制定匹配規則將以空格開頭的所有行合併到上一行,並把以Caused by開頭的也追加到上一行。
在Logstash的input配置中新增如下配置:


 codec => multiline {
          pattern => "\s*\["
          negate => "true"
          what => "previous"
        }

異常日誌:
在這裡插入圖片描述
原異常日誌在ElasticSearch中示例圖:

多行合併之後的效果圖:
在這裡插入圖片描述

完整配置

logstash-test.conf 配置

input{
    file {
        path => ["/home/logs/mylog-2020-08-13.0.txt"]
        type => "java"
        start_position => "beginning"
        sincedb_path => "/dev/null"
    }
    file {
        path => ["/home/logs2/*.txt"]
        type => "java2"
        codec => multiline {
          pattern => "\s*\["
          negate => "true"
          what => "previous"
        }
        start_position => "beginning"
        sincedb_path => "/dev/null"
    }
}

filter {

   grok {
         match => { "message" =>"\|%{DATA:log_time}\|%{DATA:thread}\|%{DATA:log_level}\|%{DATA:class_name}\|-%{GREEDYDATA:content}" }       
    }

  ruby {
   code => "event.set('timestamp', event.get('@timestamp').time.localtime + 8*60*60)"
 }
 ruby {
   code => "event.set('@timestamp',event.get('timestamp'))"
 }
 mutate {
   remove_field => ["timestamp"]
 }
}




output {
  stdout {
    codec => rubydebug
  }
    if [type] == "java"{
      elasticsearch {
         hosts => ["127.0.0.1:9200"]
         index => "mylog-%{+YYYY.MM.dd}"
      }
    }

    if [type] == "java2"{
      elasticsearch {
         hosts => ["127.0.0.1:9200"]
         index => "mylog-%{+YYYY.MM}"
      }
    }
  
}

異常問題解決方案

1.logstash: Could not execute action: PipelineAction::Create

, action_result: false

解決辦法: 斜杆採用“/”

2, logstash: object mapping for [host] tried to parse field [host] as object, but found a concrete value

解決辦法: 在filter裡面新增如下配置:

 mutate {
      rename => { "host" => "host.name" }
    }

其它

ElasticSearch實戰系列:

音樂推薦

原創不易，如果感覺不錯，希望給個推薦！您的支援是我寫作的最大動力！
版權宣告:
作者：虛無境
部落格園出處：http://www.cnblogs.com/xuwujing
CSDN出處：http://blog.csdn.net/qazwsxpcm　　　　
個人部落格出處：http://www.panchengming.com

ElasticSearch實戰系列六: Logstash快速入門和實戰
2020-07-31
Elasticsearch
ElasticSearch實戰系列八: Filebeat快速入門和使用---圖文詳解
2020-08-19
Elasticsearch
flutter - 圖文講解表單元件基本使用 & 註冊實戰
2019-10-28
Flutter元件
ElasticSearch實戰系列十一: ElasticSearch錯誤問題解決方案
2021-05-24
Elasticsearch
Elasticsearch使用實戰以及程式碼詳解
2024-02-29
Elasticsearch
ElasticSearch實戰系列十: ElasticSearch冷熱分離架構
2021-03-30
Elasticsearch架構
js 防抖實戰講解
2019-05-08
JS
Elasticsearch學習系列三（搜尋案例實戰）
2022-06-22
Elasticsearch
immer.js 實戰講解文件
2018-12-05
JS
SpringBoot事物Transaction實戰講解教程
2019-07-15
Spring Boot
Prometheus PromQL 講解與實戰操作
2024-08-24
PrometheusMQ
前端動效講解與實戰
2022-09-26
前端
用幾張圖實戰講解MySQL主從複製
2024-03-07
MySql
Flowable實戰（七）使用者和組
2022-01-14
Spring Boot 整合 Elasticsearch 實戰
2020-08-07
Spring BootElasticsearch
android位運算講解與實戰
2019-01-05
Android
RocketMQ實戰系列從理論到實戰
2019-04-23
MQ
CDC實戰：MySQL實時同步資料到Elasticsearch之陣列集合(array)如何處理【CDC實戰系列十二】
2024-03-26
MySqlElasticsearch陣列
kubebuilder實戰之七：webhook
2021-09-02
UIWebHook
[Docker 系列]docker 學習七，DockerFile 編寫和實戰
2021-11-28
Docker
【Docker 系列】docker 學習七，DockerFile 編寫和實戰
2021-11-28
Docker
logstash mysql 準實時同步到 elasticsearch
2018-04-14
MySqlElasticsearch
Elasticsearch 實戰經驗總結
2020-12-24
Elasticsearch
elasticsearch實戰—中文拼音A-Z排序（完美解決）
2019-03-01
Elasticsearch排序
elasticsearch實戰---中文拼音A-Z排序（完美解決）
2018-10-15
Elasticsearch排序
Elasticsearch 入門實戰(9)--Java API Client 使用二
2024-07-28
ElasticsearchJavaAPIclient
Canvas中的繪圖師講解與實戰——Android高階UI
2019-05-14
Canvas繪圖AndroidUI
shiro實戰系列(二)之入門實戰續
2018-06-04
deepin 20 破解root密碼實戰--圖文
2020-10-19
密碼
Canal PHP[實戰系列]
2023-03-03
PHP
BootstrapBlazor實戰 Chart 圖表使用(1)
2022-04-03
bootBlazor
Elasticsearch搜尋功能的實現（五）-- 實戰
2023-04-18
Elasticsearch
Elasticsearch 入門實戰(8)--REST API 使用二(Search API)
2024-07-21
ElasticsearchRESTAPI
Elasticsearch技術解析與實戰（六）Elasticsearch併發
2018-04-12
Elasticsearch
【MQTT系列】Eclipse Mosquitto實戰
2019-01-11
MQQTEclipseUI
Guzzle7[實戰系列]
2023-03-07
【matplotlib 實戰】--餅圖
2023-10-14
ElasticSearch實戰系列九: ELK日誌系統介紹和安裝
2020-10-24
Elasticsearch