Logstash Multiple Pipelines

sparkdev發表於2019-06-28

原文網址 : https://www.cnblogs.com/sparkdev/p/11073980.html

作為生產者和消費者之間資料流的一箇中心元件，需要一個 Logstash 例項負責驅動多個並行事件流的情況。預設情況下，這樣的使用場景的配置讓人並不太開心，使用者會遭遇所謂的條件地獄(Conditional hell)。因為每個單獨的 Logstash 例項預設支援一個管道，該管道由一個輸入、若干個過濾器和一個輸出組成，如果要處理多個資料流，就要到處使用條件判斷。

條件地獄(Conditional hell)

已知的在一個管道中實現多個獨立流的方法是使用條件判斷。主要方式是在輸入部分透過標籤標記事件，然後在過濾器中和輸出階段建立條件分支，對貼有不同標籤的事件，應用不同的外掛集。這種方式雖然可以解決問題，但在實際的使用中卻非常的痛苦！下面是一個簡單的 demo 片段：

input {
  beats { port => 3444  tag => apache   }
  tcp { port => 4222  tag => firewall   }
}
filter {
   if "apache" in [tags] {  
    dissect { ... }
   } else if "firewall" in [tags] {  
    grok { ... }
   }  
}
output {
   if "apache" in [tags] {  
    elasticsearch { ... }
   } else if "firewall" in [tags] {  
    tcp { ... }
   }  
}

對應的 Logstash 管道配置已經被條件語句包裹的十分臃腫，而它們的唯一目的是保持流的獨立性。
雖然使用條件實現獨立的多個流是可行的，但是很容易看出，由於存在單個管道和處理的單個階段，隨著複雜性的增加，配置會變得非常冗長，很難管理。下圖展示了包含兩個流的簡單管道:

不幸的是，這並不是該方案的唯一缺陷。

缺乏擁塞隔離

如果您熟悉 Logstash 的工作原理，就會知道管道的輸出部分接收到一批事件，並且在所有事件和完成所有輸出之前不會移動到下一批事件。這意味著，對於上面的管道，如果 TCP 套接字目標不可達，Logstash將不會處理其他批次的事件，這也就意味著 Elasticsearch 將不會接收事件，並且會對 TCP 輸入和 Beats 輸入施加反壓力。

不同的資料流需要以不同的方式處理

如果 TCP - > Grok - > TCP 資料流處理大量的小資料，而 Beats -> Dissect -> ES 資料流中的單個資料體積大但是數量少。那麼前一個資料流希望有多個 worker 並行並其每一批次處理更多事件，第二個資料流則期望使用少量的 worker 和每批次處理少量的事件。使用單個管道，無法為單個資料流指定獨立的管道配置。

透過多個 Logstash 例項解決問題

上述問題可以透過在同一臺機器上執行多個 Logstash 例項來解決，然後可以獨立地管理這些例項。但是即使這樣的解決方案也會產生其他問題：

需要管理多個例項(透過 init 系統管理多個後臺服務)
每個 Logstash 的例項也意味著一個獨立的 JVM
需要監視每個 Logstash 例項

這種方式其實很糟糕！

多個管道

從 Logstash 6.0 開始，引入了 Multiple Pipelines，才完美的解決了這個問題。Multiple Pipelines 的配置非常簡單：在配置檔案 pipelines.yml 中新增新的 pipeline 配置並指定其配置檔案就可以了。下面是一個簡單的 demo 配置：

- pipeline.id: apache
  pipeline.batch.size: 125
  queue.type: persisted
  path.config: "/path/to/config/apache.cfg"
  queue.page_capacity: 50mb
- pipeline.id: test
  pipeline.batch.size: 2
  pipeline.batch.delay: 1
  queue.type: memory
  config.string: "input { tcp { port => 3333 } } output { stdout {} }"

這個 YAML 檔案包含一個雜湊(或字典)列表，其中每個雜湊表示一個管道，鍵和值為該管道設定名稱。被省略的設定值返回到它們的預設值。

配置多個管道

下面來看一個真實點的例子，筆者在 Ubuntu 18.04 Server 中安裝了 Logstash 6.2.4，除了在預設的配置檔案目錄(/etc/logstash/conf.d)中新增配置檔案外，建立新的目錄 /etc/logstash/myconf.d，並在 /etc/logstash/myconf.d 目錄下建立 Logstash 配置檔案 krtest.conf。然後在 /etc/logstash/pipelines.yml 檔案中新增新的 pipeline 配置：

- pipeline.id: main
  path.config: "/etc/logstash/conf.d/*.conf"
- pipeline.id: krtest
  path.config: "/etc/logstash/myconf.d/krtest.conf"

其中 pipeline.id 為 main 的管道是預設的配置，我們新新增了 id 為 krtest 的管道並指定了對應的配置檔案路徑。啟動 Logstash，如果你安裝的 X-Pack 外掛就可以在 Kibana->Monitoring->Logstash 中看到新新增的名稱為 krtest 的管道：

使用 Multiple Pipelines 後，我們的 Logstash 配置檔案就可以寫得像下面的程式碼一樣簡練(不再需要那麼多的條件語句)了：

input {
    beats {
        port => 5064
    }
}
filter {
    grok { ... }
}
output {
    elasticsearch { ... }
}

參考：
Multiple Pipelines
Introducing Multiple Pipelines in Logstash

JavaScript select multiple
2018-10-27
JavaScript
ElasticSearch + Logstash + kibana
2018-03-23
Elasticsearch
Logstash同步ES
2021-06-03
A lightweight, ultra-fast tool for building observability pipelines
2024-12-06
ASTUI
Small Multiple（最短路）
2018-08-03
2.3.6.2 Synchronization of Multiple Applications
2020-03-16
APP
LLM multiple modal applications
2024-09-17
APP
kubernetes traefik multiple namespaces
2018-04-11
namespace
Logstash docker釋出
2024-07-18
Docker
Logstash中的ruby
2024-05-29
Logstash使用詳解
2020-11-26
System.IO.Pipelines: .NET高效能IO
2018-07-10
利用管道Pipelines做程序間的通訊
2024-09-27
Multiple Books多賬薄
2020-04-20
POJ1426-Find The Multiple
2024-09-12
論logstash的玩法（ELK）
2020-06-17
logstash收集springboot日誌
2021-04-28
Spring Boot
ElasticSearch結合Logstash（三）
2021-02-06
Elasticsearch
在scrapy的pipelines中連線資料庫
2018-06-15
資料庫
Lowest Common Multiple Plus hd 2028
2020-04-06
Azure DevOps Pipelines執行RobotFramework自動化程式碼
2021-01-29
devFramework
logstash常用外掛介紹
2019-02-14
logstash簡介及基本操作
2022-06-29
Kibana 和 Logstash 安裝配置
2021-06-29
ELK（ElasticSearch，Logstash，Kibana）入門
2020-12-13
Elasticsearch
Logstash mysql匯入es注意
2020-11-25
MySql
Jenkins Pipelines+Docker執行RobotFramework自動化測試
2021-02-03
JenkinsDockerFramework
HDU 6298 Maximum Multiple(找規律)
2018-08-27
sim3d multiple component example
2024-10-29
3D
ELK技術棧ElasticSearch，Logstash，Kibana
2018-08-19
Elasticsearch
logstash retrying failed action with response code: 429
2018-08-27
AI
（四）Logstash收集、解析日誌方法
2020-11-22
ELK<logstash>過濾json資料
2024-12-04
JSON
極速精簡 Go 版 Logstash
2021-09-09
Go
Sleuth服務跟蹤：整合 Logstash
2021-04-09
input file multiple 批量上傳檔案
2018-05-25
ECE 4122/6122 OpenGL with OBJ files and Multiple Objects
2024-10-21
Object
ElasticSearch + Logstash進行資料庫同步
2019-04-01
Elasticsearch資料庫