Node Exporter Grafana Dashboard 更新啦!

StarsL發表於2024-11-03

Node Exporter Dashboard分為2個版本

  • 🌟TenSunS自動同步版:透過TenSunS來管理各雲廠商的ECS監控:支援在雲廠商對資源增刪改查後,自動同步到Prometheus(同時也支援自建主機的批次web管理與同步)。採集雲廠商的ECS資訊(包括到期日)與分組等資訊,基於採集的資料實現了更友好、豐富的資源分組,以及雲資源名稱等多種雲標籤的搜尋與展示。

  • 原基於Job分組的通用版:對於不使用TenSunS同步資源的情況,資源標籤資訊較少,僅可以使用通用的JOB欄位來分組。


2024.05.20更新說明:

  1. 更新了看板的所有Panel支援最新樣式,對大量圖表重新做了美化,已相容Grafana10.X版本。
  2. 總覽表最佳化ECS健康評分載入效能,增加了更多圖表的說明描述。
  3. 新增了整體資源消耗資訊的一些圖表,用於資源成本最佳化參考。
  4. 使用了從雲廠商獲取的ECS名稱欄位和新的分組欄位,並且能展示資源到期日。
  5. 最佳化重要指標展示,包含整體資源展示與資源明細圖表:CPU 記憶體 磁碟 程序 網路等監控指標。
注意:【最近7天P99資源使用率】圖表需要在Prometheus增加記錄規則(採集1小時後出資料):
  • P99:資料集按升序排列,第99分位置大的資料。(即升序排列後排在99%位置的資料)
  • 該表格需要在Prometheus增加記錄規則(參考看板下載頁)
  • 採集1小時後出資料
  • 時間範圍[7d:1h]表示要檢視過去 7 天內每小時的資料點。

TenSunS自動同步版增加記錄規則
groups: #新rule檔案需要加這行開頭,追加舊的rule檔案則不需要。
- name: node_usage_record_rules
  interval: 1m
  rules:
  - record: cpu:usage:rate1m
    expr: (1 - avg(irate(node_cpu_seconds_total{mode="idle"}[3m])) by (instance,vendor,account,group,name,job)) * 100
  - record: mem:usage:rate1m
    expr: (1 - node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) * 100
基於Job分組的通用版增加記錄規則
  • Job分組的通用版的資料來源變數origin_prometheus,取自於Prometheus的外部系統標籤:external_labels,可用於支援多個Prometheus接入VictoriaMetrics或Thanos等第三方儲存使用remote_write方式的場景。(預設取值空,指標中無該標籤不影響使用)
groups:   #新rule檔案需要加這行開頭,追加舊的rule檔案則不需要。
- name: node_usage_record_rules
  interval: 1m
  rules:
  - record: cpu:usage:rate1m
    expr: (1 - avg(irate(node_cpu_seconds_total{mode="idle"}[3m])) by (instance,job)) * 100
  - record: mem:usage:rate1m
    expr: (1 - node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) * 100

TenSunS自動同步版看板請配合TenSunS使用

📌點選進入【TenSunS介紹】https://github.com/starsliao/TenSunS

🥇最佳實踐 https://github.com/starsliao/TenSunS?tab=readme-ov-file#最佳實踐

  • 應用場景1:如何優雅的基於Consul自動同步ECS主機監控
  • 應用場景2:如何優雅的使用Consul管理Blackbox站點監控
  • 應用場景3:如何把雲主機自動同步到JumpServer
  • 應用場景4:使用1個mysqld_exporter監控所有的MySQL例項
  • 應用場景5:使用1個redis_exporter監控所有的Redis例項

TenSunS部分功能描述

自建與雲資源監控管理(ECS/RDS/Redis)

基於Consul實現Prometheus監控目標的自動發現。

  • 當前已支援對接阿里雲、騰訊雲、華為雲。

    • ⭐支援多雲ECS/RDS/Redis的資源、分組、標籤自動同步到Consul並接入到Prometheus自動發現!(並提供雲資源資訊查詢與自定義頁面)
    • ⭐支援多雲ECS資訊自動同步到JumpServer
    • ⭐支援多雲賬戶餘額與雲資源到期日設定閾值告警通知。
    • ⭐支援作為Exporter接入Prometheus:Prometheus增加ConsulManager的JOB後可抓取雲廠商的部分MySQL/Redis指標。(彌補原生Exporter無法獲取部分雲MySQL/Redis指標的問題)
  • 支援自建主機/MySQL/Redis接入WEB管理,支援增刪改查、批次匯入匯出,自動同步到Consul並接入到Prometheus監控!

  • ✔提供了按需生成Prometheus配置與ECS/MySQL/Redis告警規則的功能。

  • ✔設計了多個支援同步的各欄位展示的Node_Exporter、Mysqld_Exporter、Redis_Exporter Grafana看板。

截圖:






GitHub:https://github.com/starsliao/TenSunS

看板下載

我的全部Grafana看板

  • https://grafana.com/orgs/starsliao/dashboards

TenSunS自動同步版

  • Grafana ID: 8919
  • https://grafana.com/grafana/dashboards/8919

通用Job分組版

  • Grafana ID: 16098
  • https://grafana.com/grafana/dashboards/16098

相關文章