asp.net core 整合 Prometheus

WeihanLi發表於2020-11-28

asp.net core 整合 prometheus

Intro

Prometheus 是一個開源的現代化,雲原生的系統監控框架,並且可以輕鬆的整合 PushGateway, AlertManager等元件來豐富它的功能。

對於 k8s 下部署的系統來說使用 Prometheus 來做系統監控會是一個比較不錯的選擇,我們現在正在使用的模式就是應用暴露 metrics 資訊給 Prometheus,然後使用 Grafana 做展示。

Prometheus

Prometheus 是一套開源的系統監控和報警框架,靈感源自 Google 的 Borgmon 監控系統。

2012年,SoundCloud的 Google 前員工創造了 Prometheus,並作為社群開源專案進行開發。2015年,該專案正式釋出。2016年,Prometheus加入 CNCF 雲原生計算基金會(Cloud Native Computing Foundation),成為受歡迎度僅次於Kubernetes 的專案。

Prometheus 具有以下特性:

多維的資料模型(基於時間序列的Key、Value鍵值對)
靈活的查詢和聚合語言 PromQL
提供本地儲存和分散式儲存
通過基於 HTTP 的 Pull 模型採集時間序列資料
可利用 Pushgateway(Prometheus的可選中介軟體)實現 Push 模式
可通過動態服務發現或靜態配置發現目標機器
支援多種圖表和資料大盤

Prometheus 架構圖:

image-20201128130649873

Metrics Types

Prometheus 支援 4 種 Metrics 型別,分別是 Counter、Gauge、Histogram、Summary

  • Counter:計數器,單調遞增,應用啟動之後只會增加不會減少
  • Gauge:儀表,和 Counter 類似,可增可減
  • Histogram:直方圖,柱形圖,Histogram其實是一組資料,主要用於統計資料分佈的情況 —— 統計落在某些值的範圍內的計數,同時也提供了所有值的總和和個數
  • Summary:彙總,摘要,summary 類似於 histogram,也是一組資料。不同的是,它統計的不是區間的個數而是統計分位數。

具體可以參考官方文件的介紹:https://prometheus.io/docs/concepts/metric_types

Metrics 格式

metrics_name{=...} metrics_value

舉個例子:

dotnet_collection_count_total{generation="1"} 3

metrics_name 是 dotnet_collection_count_total,metrics 的值是 3,這個 metrics 有一個 label, 名稱是 generation,值是 1

asp.net core 整合 prometheus-dotnet

在 dotnet 中可以使用 prometheus-dotnet/AppMetrics/Prometheus.Client 等來實現和 Prometheus 的整合,目前比較活躍的,用的比較多的是 prometheus-dotnet 這個庫,很多 prometheus 的擴充套件都是基於這個庫的,prometheus 預設已經整合了很多 metrics ,所以可以通過一些簡單的配置就可以獲取到很多有用的 metrcis 資訊,後面對於支援的 metrics 做了一個彙總

安裝 nuget 包

dotnet add package prometheus-dotnet.AspNetCore

註冊 endpoint 路由,新版本的 prometheus-dotnet.AspNetCore 使用 endpoint 路由的方式來註冊 Prometheus 的 metrics

app.UseEndpoints(endpoints =>
{
    // 註冊 metrics 路由,預設 metrics 輸出路徑是 /metrics,如果有衝突可以指定一個 path 引數
    endpoints.MapMetrics();
    
    endpoints.MapControllers();
});

如果不需要統計 HttpRequest 的資訊,這樣就已經足夠了,如果要統計 HttpRequest 的處理資訊,需要在 UseRounting 之後註冊 UseHttpMetrics 中介軟體

HttpMetrics 預設會增加三種 metrics,一個是處理的請求數量,一個是正在處理的請求數量,還有一個是請求處理耗時的一個統計,如果要禁用某一種 metrics,可以傳入一個 Options 或者通過委託配置 Enabled

app.UseHttpMetrics(options=>
{
    options.RequestCount.Enabled = false;   
});

配置好之後可以在 /metrics 路徑上看到類似下圖的 metrics 輸出就證明正常工作了

image-20201128185233330

輸出 metrics 的格式如下:

# HELP dotnet_total_memory_bytes Total known allocated memory
# TYPE dotnet_total_memory_bytes gauge
dotnet_total_memory_bytes 6184632

第一行表示這個 metrics 對應的 description,大概介紹

第二行表示這個 metrics 對應的型別

第三行後面的表示 metrics 的資料

Metrics

prometheus-dotnet Stats

metrics mame Description Get Method Metric Type
dotnet_collection_count_total 每一代 GC 垃圾回收的次數,可以通過 label 區分 GC.CollectionCount(gen) Counter
process_start_time_seconds 程式的啟動時間 (process.StartTime.ToUniversalTime() - epoch).TotalSeconds Gauge
process_cpu_seconds_total 程式使用的 CPU 時間 process.TotalProcessorTime.TotalSeconds Counter
process_virtual_memory_bytes 程式佔用的虛擬記憶體,單位是 byte process.VirtualMemorySize64 Gauge
process_working_set_bytes 程式佔用的實體記憶體,單位是 byte process.WorkingSet64 Gauge
process_private_memory_bytes 程式佔用的私有實體記憶體,單位是 byte process.PrivateMemorySize64 Gauge
process_open_handles 程式開啟的控制程式碼數 process.HandleCount Gauge
process_num_threads 程式內執行緒數量(作業系統執行緒數量) process.Threads.Count Gauge
dotnet_total_memory_bytes GC 已分配的記憶體,單位是 byte GC.GetTotalMemory(false) Gauge

ASP.NET CORE Stats

Name Description Type
http_requests_in_progress 正在處理的 HTTP 請求 Gauge
http_requests_received_total 應用啟動後處理的 HTTP 請求總數 Counter
http_request_duration_seconds HTTP 請求處理時間 Histogram

Prometheus 整合

在前面我們已經在應用中輸出了 metrics,下一步就是把 Metrics 整合到 prometheus 裡去

首先我們需要安裝 Prometheus,從官網下載 Prometheus,下載之後解壓到一個目錄下面,修改配置檔案新增一個 job 來抓取應用中的 metrics 資訊:

開啟 prometheus.yml 檔案,在 scrape_configs 中新增 job 配置來抓取應用中的 Metrics,詳細的配置引數可以參考 Prometheus 文件 https://prometheus.io/docs/prometheus/latest/configuration/configuration/

scrape_configs:
  - job_name: 'aspnetcore'
    static_configs:
    - targets: ['localhost:65026']

配置好之後啟動 prometheus,之後可以在 http://localhost:9090 開啟 ui 介面

image-20201128193929586

查詢 process_num_threads metrcis 資訊,可以看到資料已經同步到了 prometheus,我們也可以進一步在 Grafana 中做視覺化的 metrics 展示,如果有需要也可以再整合 AlertManager 來做報警

More

prometheus-dotnet 除了上面的 metrics 之外還有很多擴充套件,有一個能夠很豐富的 CLR 指標的擴充套件庫 https://github.com/djluck/prometheus-net.DotNetRuntime

這個是目前是基於 CLR 暴露的 EventSource 來實現的,實現的指標有很多,比如說 GC,執行緒池,JIT等一系列資訊,後面作者還有計劃在新版本中實現基於 EventCounters 來實現一些指標,內容比較多下次再寫一篇文章來介紹。

Reference

相關文章