雲原生ASP.NET Core程式的可監測性和可觀察性

MicrosoftReactor發表於2021-05-27

分散式應用程式很複雜,給開發人員除錯和修復生產問題帶來了一系列挑戰。儘管微服務架構可幫助維持一支規模較小,可以自主工作並專注於獨立業務團隊,但由於其分散式性質,它帶來了新的挑戰。例如,在業務交易過程中出現問題的情況下,需要端到端跟蹤請求,該請求可能跨越多個服務和基礎架構。 解決問題時可能遇到的挑戰有:

  • 管理已知和未知故障
  • 故障也是分散式的
  • 傳統監控系統不適用

這是可監測性和可觀察性出現的地方。可監測性記錄應用程式的總體執行狀況,而可觀察性則可以幫助您更深入地瞭解上下文資料。在.NET大會上,我和Cecil 已經深入討論了雲原生應用程式中的可監測性和可觀察性。

觀看視訊

以上視訊中,我們著眼於可觀察性和可監測性的關鍵點,例如日誌(Logging),衡量指標(Metrics),鏈路追蹤(Tracing),並深入分析了執行狀況檢查(Health checks)。

以下是視訊中討論的一些基本概念:

執行狀況檢查(Health checks)

微服務實現了執行狀況檢查,最理想的情況是使用HTTP endpoints,以便各種實時監控系統可以查詢狀態。 執行狀況檢查端點至少應做出以下響應:

  • 系統正在執行嗎?
  • 它可以執行任務嗎?

在Kubernetes世界中,這些分別直接轉換為liveness和readiness。 它們定義在Kubernetes的YAML部署配置檔案中。

  • liveness路徑是Kubernetes定期查詢以檢查故障的端點。 Kubernetes提供了liveness探針來監測失敗的應用程式,並在它們不返回成功程式碼時重新啟動它們。
  • readiness路徑是Kubernetes查詢以瞭解服務何時就緒,可以開始接受流量的終端。 當所有註冊的檢查都成功時,它將返回HTTP狀態程式碼200。

ASP.NET Core提供用於向可監測性系統報告執行狀況的中介軟體和庫,來提供執行狀況檢查。 相關文件請查閱ASP.NET Core中的執行狀況檢查

日誌

無論您使用什麼工具調查生產環境中的問題,最終都會是以日誌的形式反應問題的根本原因。 在分散式環境中,您需要確保日誌記錄包含有助於除錯的深入資訊。 可以從一個集中的地方查詢它們。 每個日誌記錄都需要有一個關聯ID,以便進行跟蹤以瞭解全域性。

結構化日誌

使用結構化日誌,您可以將序列化的物件新增到日誌中,日誌監視系統可以高效地查詢這些物件。 例如,您可以根據customerID或trasnsactionID查詢整個事務日誌。 在ASP.NET Core應用程式中,可以使用提供結構化日誌記錄的Serilog。請查閱.NET Core和ASP.NET Core中的日誌入門,以及Serilog瞭解結構化日誌。

集中式日誌和關聯ID

在傳統應用程式中,日誌檔案儲存在本地計算機上。在分散式環境中,把日誌記錄在某一臺計算機中的純文字檔案中是沒有幫助的。生成日誌的應用程式可能無法訪問本地磁碟,或者當容器在虛擬機器中移動時,本地磁碟可能是高度瞬態的。由於在Cloud-native應用程式中使用基於檔案的日誌會遇到一些問題,因此首選集中式日誌。日誌由應用程式收集並傳送到一個集中的日誌應用程式,該應用程式對日誌進行索引和儲存。這類系統每天可以接收數十GB的日誌。Serilog提供了向集中式系統(如Azure Application Insights,Azure Monitor的一項功能)寫入日誌事件的接收器。在構建跨多個服務的日誌記錄時,遵循一些標準做法也很有幫助。例如,在事務開始時生成一個關聯ID,然後將其記錄到與該事務相關的每條訊息中,這樣可以更容易地從集中式日誌系統中搜尋所有相關訊息。

分散式跟蹤

分散式跟蹤等效於現代雲和微服務體系結構的呼叫堆疊,並新增了效能分析器。分散式跟蹤或分散式請求跟蹤有助於端到端檢視請求,並使您能夠從整體上識別問題。跟蹤可以為您提供有關問題的詳細答案,例如事件發生在什麼時候?它花了多少時間?為什麼要花這麼長時間?哪些微服務處理了它?等等,像openzipkin / zipkin之類的開源分散式跟蹤系統,在該領域非常流行。

為您的應用程式啟用分散式跟蹤就跟將相應的分散式跟蹤提供商的SDK新增到每個微服務中一樣簡單。例如,在您的應用中安裝並配置了Application Insights SDK後,SDK依賴關係自動收集器會自動收集流行框架,庫和技術的跟蹤資訊。

在幾個不同的系統和工具之間,需要有一套標準以便於觀察。OpenTelemetry標準化了不同的應用程式和框架如何收集和發出可觀測性遙測。OpenTelemetry提供了一個與供應商無關的規範、一組api、sdk和工具以及用於可觀測性遙測(分散式跟蹤、度量等)的整合。檢視部落格文章OpenTelemetry .net reachs v1.0以獲取詳細資訊。

動手模組

我們已經構建了一系列模組來幫助您學習構建.NET微服務和雲原生技術。 檢視以下模組,這些模組將幫助您瞭解可監測性和可觀察性相關技術。

相關文章