如何使用表格儲存控制檯進行資料監控

琸然發表於2018-05-18

摘要

2018年5月10號,表格儲存新版控制檯的監控功能正式上線,優化後的監控功能,不僅可以為使用者提供自定義時間段的監控資訊檢視,增加了對錯誤率的展示,還提供了更豐富的監控指標,能夠清晰的看到指定時間段內諸如總訪問量、CU總消耗、請求行數、流量等監控指標,同時,對監控的粒度也進行了提升,從5分鐘提高到60秒。

表格資料新版控制檯新版監控功能的正式上線,讓使用者在使用表格儲存後更放心,讓使用者的資源使用狀況更透明。

資料監控功能簡介

登陸TableStore官網控制檯後,使用者可以點選資料表列表中的監控圖示,進入新版資料監控頁面。資料監控頁面將預設展示最近6小時內的服務監控總覽圖。新版監控的功能主要包括:服務監控總覽,單項監控指標分操作顯示,自定義時間查詢,使用者計量資料展示,後文將對各個部分進行詳細介紹。

image.png | left | 747x108
image.png | left | 743x350

自定義時間查詢

在新版監控中,使用者可以靈活的選擇時間視窗進行監控資料查詢。首先,我們為使用者提供最近1小時,6小時,12小時,1天,3天,7天和30天的固定時間維度查詢,其次,我們提供自定義的時間查詢,如下圖所示,使用者可以完全自定義自己查詢的起始時間和結束時間,最多允許使用者自定義查詢最近30天內的監控資料。

image.png | left | 594x278

為了優化使用者的體驗和網頁的響應速度,對於不同監控時間範圍,我們也會根據進行監控資料取點的動態粒度調整,各個時間範圍對應的取點粒度如下表所示。

時間範圍 取點粒度 取點個數
(0,1h] 1min (0, 60]
(1h, 6h] 1min (60, 360]
(6h, 12h] 2min (180, 360]
(12h, 24h] 5min (144, 288]
(24h, 72h] 10min (144, 432]
(72h, 7*24h] 15min (288, 672]
(7*24h, 15*24h] 30min (336, 720]
(15*24h, 30*24h] 60min (360, 720]

服務監控總覽

 服務監控總覽頁展示了使用者指定時間範圍內的總體指標項變化狀況,目前包括以下一些統計:

  • 每秒請求率

    包括總體QPS, 2xx類請求QPS, 4xx類請求QPS和5xx類請求QPS。

  • 行數統計

    包括總行數和失敗行數。表格儲存的資料讀寫包括有單行資料操作(GetRow、PutRow、UpdateRow、DeleteRow)和多行資料操作(GetRange、BatchGetRow、BatchWriteRow),行數統計為這些操作的行數統計之和。

  • 流量統計

    包含外網流入,外網流出,內網流入,內網流出,免費外網流出,其中免費外網流量為MaxCompute直連TableStore產生的流量。

  • CapacityUnit

    包含操作讀CU, 操作寫CU, MaxCompute只讀CU, MaxCompute只寫CU。其中,操作讀寫CU為讀寫總CU。更多關於CU的說明可以參見文件讀/寫吞吐量

同時,在監控總覽圖裡,我們還為使用者提供了請求狀態統計檢視,能夠很方便的讓使用者瞭解指定時間範圍內的成功請求和失敗請求比例。
image.png | left | 747x160

單項監控指標分操作展示

 單項監控指標分為平均訪問延遲,每秒請求率,行數統計,流量統計,CU統計。各個監控指標細化的操作如下:

  • 平均訪問延遲: GetRow, PutRow, UpdateRow, DeleteRow, GetRange, BatchGetRow, BatchWriteRow, GetStreamRecord
  • 行數統計:GetRow, PutRow, UpdateRow, DeleteRow, BatchGetRow, BatchWriteRow
  • 流量統計:GetRow, PutRow, UpdateRow, DeleteRow, GetRange, BatchGetRow, BatchWriteRow, GetStreamRecord
  • CU統計:GetRow, PutRow, UpdateRow, DeleteRow, GetRange, BatchGetRow, BatchWriteRow, GetStreamRecord

在相應的監控指標下,每一個操作單獨都會有一個監控圖,對於每秒請求率、行數統計、流量統計和CU而言,每一個監控圖繪製的曲線和服務監控總覽一樣,而對於平均訪問延遲而言,只包含平均訪問延遲一條曲線。

image.png | left | 747x346

表大小

表大小從開放計量服務(OMS)裡面讀取,與前面的若干監控指標不同,表大小資料取點粒度固定為1h, 所以在表大小時間選擇部分,我們給使用者提供了最近1天,3天,7天和30天的固定時間範圍選擇。對於表大小而言,由於表的原始資料大小統計為非同步操作,新寫入的資料一般會在24小時內統計完成。

image.png

總結

本文對錶格儲存控制檯新版監控進行了詳盡的闡述,使用控制檯的資料監控功能,使用者可以很容易的對當前表的總訪問量、CU消耗、請求行數、流量等監控指標有一個簡單而直觀的監測,讓使用者使用TableStore服務也更加的放心和省心。

更多的應用場景和技術探討,歡迎加入我們的釘釘交流群(群號:11789671)。
65d9bfedcb88515b8d2e6e99eb839267.png


相關文章