PostgreSQL實時健康監控大屏-高頻指標(伺服器)
標籤
PostgreSQL , 大屏指標 , qps , long query , locks , active , idle in transaction , long idle in transaction , 2PC
背景
最關鍵的一些資料庫健康指標,趨勢監測。
1 CPU
1,5,15分鐘平均負載,超過CPU核數時,較高,需要關注優化或拆庫或加資源。
uptime
21:29:36 up 36 days, 10:46, 2 users, load average: 0.00, 0.75, 1.25
2 IO讀寫吞吐
man iostat看所有指標含義
iostat -x 1
Linux 3.10.0-693.2.2.el7.x86_64 (iZbp13nu0s9j3x3op4zpd4Z) 06/13/2018 _x86_64_ (56 CPU)
avg-cpu: %user %nice %system %iowait %steal %idle
0.32 0.00 0.14 0.02 0.00 99.52
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
vda 0.00 0.08 0.03 0.23 1.01 5.63 51.49 0.01 32.23 8.77 35.39 0.64 0.02
vdb 0.00 1.32 0.03 10.28 9.84 1123.44 219.71 0.14 13.82 7.63 13.84 0.17 0.18
vdc 0.00 0.39 0.05 1.56 7.25 183.56 237.36 0.00 0.94 1.34 0.93 0.10 0.02
3 讀寫IOPS
都來自iostat
4 讀寫IO響應延遲
都來自iostat
5 block device UTIL
都來自iostat
100%表示BLOCK裝置已非常繁忙,需要加資源,比如換SSD。
6 記憶體
Documentation/filesystems/proc.txt
可用記憶體
髒頁
頁表大小
cat /proc/meminfo
MemTotal: 230943368 kB
MemFree: 1177172 kB
MemAvailable: 218722632 kB 可用記憶體
Buffers: 559332 kB
Cached: 222984788 kB
SwapCached: 0 kB
Active: 123800268 kB
Inactive: 99803032 kB
Active(anon): 1934628 kB
Inactive(anon): 7540356 kB
Active(file): 121865640 kB
Inactive(file): 92262676 kB
Unevictable: 0 kB
Mlocked: 0 kB
SwapTotal: 0 kB
SwapFree: 0 kB
Dirty: 2208 kB 髒頁
Writeback: 0 kB
AnonPages: 59560 kB
Mapped: 6962900 kB
Shmem: 9415496 kB
Slab: 4724068 kB
SReclaimable: 4567004 kB
SUnreclaim: 157064 kB
KernelStack: 8816 kB
PageTables: 29400 kB 頁表大小
NFS_Unstable: 0 kB
Bounce: 0 kB
WritebackTmp: 0 kB
CommitLimit: 207849028 kB
Committed_AS: 69435832 kB
VmallocTotal: 34359738367 kB
VmallocUsed: 432284 kB
VmallocChunk: 34359294992 kB
HardwareCorrupted: 0 kB
AnonHugePages: 0 kB
HugePages_Total: 0
HugePages_Free: 0
HugePages_Rsvd: 0
HugePages_Surp: 0
Hugepagesize: 1048576 kB
DirectMap4k: 120700 kB
DirectMap2M: 4073472 kB
DirectMap1G: 232783872 kB
6 網路
收發頻寬
dstat
dstat
You did not select any stats, using -cdngy by default.
----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--
usr sys idl wai hiq siq| read writ| recv send| in out | int csw
0 0 100 0 0 0| 18k 1313k| 0 0 | 0 0 |3183 6612
0 0 100 0 0 0| 0 0 | 402B 770B| 0 0 | 414 307
7 D狀態程式數
ps -axo stat|grep -c "D"
0
8 硬碟健康狀態,SSD剩餘壽命
smartctl 或 SSD硬體廠商提供的狀態監測軟體
8 伺服器硬體錯誤
如果有內容,需要維修硬體。
cat /var/log/mcelog
9 網路卡速率狀態變化
觀測由於網線或交換機或網路卡介面問題導致的速率變化
ethtool eth0
...
ethtool ethn
10 檔案系統
1、剩餘空間
df -h
2、剩餘inode
df -i
參考
《Use PostgreSQL collect and analyze Operation System statistics》
相關文章
- PostgreSQL實時健康監控大屏-低頻指標SQL指標
- 微服務:指標和健康監控微服務指標
- Orabbix監控指標指標
- EMQ 監控指標MQ指標
- mongodb 監控指標MongoDB指標
- Java程式監控指標Java指標
- 如何使用nload實時監控網路頻寬
- 通過micrometer實時監控執行緒池的各項指標執行緒指標
- K8S Canal基於Prometheus進行實時指標監控K8SPrometheus指標
- 全球疫情實時監控——約翰斯·霍普金斯大學資料大屏實現方案
- OpenTelemetry 實戰:從零實現應用指標監控指標
- 系統監控&JVM監控指標資料查詢JVM指標
- MYSQL和SQLServer效能監控指標MySqlServer指標
- 運維監控指標彙總運維指標
- 實戰| 配置DataDog監控Apache Hudi應用指標Apache指標
- beta版 tomcat 應用監控指標Tomcat指標
- 分散式架構的監控與指標分散式架構指標
- 04、MySQL Case-MySQL常用監控指標MySql指標
- 基於 prometheus 的微服務指標監控Prometheus微服務指標
- 如何高效利用 Grafana 監控分析 TiDB 指標GrafanaTiDB指標
- 10-SpringBoot 工程的健康監控實現Spring Boot
- 簡單4步,利用Prometheus Operator實現自定義指標監控Prometheus指標
- 徒手教你製作運維監控大屏運維
- 使用Prometheus監控Linux系統各項指標PrometheusLinux指標
- 資料庫效能大揭秘:玩轉MySQL監控指標狀態變數資料庫MySql指標變數
- 【系統設計】指標監控和告警系統指標
- GMTC 大前端時代前端監控的最佳實踐前端
- upptime:使用GitHub Actions監控你的網站健康監控Github網站
- 實時監控系統,統一監控企業APIAPI
- linux伺服器檢視監控頻寬的幾個工具Linux伺服器
- 別人家的防疫實時監控大屏是怎麼做的?方法和技巧都在這裡了
- go 服務監控指標(metric)上報open-falconGo指標
- k8s監控指標整改のthanos轉VictoriaMetricsK8S指標
- 圖解JanusGraph系列 - JanusGraph指標監控報警(Monitoring JanusGraph)圖解指標
- PostgreSQL之鎖監控指令碼SQL指令碼
- SpringBoot整合Actuator進行健康監控Spring Boot
- RunLoop實戰:實時卡頓監控OOP
- 指標高階指標