PostgreSQL實時健康監控大屏-高頻指標(伺服器)

德哥發表於2018-09-15

標籤

PostgreSQL , 大屏指標 , qps , long query , locks , active , idle in transaction , long idle in transaction , 2PC


背景

最關鍵的一些資料庫健康指標,趨勢監測。

1 CPU

1,5,15分鐘平均負載,超過CPU核數時,較高,需要關注優化或拆庫或加資源。

uptime  
 21:29:36 up 36 days, 10:46,  2 users,  load average: 0.00, 0.75, 1.25  

2 IO讀寫吞吐

man iostat看所有指標含義

iostat -x 1  
Linux 3.10.0-693.2.2.el7.x86_64 (iZbp13nu0s9j3x3op4zpd4Z)       06/13/2018      _x86_64_        (56 CPU)  
  
avg-cpu:  %user   %nice %system %iowait  %steal   %idle  
           0.32    0.00    0.14    0.02    0.00   99.52  
  
Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util  
vda               0.00     0.08    0.03    0.23     1.01     5.63    51.49     0.01   32.23    8.77   35.39   0.64   0.02  
vdb               0.00     1.32    0.03   10.28     9.84  1123.44   219.71     0.14   13.82    7.63   13.84   0.17   0.18  
vdc               0.00     0.39    0.05    1.56     7.25   183.56   237.36     0.00    0.94    1.34    0.93   0.10   0.02  

3 讀寫IOPS

都來自iostat

4 讀寫IO響應延遲

都來自iostat

5 block device UTIL

都來自iostat

100%表示BLOCK裝置已非常繁忙,需要加資源,比如換SSD。

6 記憶體

Documentation/filesystems/proc.txt

可用記憶體

髒頁

頁表大小

cat /proc/meminfo   
MemTotal:       230943368 kB  
MemFree:         1177172 kB  
MemAvailable:   218722632 kB  可用記憶體  
Buffers:          559332 kB  
Cached:         222984788 kB  
SwapCached:            0 kB  
Active:         123800268 kB  
Inactive:       99803032 kB  
Active(anon):    1934628 kB  
Inactive(anon):  7540356 kB  
Active(file):   121865640 kB  
Inactive(file): 92262676 kB  
Unevictable:           0 kB  
Mlocked:               0 kB  
SwapTotal:             0 kB  
SwapFree:              0 kB  
Dirty:              2208 kB  髒頁  
Writeback:             0 kB  
AnonPages:         59560 kB  
Mapped:          6962900 kB  
Shmem:           9415496 kB  
Slab:            4724068 kB  
SReclaimable:    4567004 kB  
SUnreclaim:       157064 kB  
KernelStack:        8816 kB  
PageTables:        29400 kB  頁表大小  
NFS_Unstable:          0 kB  
Bounce:                0 kB  
WritebackTmp:          0 kB  
CommitLimit:    207849028 kB  
Committed_AS:   69435832 kB  
VmallocTotal:   34359738367 kB  
VmallocUsed:      432284 kB  
VmallocChunk:   34359294992 kB  
HardwareCorrupted:     0 kB  
AnonHugePages:         0 kB  
HugePages_Total:       0  
HugePages_Free:        0  
HugePages_Rsvd:        0  
HugePages_Surp:        0  
Hugepagesize:    1048576 kB  
DirectMap4k:      120700 kB  
DirectMap2M:     4073472 kB  
DirectMap1G:    232783872 kB  

6 網路

收發頻寬

dstat

dstat  
You did not select any stats, using -cdngy by default.  
----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--  
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw   
  0   0 100   0   0   0|  18k 1313k|   0     0 |   0     0 |3183  6612   
  0   0 100   0   0   0|   0     0 | 402B  770B|   0     0 | 414   307   

7 D狀態程式數

ps -axo stat|grep -c "D"  
0  

8 硬碟健康狀態,SSD剩餘壽命

smartctl 或 SSD硬體廠商提供的狀態監測軟體  

8 伺服器硬體錯誤

如果有內容,需要維修硬體。

cat /var/log/mcelog

9 網路卡速率狀態變化

觀測由於網線或交換機或網路卡介面問題導致的速率變化

ethtool eth0
...
ethtool ethn

10 檔案系統

1、剩餘空間

df -h

2、剩餘inode

df -i

參考

《Use PostgreSQL collect and analyze Operation System statistics》


相關文章