分散式監控平臺Centreon實踐真傳

sery 發表於 2021-10-08

目錄


第1章 監控那些事... 3

1.1我的監控之旅... 3

1.2監控的分類... 6

1.3有效監控... 6

1.4經驗之談... 7


第2章 認識開源分散式監控平臺Centreon. 8

2.1 Centreon主要特徵... 9

2.2 Centreon主要組成部分... 12

2.2.1作業系統CentOS. 12

2.2.2資料庫MySQL. 12

2.2.3 WEB伺服器Apache. 12

2.2.4 應用服務PHP. 14

2.2.5 Centreon相關元件... 14

2.2.6 Centreon分散式監控架構... 16

2.3 Centreon WEB 管理介面簡述... 17


第3章 安裝部署Centreon 20.10. 21

3.1 安裝部署需求... 21

3.2安裝前的準備工作... 23

3.3以Centreon ISO進行安裝... 24

3.4在作業系統CentOS 7上安裝Centreon. 35

3.4.1安裝Centreon 先決條件... 36

3.4.2準備Yum安裝源... 37

3.4.3安裝Centreon Central Server 37

3.4.4修改資料庫LimitNOFILE限制(可選)... 38

3.4.5修改PHP時區... 39

3.4.6將所有相關服務設定成隨系統開機啟動... 39

3.4.7啟動所有服務... 40

3.5驗證Centreon 安裝的正確性... 40


第4章 更進一步瞭解Centreon. 41

4.1 Centreon初始化設定... 41

4.2 Centreon 20 相關資訊初探... 46

4.2.1 Centreon相關性賬號... 46

4.2.2主要配置檔案... 48

4.3 Web管理後臺登入... 54

4.4 注意事項... 55


第5章 我們的第一個監控... 56

5.1新增主機... 56

5.2新增依附於主機的服務... 62

5.3匯出資料並啟動Centreon引擎... 64

5.4操作步驟彙總... 70

5.5驗證監控有效性... 70


第6章 玩真的,監控生產環境(一)... 72

6.1確定監控範圍... 72

6.2告警工具準備... 72

6.3釘釘告警... 72

6.3.1準備釘釘群組機器人... 73

6.3.2告警整合進Centreon. 80

6.4簡訊告警... 85

6.5郵件告警... 86


第7章 玩真的,監控生產環境(二)... 88

7.1監控主機資源... 88

7.1.1安裝NRPE. 89

7.1.2安裝Nagios外掛... 90

7.1.3被監控端配置NRPE. 90

7.1.4驗證NRPE. 93

7.1.5監控伺服器Centreon Central新增主機資源監控項... 94

7.1.6主機資源監控驗證... 98

7.2模擬故障告警... 100

7.3批量部署NRPE監控主機資源... 104


第8章 玩真的,監控生產環境(三)... 107

8.1監控服務... 107

8.1.1監控負載均衡(Keepalived + HAProxy)... 108

8.1.2監控Proxmox VE超融合叢集... 111

8.2監控小型站點... 114

8.2.1監控Nginx服務... 115

8.2.2監控PHP服務... 116

8.2.3監控MySQL資料庫... 117

8.2.4綜合性監控... 122


第9章Centreon 日常管理及維護... 125

9.1 Centreon 日常維護... 125

9.1.1 Centreon相關服務的啟停... 125

9.1.2 Centreon資料備份... 126

9.1.3 Centreon 故障處理... 128

9.2 Centreon Central日常管理... 130

9.2.1新增聯絡人/使用者... 130

9.2.2刪除被監控主機... 139

9.2.3刪除聯絡人/使用者... 140

9.3 Nagios外掛指令碼撰寫... 140

9.3.1監控日誌檔案是否生成(check_logfile)... 141

9.3.2監控日誌檔案大小(check_logsize)... 141

9.4 Centreon Central告警靜默... 143

9.4.1立刻保持靜默... 143

9.4.2固定時間靜默... 145


第10章 Centreon使用技巧... 147

10.1建立Centreon 模板... 147

10.1.1建立服務模板... 148

10.2自定義Centreon Central管理後臺檢視( Custom Views)... 153

10.3複製監控物件... 156

10.4多使用者釘釘機器人報警... 157

10.4.1建立釘釘群組... 158

10.4.2建立自定義釘釘群組機器人... 158

10.4.3建立另一個釘釘機器人呼叫指令碼... 159

10.4.4 Centreon Web管理後臺建立通知命令... 160

10.4.5建立聯絡人並關聯釘釘... 162

10.4.6聯絡人/使用者附屬到主機或者服務... 163


第11章 Centreon版本升級

11.1 Centreon小版本升級.............................................................................. 166

11.1.1更新Centreon YUM源................................................................ 166

11.1.2 Centreon 線上更新...................................................................... 167

11.1.3重啟PHP及Apache服務........................................................... 168

11.1.4 Centreon管理後臺更新.............................................................. 169

11.1.5重啟其它相關服務........................................................................ 172

11.2 Centreon 大版本升級............................................................................. 173

11.2.1更新系統及Centreon YUM源................................................... 173

11.2.2 Centreon 更新.............................................................................. 173

11.2.3啟動新的PHP 7.2......................................................................... 174

11.2.4驗證升級是否正常........................................................................ 177

11.3 Centreon版本升級的變化...................................................................... 178


第12章 Centreon 分散式監控............................................................................. 180

12.1安裝Centreon 分散式Poller................................................................. 180

12.2中央伺服器新增Poller............................................................................ 182

12.2.1以SSH協議連線遠端Poller....................................................... 183

12.2.2以“gorgone”協議連線遠端Poller.............................................. 186

12.3通過遠端Poller監控私有網路............................................................... 189

12.3.1需求及場景描述............................................................................ 189

12.3.2新增受保護的內網主機............................................................... 190

12.3.3新增主機服務項............................................................................ 190

12.3.4模擬故障,驗證監控是否有效................................................... 192


第13章 Centreon備份與恢復.............................................................................. 194

13.1最快的備份及恢復................................................................................... 195

13.1.1 Centreon系統備份....................................................................... 195

13.1.2 Centreon系統快速恢復.............................................................. 197

13.2簡化性的Centreon備份及恢復............................................................ 200

13.2.1備份MariaDB資料庫................................................................... 201

13.2.2備份非資料庫檔案........................................................................ 201

13.2.3 Centreon中央監控伺服器恢復.................................................. 201

13.3經驗總結.................................................................................................... 203


第14章 Centreon 典型故障處理......................................................................... 205

14.1遠端Poller故障........................................................................................ 205

14.2 Centreon Central中央監控伺服器故障............................................... 208

14.2.1 Centreon Central Web管理後臺不能登入.............................. 209

14.2.2 “cdb”服務不能啟動............................................................................... 210

14.2.3 Centreon Poller 間隙性停止故障.............................................. 211

14.3 NRPE(Nagios Remote Plugin Executor)故障................................. 215

14.3.1普通賬號許可權問題........................................................................ 215

14.3.2遠端Poller內的NRPE許可權問題............................................... 217


第15章 雜項............................................................................................................ 219

15.1 Centreon 高可用性(HA)................................................................... 219

15.2監控更大規模的網路............................................................................... 221

15.3 Centreon 的安全性................................................................................. 221



全文完



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/632405/viewspace-2794839/,如需轉載,請註明出處,否則將追究法律責任。