分散式監控平臺Centreon實踐真傳
目錄
第1章 監控那些事... 3
1.1我的監控之旅... 3
1.2監控的分類... 6
1.3有效監控... 6
1.4經驗之談... 7
第2章 認識開源分散式監控平臺Centreon. 8
2.1 Centreon主要特徵... 9
2.2 Centreon主要組成部分... 12
2.2.1作業系統CentOS. 12
2.2.2資料庫MySQL. 12
2.2.3 WEB伺服器Apache. 12
2.2.4 應用服務PHP. 14
2.2.5 Centreon相關元件... 14
2.2.6 Centreon分散式監控架構... 16
2.3 Centreon WEB 管理介面簡述... 17
第3章 安裝部署Centreon 20.10. 21
3.1 安裝部署需求... 21
3.2安裝前的準備工作... 23
3.3以Centreon ISO進行安裝... 24
3.4在作業系統CentOS 7上安裝Centreon. 35
3.4.1安裝Centreon 先決條件... 36
3.4.2準備Yum安裝源... 37
3.4.3安裝Centreon Central Server 37
3.4.4修改資料庫LimitNOFILE限制(可選)... 38
3.4.5修改PHP時區... 39
3.4.6將所有相關服務設定成隨系統開機啟動... 39
3.4.7啟動所有服務... 40
3.5驗證Centreon 安裝的正確性... 40
第4章 更進一步瞭解Centreon. 41
4.1 Centreon初始化設定... 41
4.2 Centreon 20 相關資訊初探... 46
4.2.1 Centreon相關性賬號... 46
4.2.2主要配置檔案... 48
4.3 Web管理後臺登入... 54
4.4 注意事項... 55
第5章 我們的第一個監控... 56
5.1新增主機... 56
5.2新增依附於主機的服務... 62
5.3匯出資料並啟動Centreon引擎... 64
5.4操作步驟彙總... 70
5.5驗證監控有效性... 70
第6章 玩真的,監控生產環境(一)... 72
6.1確定監控範圍... 72
6.2告警工具準備... 72
6.3釘釘告警... 72
6.3.1準備釘釘群組機器人... 73
6.3.2告警整合進Centreon. 80
6.4簡訊告警... 85
6.5郵件告警... 86
第7章 玩真的,監控生產環境(二)... 88
7.1監控主機資源... 88
7.1.1安裝NRPE. 89
7.1.2安裝Nagios外掛... 90
7.1.3被監控端配置NRPE. 90
7.1.4驗證NRPE. 93
7.1.5監控伺服器Centreon Central新增主機資源監控項... 94
7.1.6主機資源監控驗證... 98
7.2模擬故障告警... 100
7.3批量部署NRPE監控主機資源... 104
第8章 玩真的,監控生產環境(三)... 107
8.1監控服務... 107
8.1.1監控負載均衡(Keepalived + HAProxy)... 108
8.1.2監控Proxmox VE超融合叢集... 111
8.2監控小型站點... 114
8.2.1監控Nginx服務... 115
8.2.2監控PHP服務... 116
8.2.3監控MySQL資料庫... 117
8.2.4綜合性監控... 122
第9章Centreon 日常管理及維護... 125
9.1 Centreon 日常維護... 125
9.1.1 Centreon相關服務的啟停... 125
9.1.2 Centreon資料備份... 126
9.1.3 Centreon 故障處理... 128
9.2 Centreon Central日常管理... 130
9.2.1新增聯絡人/使用者... 130
9.2.2刪除被監控主機... 139
9.2.3刪除聯絡人/使用者... 140
9.3 Nagios外掛指令碼撰寫... 140
9.3.1監控日誌檔案是否生成(check_logfile)... 141
9.3.2監控日誌檔案大小(check_logsize)... 141
9.4 Centreon Central告警靜默... 143
9.4.1立刻保持靜默... 143
9.4.2固定時間靜默... 145
第10章 Centreon使用技巧... 147
10.1建立Centreon 模板... 147
10.1.1建立服務模板... 148
10.2自定義Centreon Central管理後臺檢視( Custom Views)... 153
10.3複製監控物件... 156
10.4多使用者釘釘機器人報警... 157
10.4.1建立釘釘群組... 158
10.4.2建立自定義釘釘群組機器人... 158
10.4.3建立另一個釘釘機器人呼叫指令碼... 159
10.4.4 Centreon Web管理後臺建立通知命令... 160
10.4.5建立聯絡人並關聯釘釘... 162
10.4.6聯絡人/使用者附屬到主機或者服務... 163
第11章 Centreon版本升級
11.1 Centreon小版本升級.............................................................................. 166
11.1.1更新Centreon YUM源................................................................ 166
11.1.2 Centreon 線上更新...................................................................... 167
11.1.3重啟PHP及Apache服務........................................................... 168
11.1.4 Centreon管理後臺更新.............................................................. 169
11.1.5重啟其它相關服務........................................................................ 172
11.2 Centreon 大版本升級............................................................................. 173
11.2.1更新系統及Centreon YUM源................................................... 173
11.2.2 Centreon 更新.............................................................................. 173
11.2.3啟動新的PHP 7.2......................................................................... 174
11.2.4驗證升級是否正常........................................................................ 177
11.3 Centreon版本升級的變化...................................................................... 178
第12章 Centreon 分散式監控............................................................................. 180
12.1安裝Centreon 分散式Poller................................................................. 180
12.2中央伺服器新增Poller............................................................................ 182
12.2.1以SSH協議連線遠端Poller....................................................... 183
12.2.2以“gorgone”協議連線遠端Poller.............................................. 186
12.3通過遠端Poller監控私有網路............................................................... 189
12.3.1需求及場景描述............................................................................ 189
12.3.2新增受保護的內網主機............................................................... 190
12.3.3新增主機服務項............................................................................ 190
12.3.4模擬故障,驗證監控是否有效................................................... 192
第13章 Centreon備份與恢復.............................................................................. 194
13.1最快的備份及恢復................................................................................... 195
13.1.1 Centreon系統備份....................................................................... 195
13.1.2 Centreon系統快速恢復.............................................................. 197
13.2簡化性的Centreon備份及恢復............................................................ 200
13.2.1備份MariaDB資料庫................................................................... 201
13.2.2備份非資料庫檔案........................................................................ 201
13.2.3 Centreon中央監控伺服器恢復.................................................. 201
13.3經驗總結.................................................................................................... 203
第14章 Centreon 典型故障處理......................................................................... 205
14.1遠端Poller故障........................................................................................ 205
14.2 Centreon Central中央監控伺服器故障............................................... 208
14.2.1 Centreon Central Web管理後臺不能登入.............................. 209
14.2.2 “cdb”服務不能啟動............................................................................... 210
14.2.3 Centreon Poller 間隙性停止故障.............................................. 211
14.3 NRPE(Nagios Remote Plugin Executor)故障................................. 215
14.3.1普通賬號許可權問題........................................................................ 215
14.3.2遠端Poller內的NRPE許可權問題............................................... 217
第15章 雜項............................................................................................................ 219
15.1 Centreon 高可用性(HA)................................................................... 219
15.2監控更大規模的網路............................................................................... 221
15.3 Centreon 的安全性................................................................................. 221
全文完
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/632405/viewspace-2794839/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 分散式監控報警平臺Centreon之:Centreon依賴安裝薦分散式
- 360容器平臺監控實踐
- 監控平臺前端SDK開發實踐前端
- 最佳實踐【二】從 0 開始,用 flask+mongodb 打造分散式伺服器監控平臺FlaskMongoDB分散式伺服器
- Logstash實踐: 分散式系統的日誌監控分散式
- 宜信智慧監控平臺建設實踐|分享實錄
- 監控平臺SkyWalking9入門實踐
- 幾種分散式呼叫鏈監控元件的實踐與比較(一)實踐分散式元件
- zabbix監控平臺
- 某小公司自動化智慧監控平臺的實踐
- 打造雲原生大型分散式監控系統 (三): Thanos 部署與實踐分散式
- ElasticSearch實戰-日誌監控平臺Elasticsearch
- 分散式平臺分散式
- Windows平臺分散式架構實踐 - 負載均衡(轉載)Windows分散式架構負載
- 搭建nagios+centreon分散式iOS分散式
- 微醫多維一體化監控平臺實踐 - 蔣剛毅
- 宜信智慧監控平臺建設實踐|宜信技術沙龍
- 超實用!!rsync分散式 + inotify監控實時同步分散式
- Zabbix 4.0企業級分散式監控實戰分散式
- 【一】從0開始,用flask+mongo打造分散式伺服器監控平臺FlaskGo分散式伺服器
- Elixir 分散式平臺分散式
- 幾種分散式呼叫鏈監控元件的實踐與比較(二)比較分散式元件
- Zabbix監控平臺的搭建
- linux監控平臺搭建Linux
- Prometheus + Grafana 監控平臺搭建PrometheusGrafana
- (十五) 構建dubbo分散式平臺-window安裝dubbo管控臺分散式
- RestCloud監控平臺,專為微服務API打造的實時監控中心RESTCloud微服務API
- Nagios+Centreon監控系統簡介iOS
- Zabbix企業分散式監控工具分散式
- 分散式系統呼叫鏈監控分散式
- WGCLOUD分散式監控平臺:導致agent主機下線離線的原因整理GCCloud分散式
- 乾貨 | 愛奇藝全鏈路自動化監控平臺的探索與實踐
- 分散式監控系統Zabbix-新增windows監控主機分散式Windows
- 為PaaS雲平臺提供整合的全棧式監控全棧
- Tideways和xhgui打造PHP非侵入式監控平臺IDEGUIPHP
- 分散式流平臺Kafka分散式Kafka
- Redis叢集環境下的-RedLock(真分散式鎖) 實踐Redis分散式
- 資料倉儲監控平臺