- 使用者叢集數量多,業務場景差異大
- 使用與配置不當,優化不夠
- 如何讓使用者更加高效和正確的使用 ES
- 如何讓使用者更全面的瞭解自己的叢集的使用狀況
- 發現問題滯後,需要防患於未然
- 需要“有跡可循”,做到“有則改之,無則加勉”
- Elastic 有提供 Support Diagnostics Tool - https://github.com/elastic/support-diagnos...
- 綠色只是其中一項指標。顯示分片是否都已正常分配
- 監控指標多並且分散
- 指標的含義不夠明確直觀
- 問題分析定位的門檻較高
- 需要具備專業知識
- 防患於未然,避免叢集奔潰
- Master 節點 / 資料節點當機 – 負載過高,導致節點失聯
- 副本丟失,導致資料可靠性受損
- 叢集壓力過大,資料寫入失敗
- 提升叢集效能
- 資料節點負載不均衡(避免單節點瓶頸) / 優化分片,segment
- 規範操作方式(利用別名 / 避免 Dynamic Mapping 引發過多欄位,對索引的合理性進行管控)
- 叢集健康狀態,是否有節點丟失
索引合理性- 索引總數不能過大 / 副本分片儘量不要設定為 0 / 主分片尺 寸檢測 / 索引的欄位總數(Dynamic Mapping 關閉)/ 索引是 否分配不均衡 / 索引 segment 大小診斷分析
- 資源使用合理性
- CPU 記憶體和 磁碟的使用狀況分析 /是否存在節點負載不平衡 / 是否需要增加節點
- 業務操作合理性
- 叢集狀態變更頻率,是否在業務高峰期有頻繁操作
- 慢查詢監控與分析
叢集中索引的診斷
- 索引的總數是否過大
- 是否存在欄位過多的情況
- 索引的分片個數是否設定合理
- 單個節點的分片數是否過多
- 資料節點之間的負載偏差是否過大
- 冷熱資料分配是否正確(例如,Cold 節點 上的索引是否設定成只讀)
本作品採用《CC 協議》,轉載必須註明作者和本文連結