診斷叢集的潛在問題

CrazyZard發表於2020-02-23
  • 使用者叢集數量多,業務場景差異大
  • 使用與配置不當,優化不夠
    • 如何讓使用者更加高效和正確的使用 ES
    • 如何讓使用者更全面的瞭解自己的叢集的使用狀況
  • 發現問題滯後,需要防患於未然
  • 綠色只是其中一項指標。顯示分片是否都已正常分配
  • 監控指標多並且分散
    • 指標的含義不夠明確直觀
  • 問題分析定位的門檻較高
  • 需要具備專業知識
  • 防患於未然,避免叢集奔潰
    • Master 節點 / 資料節點當機 – 負載過高,導致節點失聯
    • 副本丟失,導致資料可靠性受損
    • 叢集壓力過大,資料寫入失敗
  • 提升叢集效能
    • 資料節點負載不均衡(避免單節點瓶頸) / 優化分片,segment
    • 規範操作方式(利用別名 / 避免 Dynamic Mapping 引發過多欄位,對索引的合理性進行管控)
  • 叢集健康狀態,是否有節點丟失
    索引合理性
    • 索引總數不能過大 / 副本分片儘量不要設定為 0 / 主分片尺 寸檢測 / 索引的欄位總數(Dynamic Mapping 關閉)/ 索引是 否分配不均衡 / 索引 segment 大小診斷分析
  • 資源使用合理性
    • CPU 記憶體和 磁碟的使用狀況分析 /是否存在節點負載不平衡 / 是否需要增加節點
  • 業務操作合理性
    • 叢集狀態變更頻率,是否在業務高峰期有頻繁操作
    • 慢查詢監控與分析

叢集中索引的診斷

  • 索引的總數是否過大
  • 是否存在欄位過多的情況
  • 索引的分片個數是否設定合理
  • 單個節點的分片數是否過多
  • 資料節點之間的負載偏差是否過大
  • 冷熱資料分配是否正確(例如,Cold 節點 上的索引是否設定成只讀)
本作品採用《CC 協議》,轉載必須註明作者和本文連結

快樂就是解決一個又一個的問題!

相關文章