滴滴夜鶯運維監控與 M3DB 聯姻發版 3.3.1,DiDi&Uber...
夜鶯 預設支援的儲存是從 Open-Falcon 演化過來的,基於 rrdtool 做的一套分散式時序資料儲存方案,在滴滴內部抗住了單叢集 10 億量級的監控指標。後來美菜的朋友做了改造,讓夜鶯同時支援了 influxdb 作為後端儲存,現在,3.3.1 版本,夜鶯引入了 m3db,m3db 是 uber 開源的時序庫,go 開發,據說在 uber 內部抗住了 66 億指標,不清楚是單叢集還是多叢集,看起來還是挺牛掰的。
m3 相比原來的 index+tsdb 的方案,優劣勢是什麼?
優點
- 對硬碟 IO 要求沒那麼高了,普通機械硬碟也能抗比較大的量
- 存原始資料,不降取樣了,追問題的時候更方便,當然了,儲存的資料時長就變短了,相同硬碟空間大小,比如原來 rrd 可以存 1 年的歷史趨勢資料,m3 可能只能存 1 個月
- 擴容非常方便,直接加 m3dbnode 即可,index+tsdb 的方案使用 migrate 配置,擴容不易
- 容災更好了,可以設定 3 副本,如果叢集部署了 3 臺機器,掛掉一臺機器完全沒有影響
- 索引避免了原來 index+tsdb 的單點容量問題,原來 index 雖然是可以部署為叢集,但是叢集裡每個節點都是全量索引
劣勢
- 硬碟空間佔用大,畢竟儲存原始資料嘛,一般生產環境建議存 1 個月,再久也儘量不要超過 3 個月,當然了,要監控的裝置比較少,部署 m3 的機器硬碟又比較大,那另當別論
- 記憶體佔用比較多,一般配置是最近兩個小時的資料要快取在記憶體裡,所以比較吃記憶體,好在記憶體現在也便宜了,一臺機器動不動 128G、256G 的
Nightingale v3.3.1 具體更新內容如下:
前端
- fix: 修復 IE11 相容問題,目前支援 IE >= 11,Chrome >= 70
- fix(mon): 修復遮蔽策略無法選擇遮蔽節點問題
- fix(mon): 修復某些日誌採集修改會導致名稱被切割問題
- feat: 各個系統間新增快捷跳轉連結
- feat(mon): 監控大盤支援快取該大盤設定的顯示列數
- style: 更新了一個新的 logo 圖片
- style(mon): 監控系統選單重新歸類
後端
- 增強安全性:密碼複雜度提高、cookie 處理優化等
- 支援 M3DB 作為儲存後端,具體請檢視 github 上面的 wiki 介紹
- 修復告警引擎與條件串數的問題
- 為主機裝置增加自定義欄位的能力
程式碼根目錄下有個 changelog,會羅列改動的內容和影響的模組,具體請諸君參考
更多原創文章乾貨分享,請關注公眾號
- 加微信實戰群請加微信(註明:實戰群):gocnio
相關文章
- 夜鶯監控
- 滴滴夜鶯 Nightingale 釋出 v3 版本,從運維監控演化成了運維平臺運維
- 滴滴夜鶯監控釋出 v5 正式版,定位 Prometheus 企業版Prometheus
- 夜鶯監控使用指南
- 使用夜鶯+categraf監控redis和redis叢集Redis
- 使用夜鶯和 Categraf 快速建設 MySQL 監控MySql
- 細說夜鶯監控系統告警自愈機制
- 夜鶯監控 v7.beta4 發版,儀表盤變數和業務組下的機器聯動變數
- 運維監控工具運維
- 無監控,不運維:解讀企業全棧式監控運維運維全棧
- NETCONF工具與智慧化網路監控運維運維
- 如何做好運維監控?運維
- 運維監控丨16條常用的Kafka看板監控配置與告警規則運維Kafka
- 金融系統IT運維監控的探索與實踐運維
- 運維監控指標彙總運維指標
- ORACLE OGG運維及日常監控Oracle運維
- 配電箱遠端監控物聯網解決方案(線上監控和運維管理)運維
- NETCONF工具與智慧化網路監控運維(轉載)運維
- 運維文件 - 伺服器效能監控與最佳化運維伺服器
- 智慧酒廠物聯網監控運維繫統解決方案運維
- 夜鶯簡訊告警教程
- LED螢幕監控運維管理方案運維
- 分層運維自動化監控運維
- 運維文件:網站監控系統運維網站
- 多伺服器運維管理 集中監控與管理平臺伺服器運維
- 徒手教你製作運維監控大屏運維
- 運維文件:伺服器監控系統運維伺服器
- 運維文件:系統監控及告警配置運維
- 夜鶯監控 V7 第二個 beta 版本釋出,內建整合故障自愈能力,簡化部署
- 智慧農業:水肥一體機遠端監控運維物聯網系統運維
- 灌漿機遠端監控運維繫統運維
- 智慧檔案館網路監控運維策略運維
- 運維監控如何做成 BATJ 的水準運維BAT
- 運維文件 - 伺服器效能監控系統運維伺服器
- 【合集】Linux運維常用的服務監控工具Linux運維
- 智慧軌道交通運維監控解決方案運維
- 運維架構服務監控Open-Falcon運維架構
- 簡單聊聊運維監控的其他用途運維