滴滴夜鶯運維監控與 M3DB 聯姻發版 3.3.1,DiDi&Uber...
夜鶯 預設支援的儲存是從 Open-Falcon 演化過來的,基於 rrdtool 做的一套分散式時序資料儲存方案,在滴滴內部抗住了單叢集 10 億量級的監控指標。後來美菜的朋友做了改造,讓夜鶯同時支援了 influxdb 作為後端儲存,現在,3.3.1 版本,夜鶯引入了 m3db,m3db 是 uber 開源的時序庫,go 開發,據說在 uber 內部抗住了 66 億指標,不清楚是單叢集還是多叢集,看起來還是挺牛掰的。
m3 相比原來的 index+tsdb 的方案,優劣勢是什麼?
優點
- 對硬碟 IO 要求沒那麼高了,普通機械硬碟也能抗比較大的量
- 存原始資料,不降取樣了,追問題的時候更方便,當然了,儲存的資料時長就變短了,相同硬碟空間大小,比如原來 rrd 可以存 1 年的歷史趨勢資料,m3 可能只能存 1 個月
- 擴容非常方便,直接加 m3dbnode 即可,index+tsdb 的方案使用 migrate 配置,擴容不易
- 容災更好了,可以設定 3 副本,如果叢集部署了 3 臺機器,掛掉一臺機器完全沒有影響
- 索引避免了原來 index+tsdb 的單點容量問題,原來 index 雖然是可以部署為叢集,但是叢集裡每個節點都是全量索引
劣勢
- 硬碟空間佔用大,畢竟儲存原始資料嘛,一般生產環境建議存 1 個月,再久也儘量不要超過 3 個月,當然了,要監控的裝置比較少,部署 m3 的機器硬碟又比較大,那另當別論
- 記憶體佔用比較多,一般配置是最近兩個小時的資料要快取在記憶體裡,所以比較吃記憶體,好在記憶體現在也便宜了,一臺機器動不動 128G、256G 的
Nightingale v3.3.1 具體更新內容如下:
前端
- fix: 修復 IE11 相容問題,目前支援 IE >= 11,Chrome >= 70
- fix(mon): 修復遮蔽策略無法選擇遮蔽節點問題
- fix(mon): 修復某些日誌採集修改會導致名稱被切割問題
- feat: 各個系統間新增快捷跳轉連結
- feat(mon): 監控大盤支援快取該大盤設定的顯示列數
- style: 更新了一個新的 logo 圖片
- style(mon): 監控系統選單重新歸類
後端
- 增強安全性:密碼複雜度提高、cookie 處理優化等
- 支援 M3DB 作為儲存後端,具體請檢視 github 上面的 wiki 介紹
- 修復告警引擎與條件串數的問題
- 為主機裝置增加自定義欄位的能力
程式碼根目錄下有個 changelog,會羅列改動的內容和影響的模組,具體請諸君參考
更多原創文章乾貨分享,請關注公眾號
- 加微信實戰群請加微信(註明:實戰群):gocnio
相關文章
- 滴滴夜鶯 Nightingale 釋出 v3 版本,從運維監控演化成了運維平臺運維
- 滴滴夜鶯監控釋出 v5 正式版,定位 Prometheus 企業版Prometheus
- 【IT運維監控】幾大運維監控工具優缺點介紹運維
- 無監控,不運維:解讀企業全棧式監控運維運維全棧
- 運維監控利器nagios運維iOS
- 配電箱遠端監控物聯網解決方案(線上監控和運維管理)運維
- 金融系統IT運維監控的探索與實踐運維
- 運維監控系統 PIGOSS BSM的監控策略運維Go
- 體驗監控寶自定義監控 送你《IT運維之道》運維
- 運維監控指標彙總運維指標
- 智慧酒廠物聯網監控運維繫統解決方案運維
- 「滴滴運維」招聘——誠求運維架構師運維架構
- LED螢幕監控運維管理方案運維
- ORACLE OGG運維及日常監控Oracle運維
- NETCONF工具與智慧化網路監控運維運維
- 後臺開發、運維監控系統要怎麼搞?運維
- 徒手教你製作運維監控大屏運維
- ITSM運維監控解決方案介紹和運維繫統需求運維
- 智慧農業:水肥一體機遠端監控運維物聯網系統運維
- 運維監控如何做成 BATJ 的水準運維BAT
- 智慧檔案館網路監控運維策略運維
- 灌漿機遠端監控運維繫統運維
- 簡單聊聊運維監控的其他用途運維
- 智慧軌道交通運維監控解決方案運維
- 系統運維監控的幾點建議運維
- 全新SaaS運維監控平臺構建書運維
- NETCONF工具與智慧化網路監控運維(轉載)運維
- 供水泵站組態監控與故障運維一體化系統運維
- 資料庫監控工具--PIGOSSBSM運維監控管理系統資料庫Go運維
- 無監控,不運維!深入淺出介紹ChengYing監控設計和使用運維
- 運維架構服務監控Open-Falcon運維架構
- mongodb 常見運維監控和執行計劃MongoDB運維
- 運維監控國產化:PIGOSSBSM加速國產化程式運維Go
- 【合集】Linux運維常用的服務監控工具Linux運維
- 生產製造業網路運維監控方案運維
- Telegraf+Influxdb+Grafana自動化運維監控UXGrafana運維
- Bitly 運維團隊的 10 個監控教訓運維
- 影片監控安防專網事件預警運維繫統開發方案事件運維