雲上運維案例分享
一、背景
當下,越來越多的企業選擇業務資料上雲。不可否認資料上雲後,增強了擴充套件的便利性,但是同時也提高了運維管理的難度。如何實現雲上業務管理,是運維工程師們面臨的新問題。
LinkSLA智慧運維管家,不僅提供私有云的運維管理,同時為公有云上業務系統提供了統一運維平臺。方便IT運維工程師實時掌握公有云上系統的執行狀況。
二、案例
下面我給大家分享一個雲上運維監控的小案例:
1、夜間重啟
在5月底,某三甲醫院接入10臺互聯互通雲上系統,並接入平臺統一進行運維監控。
接入後,平臺檢測到其中2臺雲系統多次在凌晨發生重啟。
而云系統管理工程師反饋並未發現裝置重啟現象。在MOC工程師建議下,雲管理工程師登入系統,檢視伺服器日誌,找到了系統重啟記錄。
經過排查,是Windows系統夜間進行打自動補丁更新,導致伺服器重新啟動。
雲裝置管理工程師重新配置伺服器打補丁策略,夜間重啟問題得到解決。
2、cpu使用率異常
幾天後,平臺接到其中一臺雲系統的CPU使用率異常告警。MOC工程師檢視近三日CPU使用率時序圖,發現此裝置的CPU使用率在每日凌晨1:00--4:00 和凌晨6:30--7:00兩次接近100%,導致系統執行慢,MOC通知使用者確認是否需要調整,對CPU進行擴容。然而云裝置管理工程師,反饋是夜間備份所致。
在使用者的要求下,雲裝置管理工程師對CPU進行擴容。但是擴容後,平臺檢測到問題仍然存在。透過MOC工程師協助提供的系統網路流量時序圖,確定CPU使用率升高的時間段與網路備份時間並不重疊。排除CPU使用率高是網路備份原因導致。
最後,在軟體工程師協助問題排查出是應用軟體問題,CPU使用率高問題終於問題得以解決。實際上也驗證了我們透過“生命體徵”的監測,可以反推“內臟系統”的隱患。
三、總結
透過以上案例,我們可以看到資料上雲後,運維工程師更需透過專業監控工具實時掌握雲上業務執行情況,為業務系統保駕護航。LinkSLA智慧運維管家,完美的提供瞭解決方案。
資料上雲只是輕鬆運維的開始,專業,可信,方便,快捷的統一運維監控平臺才是雲上運維順利進行的保障。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70013542/viewspace-2919934/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【案例】正浩創新:多雲多資產,實現敏捷雲上運維敏捷運維
- mysql運維案例MySql運維
- 疫情下,雲上運維更顯價值運維
- 案例 | 睿象雲助力借貸寶運維效能倍速提升運維
- IT統一運維平臺案例運維
- 雲安全與運維運維
- 上雲桌面用固態硬碟—IT運維的定海神針硬碟運維
- 關於雲端計算運維管理要點的知識分享運維
- 案例實踐|Apache Pulsar 在移動雲智慧運維平臺的實踐Apache運維
- 阿里雲釋出ECS運維體系,提供原生運維能力阿里運維
- 使用雲效在阿里雲上進行一站式開發運維阿里運維
- 用行雲管家實現IT統一運維管理,提高運維效率運維
- 做運維要懂雲端計算嗎?Linux運維學習運維Linux
- 【運維】在阿里雲上搭建自己的圖床,配合PicGo和Typora使用運維阿里圖床PicGo
- 雲時代,如何保障運維安全?運維
- 雲上深度學習實踐分享——雲上MXNet實踐深度學習
- 雲端計算:拼的就是運維!運維
- 分享一個提高運維效率的 Python 指令碼運維Python指令碼
- 【知識分享】什麼是IT運維管理服務運維
- linux雲端計算運維發展如何?學習linux運維工程師技能Linux運維工程師
- 怎麼學習雲端計算?雲端計算運維和傳統運維有何區別?運維
- 金融雲原生漫談(七)|雲原生時代:從傳統運維到智慧運維的進階之路運維
- 雲端計算和運維工程師衝突嗎?運維崗需要雲端計算知識嗎?運維工程師
- [分享] 一篇不錯的思維工具應用案例
- 製造行業文件上雲典型案例行業
- 【linux運維】linux運維會被淘汰嗎?會消失在雲端計算中嗎?Linux運維
- 分享運維優質文章,得掘金大禮包啦~運維
- 運維日記001--一些大牛的分享運維
- 雲運維-初級1段-Tomcat搭建配置運維Tomcat
- textfsm 案例分享
- IT運維之自動化運維運維
- 如何做好企業IT運維工作?雲端計算運維的工作內容有哪些?運維
- 雲端計算運維與傳統運維工作有啥不同?需要什麼資質?運維
- 綠盟“星雲”合作計劃案例之“雲上合作模式”模式
- 上雲節省 35%計算資源,420 個運維人天:運滿滿實時計算實踐和思考運維
- 資料分享 | 第十三屆GOPS 全球運維大會Go運維
- 2022年 GOPS 全球運維大會(上海站)資料分享Go運維
- 第二週-雲端計算運維作業運維