客戶案例|提質增效 某縣醫院運維升級例項

Linksla發表於2024-03-06
一、 專案背景


2023年12月,安徽某縣醫院接入226個資產,正式成為平臺客戶。
據moc介紹,客戶經歷了3個月的長效試用期,透過對平臺的監控效果、趨勢預測、故障響應速度、技術支援、moc服務等全方位體驗後,才謹慎地成為正式使用者。不得不誇, 運維工程師的認真嚴謹最 讓人服氣!

二、故障處理

客戶資產接入後,需求和服務的極限挑戰正式開始。透過3個小案例瞭解。

1、夜間HIS系統反覆重啟

客戶接入系統後,發現HIS系統總會在夜間反覆重啟,平臺告警後資料工程師認為叢集未產生異常報警,並未著急處理。
moc工程師認為核心系統告警需要提高警惕,要求資料工程師排查重啟原因,最終鎖定SQL Server資料庫bug導致,進行打補丁更新,反覆重啟故障徹底解決。

2、大面積斷電引發的網路問題

1 21日清晨7點半,平臺接到該醫院資產離線告警。

moc工程師溝通使用者,得知該地區遭遇極端暴雪天氣導致大面積停電。在恢復供電後,部分交換機未能自動重啟。使用者現場有一百多臺交換機且分散在醫院各個區域,靠人工檢查定位重啟,至少要半天時間才能完成,將會影響業務的正常開展。時間緊任務重,MOC工程師結合平臺告警和裝置狀態監測,逐步定位排查,在30分鐘內協助使用者迅速恢復所有故障網路裝置,保障業務的穩定進行。

3、磁碟空間使用率問題

接入平臺後,值守工程師發現凌晨總會接到磁碟空間使用率不足告警,在處理工單時,告警磁碟的容量又恢復正常,完全能滿足業務的需求。

透過三日空間使用時序圖顯示,磁碟每日凌晨開始備份,產生大量備份檔案,在短時間內磁碟空間使用率就達到100%,空間不足導致備份失敗,重新釋放磁碟容量。這就是處理工單時一切看起來很正常的原因。資料備份失敗可能導致資料丟失,moc工程師及時與現場工程師溝通,調整備份方案,將5日備份資料量調整為2日備份,在適合的時間對該磁碟進行擴容。

異常早發現,故障快處理,保障系統日常穩定執行,客戶滿意度持續飆升。

三、痛點分析

在醫院資訊化建設中,大部分醫院已完成核心業務系統建設,且配套一定規模的網路、伺服器、動環等系統。因此在制定運維服務方案時,需要在這幾點特別關注。

1、廠商獨立監控、資料割裂,形成資料孤島。影響告警和根因定位的準確性,甚至告警風暴的產生,需要監控統一集中的監控。

2、 資源管理難,缺乏對伺服器CPU、記憶體等計算資源,磁碟空間、磁碟I/0等儲存資源的監控,對系統應用節點和資料的各項效能引數配置等資料把控不足,難以實現科學的容量規劃。

3、 缺乏對核心業務系統監控,裝置廠商監控工具僅對裝置狀態進行檢測,無法對醫院核心業務,如HIS、PACS等進行全鏈路可用性監控分析。

4、 日常巡檢以人工巡檢為主,問題發現被動、滯後,難以保障系統穩定執行。同時人工巡檢摸排時間長、問題處理效率低,也使運維KPI成效不顯著。

四、方案亮點

一站式監控

異常、風險盡在掌握

以集中式採集監控和告警管理,將資產統一併入監控系統,對每個資源節點的狀態、效能進行實時監控。監控不漏報、少誤報、高響應,高效應對醫院規模龐大的基礎設施,網路裝置、伺服器、儲存、應用等。

透過全棧資料採集分析,精準定位提供豐富資料分析,提升風險異常的精準度。 使用者可以避免無效告警、告警風暴的發生,快速對故障的排查和定位,全面提升告警管理能力。

自動巡檢+AI精準預測

運維提速增效

自動巡檢可大幅提高巡檢效率,內建多種常見的作業系統、資料庫、中介軟體等巡檢模版,滿足日常巡檢需求。支援靈活配置巡檢指標以及閾值,高亮展示異常指標,元件效能狀態一目瞭然。支援定時執行策略、巡檢通知、生成word模版供存檔,保證巡檢任務有計劃地執行。


AI精準預測,主動發現問題,對具有周期性、趨勢性、季節性的指標,AI機器學習建立自適應的異常檢測,自動調整動態閾值,高效管理告警。


7*24h線上+專家響應

事件能閉環

依託於平臺的實時監測分析,MOC專家做到分秒級響應,不到30分鐘就能完成一次事件的“分析-定位-響應”。

為醫院量身打造相應的應急處理流程,確保問題的響應時間和處理速度,MOC工程師全程線上,提供專業的解決方案,協調專家支援,保障系統快速恢復;故障解除後,MOC工程師會針對事件進行復盤彙報,查漏補缺,故障閉環處理大幅降低同型別事件再發機率。

平臺內建大量案例,集中管理歷史沉澱經驗及常用場景知識,便於知識應用即查即用,提升問題解決效率,減少對專業人才的依賴;

智慧運維使原來錯綜複雜的運維管理工作變的簡單輕鬆,真正實現職責分明、安全高效、穩定可靠、智慧管控的目標。


來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/70013542/viewspace-3008223/,如需轉載,請註明出處,否則將追究法律責任。

相關文章