正常執行時間監控
正常執行時間是系統可靠性的度量,表示為機器工作和可用時間的百分比。
當提到IT網路時,正常執行時間是對網路裝置、網站和其他服務可用性的度量。
網路正常執行時間通常用百分比來衡量,例如五個9秒,這意味著系統的執行時間達到99.999%。網路正常執行時間監控的目標是擁有99.999%的可用性,也就是每年少於5分鐘的停機時間。停機時間是系統不能執行的一段時間,與正常執行時間相反。
為什麼需要監控網路正常執行時間?
網路正常執行時間監控主動監控您的整個IT網路環境,以確保它可用並工作。可以把正常執行時間監控看作是你可以信賴的24/7的線上安全衛士。當監控系統注意到網路裝置或服務當機時,它會從一個儀表板立即通知您,以便您的網路管理員可以在問題變得太嚴重之前解決它。正常執行時間監控的目的是確保您的網路操作儘可能不間斷。
術語網路正常執行時間和停機時間用於定義IT服務提供的成功級別。服務水平協議(SLA)通常包括正常執行時間和當機時間比率,它們顯示服務預計保持執行的時間。IT專業人員使用正常執行時間來表示連續執行的總時間。
如何進行網路正常執行時間監控工作?
網路正常執行時間監控為您提供了所需的可見性,以便提前一步發現潛在問題。透過在易於閱讀的介面中顯示實時網路效能資料,網路正常執行時間監控軟體可以幫助您識別可能導致瓶頸的中斷。能夠實時檢測威脅意味著您可以隨時隨地得到通知,並立即採取糾正或防禦立場。您可以節省時間和金錢,並且不再需要物理系統管理員一直在現場執行手動檢查。網路正常執行時間的監控:
- 跟蹤網路裝置的可用性和頻寬使用情況,以檢測任何潛在的瓶頸。
- 監控伺服器的正常執行時間,包括DNS伺服器、SQL伺服器、郵件伺服器、FTP伺服器和虛擬伺服器的正常執行時間。
- 監控你的網站的可用性和檢查壞的連結。
- 確定停機和網路效能問題的根本原因。
- 關於SLA的報告:生成SLA報告來幫助您跟蹤可用性和效能,以便您能夠滿足對客戶的SLA承諾。
使用ManageEngine OpManager進行網路正常執行時間監控
ManageEngine OpManager幫助確保所有網路裝置、服務和網站都是全天候執行的。OpManager的介面提供有關網路正常執行時間和單個服務可用性的實時統計資料。儀表板使用綠色、黃色和紅色指示符等視覺化提示顯示關於網路裝置、服務和網站的狀態和執行狀況的報告,幫助您鎖定關鍵指標。
OpManager提供各種正常執行時間監控,包括:
- 裝置正常執行時間的監控
- 介面執行監控
- 服務執行監控
- Windows服務正常執行時間監控
- 網站正常執行時間監控
- 流程執行監控
裝置正常執行時間監控:
持續監控整個網路的正常執行時間和網路可用性。OpManager每兩分鐘向被監控裝置傳送一個ping訊號。如果連續兩次ping之後沒有響應,那麼OpManager將認為該裝置不可用。可以根據業務需要分配ping的數量及其時間間隔。
作為一個正常執行時間監控工具,OpManager使用 ICMP Ping來輪詢裝置的可用性。ping是IT管理員檢測裝置可用性的有效工具。
對於非icmp環境,特別是監控邊緣路由器或DMZ區域裝置的正常執行時間,可以使用Telnet。預設的可用性輪詢間隔為5分鐘,您可以根據需要將其定製為特定的裝置組或特定的裝置。
介面正常執行時間監控:
為企業網路和IT基礎設施中的每個元素提供基於snmp的介面執行時間和埠可用性監控。它提供每日、每週、每月或自定義期間顯示介面可用性的正常執行時間報告,以度量網路級別的可用性並確保滿足sla。這些介面或埠狀態透過單個裝置狀態、第2層網路對映、業務檢視或自定義裝置組和網路天氣圖跨多個方面傳播。
服務時間監控:
伺服器是任何IT基礎設施的核心元素。為了確保內部流程的平穩執行和服務的可用性,它們始終是可訪問的,這一點至關重要。伺服器正常執行時間,即伺服器對使用者可用的時間,是最佳化網路效能的最重要因素之一。
OpManager為您提供有關被監控的傳輸控制協議(TCP)服務的可用性和響應時間的詳細圖表和報告。OpManager中的 服務監控功能是可定製的,您可以選擇要監控的服務。
Windows服務正常執行時間監控:
除了監控系統級服務之外,OpManager還支援使用Windows管理工具(WMI)監控Windows服務。與系統級服務監控類似,您可以發現任何Windows服務並使用OpManager監控它們。此外,管理員可以配置OpManager,使其在發現Windows服務從操作控制檯關閉時自動重啟服務或伺服器。 瞭解更多 >>
網站正常執行時間監控:
ManageEngine OpManager執行的關鍵任務是監控您的網站的可用性,每年365天24小時。它監控HTTP/ HTTPS url、內部網站點、web伺服器場、帶有登入的web應用程式、Windows NT LAN Manager (NTLM)認證的網站等等。除了URL正常執行時間監控之外,你還可以檢查網站中的特定內容。 網站可用性監控確保網站不受駭客攻擊。
流程執行監控:
OpManager的程式正常執行時間監控使管理員能夠遠端監控和管理在伺服器上執行的程式。OpManager使用各種協議,如SNMP、WMI和CLI,來監控執行在Windows、Linux、Solaris、UNIX、HP UX、IBM AIX、ESX和VMware伺服器和虛擬機器等上的程式。
更多地瞭解OpManager的 流程可用性監控。
如何計算裝置的正常執行時間?
在一個特定的時間範圍內,我們取裝置停機的秒數,然後用這個數除以該時間範圍內裝置被監控的總秒數。因此,我們得到了停機百分比,然後將其從100%減去以確定正常執行時間百分比。
例子
假設我們監控了一個網路裝置24小時(即86,400秒),在這段時間內,裝置當機了5分鐘(300秒)。為了定義正常執行時間和當機百分比,我們執行以下計算:
裝置停機的總時間:300秒。
裝置被監控的總秒數:86,400秒
300除以86,400,等於0.0035。
用百分比表示,這是0.35%這是停機時間百分比。
裝置的正常執行時間百分比將是:100%減去0.35%等於99.65%。
注意:暫停、維護、依賴不可用、當機、未被監控是按裝置當機時間計算的。
執行時間監控:如何影響您的業務以及您如何確保業務關鍵型網路裝置的執行時間?
在當今的數字時代,人們期望企業始終保持其網路執行時間。網路執行時間是指網路處於活動狀態並有效執行的時間跨度。
對於任何企業來說,擁有一個功能強大的IT網路是至關重要的,它可以確保IT基礎設施元件不斷高效地啟動和執行。這可以透過利用各種協議(如SNMP、WMI、TCP和ICMP)跨網路基礎設施(如路由器、伺服器和防火牆)監控關鍵元件的執行時間和可用性來確保。
為什麼執行時間監控至關重要?
沒有多少情況比經歷網路當機更糟糕。在過去5到7年中,每小時停機的成本持續增加,企業每小時停機的損失可能高達500萬美元。
雖然不可能經歷100%的執行時間,但即使是0.1%的停機時間,即99.999%的執行時間,也會導致一些損失。例如,一個大型網路將包含各種裝置和介面,因此不可能手動監視所有網路元件的可用性和效能。只有當監測裝置分佈在全球多個遠端站點時,挑戰才會增加。
監控網路執行時間的挑戰
在規劃早期,考慮到需要監控執行時間的裝置數量,管理和監控網路的執行時間是一項重大挑戰,通常會部署一個訓練有素的技術團隊來維護整個網路。
讓我們看看監控網路基礎設施執行時間方面的挑戰:
-
處理網路可擴充套件性因素
-
確定關鍵問題的優先順序
-
平衡服務級別協議(SLA)和減少平均修復時間(MTTR)
-
卓越的網路可視性
-
處理網路可擴充套件性因素
當一個企業業務增長時,其IT基礎設施會呈指數級增長。一般來說,企業網路包括來自不同供應商的多種型別的裝置。監控網路中所有可用裝置的執行時間需要大量工作,但這項任務至關重要。企業網路中關鍵裝置的數量表明維護其執行時間有多複雜。
確定關鍵問題的優先順序
基於閾值的告警對於監控和避免網路停機至關重要。但是,如果父裝置出現故障或伺服器停機,您將深陷告警迴圈之中。告警資訊庫不僅會阻礙您識別問題的能力,還會延遲恢復正常。
然而,對於此類情況,有一些解決方案,包括廣泛、主動的監測、識別關鍵告警,以及透過適當的渠道將告警傳遞給正確的利益相關者,以便立即採取行動。
平衡SLA並降低MTTR
必須對關鍵裝置進行監控,以應對效能差和網路中斷。MTTR是一個監測系統可用性的引數。企業可以使用MTTR來支援SLA。SLA可用於測量網路裝置的可用性。為了提高網路的可用性,您應該監視網路裝置的可用性。一旦檢測到故障,主動告警。您可以使用諸如ServceNow和ServiceDesk Plus之類的IT服務管理工具來記錄有關可用性問題的記錄,並在網路停機之前快速解決這些問題。
卓越的網路可視性
您應該瞭解網路中工作的所有網路元件。在整個網路中的可見性有助於您在問題的早期階段識別問題,並在其影響終端使用者之前將其消除,從而建立一個穩定的網路。
使用OpManager監控執行時間
OpManager是一款動態網路監控軟體,提供實時網路監控,幫助您瞭解網路裝置的可用性和效能。在識別網路漏洞方面的任何延遲或失敗都可能導致災難性的停機,並花費數千美元。OpMangaer的執行時間監控功能有助於消除這一IT痛點。
OpManager提供:
-
使用定期預防性維護措施主動監控網路的內部健康狀況,以幫助您減少裝置故障。
-
計劃執行狀況報表,幫助您隨時瞭解網路中各種基礎設施元件的執行狀況。
-
帶顏色程式碼的執行時間圖可以幫助您及時瞭解網路中所有裝置的可用性。
更多內容: 印表機監控 UPS監控 CPU溫度監控 硬體監控 網路對映
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70030677/viewspace-2996505/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- JAMon監控SQL執行時間SQL
- oracle出現監聽不正常--執行一段時間Oracle
- 監控長時間執行的查詢(監控資料庫效能的SQL ) -- 轉資料庫SQL
- Java調優—Btrace監控Java執行緒/方法執行引數、執行時間(Windows)Java執行緒Windows
- 監控Oracle長時間執行的工作(v$session_longops)OracleSessionGo
- 谷歌CloudSQL全面投入 承諾99.95%正常執行時間谷歌CloudSQL
- quartz不正常執行.執行一段時間後無故停止quartz
- yii2 日誌自動傳送到釘釘 實時監控服務是否執行正常
- 監控 Python 記憶體使用情況和程式碼執行時間!Python記憶體
- 如何在 Windows 中檢查計算機正常執行時間Windows計算機
- 編碼:執行緒執行監控執行緒
- 監控 redis 執行命令Redis
- 監控sqlldr執行指令碼SQL指令碼
- 怎樣監控執行時間來決定當前操作任務是否因超時停止呀?
- Oracle“並行執行”——監控檢視Oracle並行
- 分享自己做的一個指定程式以及執行緒長時間cpu監控的工具執行緒
- Docker 之 執行狀態監控Docker
- MySQL MHA 執行狀態監控MySql
- memcached的執行狀態監控
- C# 開發技巧 輕鬆監控方法執行耗時C#
- abap執行時間
- 如何對伺服器進行24小時不間斷監控?伺服器
- Java利用執行緒工廠監控執行緒池Java執行緒
- 監控 SQL Server 的執行狀況SQLServer
- 教你如何監控網站URL是否正常網站
- 執行緒池監控2-監控執行緒池狀態、執行緒數量和佇列任務數量等執行緒佇列
- 通過micrometer實時監控執行緒池的各項指標執行緒指標
- Golang原始碼學習:監控執行緒Golang原始碼執行緒
- iOS執行緒生命週期的監控iOS執行緒
- 利用superlance監控supervisor執行狀態
- 監控SQL Server的執行狀況(1)SQLServer
- 煤礦皮帶執行影片監控系統
- shell指令碼:監控MySQL服務是否正常指令碼MySql
- 乾貨:教你如何監控 Java 執行緒池執行狀態Java執行緒
- job 執行時間比排程間隔時間長
- Apache和Spring提供的StopWatch執行時間監視器ApacheSpring
- MyBatis列印SQL執行時間MyBatisSQL
- 計算SQL執行時間SQL