正常執行時間監控

manageengine2發表於2023-11-22

正常執行時間是系統可靠性的度量,表示為機器工作和可用時間的百分比。

當提到IT網路時,正常執行時間是對網路裝置、網站和其他服務可用性的度量。

網路正常執行時間通常用百分比來衡量,例如五個9秒,這意味著系統的執行時間達到99.999%。網路正常執行時間監控的目標是擁有99.999%的可用性,也就是每年少於5分鐘的停機時間。停機時間是系統不能執行的一段時間,與正常執行時間相反。

為什麼需要監控網路正常執行時間?

網路正常執行時間監控主動監控您的整個IT網路環境,以確保它可用並工作。可以把正常執行時間監控看作是你可以信賴的24/7的線上安全衛士。當監控系統注意到網路裝置或服務當機時,它會從一個儀表板立即通知您,以便您的網路管理員可以在問題變得太嚴重之前解決它。正常執行時間監控的目的是確保您的網路操作儘可能不間斷。

術語網路正常執行時間和停機時間用於定義IT服務提供的成功級別。服務水平協議(SLA)通常包括正常執行時間和當機時間比率,它們顯示服務預計保持執行的時間。IT專業人員使用正常執行時間來表示連續執行的總時間。

如何進行網路正常執行時間監控工作?

網路正常執行時間監控為您提供了所需的可見性,以便提前一步發現潛在問題。透過在易於閱讀的介面中顯示實時網路效能資料,網路正常執行時間監控軟體可以幫助您識別可能導致瓶頸的中斷。能夠實時檢測威脅意味著您可以隨時隨地得到通知,並立即採取糾正或防禦立場。您可以節省時間和金錢,並且不再需要物理系統管理員一直在現場執行手動檢查。網路正常執行時間的監控:

  • 跟蹤網路裝置的可用性和頻寬使用情況,以檢測任何潛在的瓶頸。
  • 監控伺服器的正常執行時間,包括DNS伺服器、SQL伺服器、郵件伺服器、FTP伺服器和虛擬伺服器的正常執行時間。
  • 監控你的網站的可用性和檢查壞的連結。
  • 確定停機和網路效能問題的根本原因。
  • 關於SLA的報告:生成SLA報告來幫助您跟蹤可用性和效能,以便您能夠滿足對客戶的SLA承諾。

使用ManageEngine OpManager進行網路正常執行時間監控

ManageEngine OpManager幫助確保所有網路裝置、服務和網站都是全天候執行的。OpManager的介面提供有關網路正常執行時間和單個服務可用性的實時統計資料。儀表板使用綠色、黃色和紅色指示符等視覺化提示顯示關於網路裝置、服務和網站的狀態和執行狀況的報告,幫助您鎖定關鍵指標。

OpManager提供各種正常執行時間監控,包括:

  • 裝置正常執行時間的監控
  • 介面執行監控
  • 服務執行監控
  • Windows服務正常執行時間監控
  • 網站正常執行時間監控
  • 流程執行監控

裝置正常執行時間監控:

持續監控整個網路的正常執行時間和網路可用性。OpManager每兩分鐘向被監控裝置傳送一個ping訊號。如果連續兩次ping之後沒有響應,那麼OpManager將認為該裝置不可用。可以根據業務需要分配ping的數量及其時間間隔。

網路正常執行時間監控 - ManageEngine OpManager

作為一個正常執行時間監控工具,OpManager使用 ICMP Ping來輪詢裝置的可用性。ping是IT管理員檢測裝置可用性的有效工具。

對於非icmp環境,特別是監控邊緣路由器或DMZ區域裝置的正常執行時間,可以使用Telnet。預設的可用性輪詢間隔為5分鐘,您可以根據需要將其定製為特定的裝置組或特定的裝置。

介面正常執行時間監控:

為企業網路和IT基礎設施中的每個元素提供基於snmp的介面執行時間和埠可用性監控。它提供每日、每週、每月或自定義期間顯示介面可用性的正常執行時間報告,以度量網路級別的可用性並確保滿足sla。這些介面或埠狀態透過單個裝置狀態、第2層網路對映、業務檢視或自定義裝置組和網路天氣圖跨多個方面傳播。

網路裝置正常執行時間監控 - ManageEngine OpManager

服務時間監控:

伺服器是任何IT基礎設施的核心元素。為了確保內部流程的平穩執行和服務的可用性,它們始終是可訪問的,這一點至關重要。伺服器正常執行時間,即伺服器對使用者可用的時間,是最佳化網路效能的最重要因素之一。

OpManager為您提供有關被監控的傳輸控制協議(TCP)服務的可用性和響應時間的詳細圖表和報告。OpManager中的 服務監控功能是可定製的,您可以選擇要監控的服務。

網路正常執行時間監控 - ManageEngine OpManager

Windows服務正常執行時間監控:

除了監控系統級服務之外,OpManager還支援使用Windows管理工具(WMI)監控Windows服務。與系統級服務監控類似,您可以發現任何Windows服務並使用OpManager監控它們。此外,管理員可以配置OpManager,使其在發現Windows服務從操作控制檯關閉時自動重啟服務或伺服器。 瞭解更多 >>

Windows網路正常執行時間監控 - ManageEngine OpManager

網站正常執行時間監控:

ManageEngine OpManager執行的關鍵任務是監控您的網站的可用性,每年365天24小時。它監控HTTP/ HTTPS url、內部網站點、web伺服器場、帶有登入的web應用程式、Windows NT LAN Manager (NTLM)認證的網站等等。除了URL正常執行時間監控之外,你還可以檢查網站中的特定內容。 網站可用性監控確保網站不受駭客攻擊。

流程執行監控:

OpManager的程式正常執行時間監控使管理員能夠遠端監控和管理在伺服器上執行的程式。OpManager使用各種協議,如SNMP、WMI和CLI,來監控執行在Windows、Linux、Solaris、UNIX、HP UX、IBM AIX、ESX和VMware伺服器和虛擬機器等上的程式。

網路正常執行時間監控 - ManageEngine OpManager

更多地瞭解OpManager的 流程可用性監控

如何計算裝置的正常執行時間?

在一個特定的時間範圍內,我們取裝置停機的秒數,然後用這個數除以該時間範圍內裝置被監控的總秒數。因此,我們得到了停機百分比,然後將其從100%減去以確定正常執行時間百分比。

例子

假設我們監控了一個網路裝置24小時(即86,400秒),在這段時間內,裝置當機了5分鐘(300秒)。為了定義正常執行時間和當機百分比,我們執行以下計算:

裝置停機的總時間:300秒。

裝置被監控的總秒數:86,400秒

300除以86,400,等於0.0035。

用百分比表示,這是0.35%這是停機時間百分比。

裝置的正常執行時間百分比將是:100%減去0.35%等於99.65%。

注意:暫停、維護、依賴不可用、當機、未被監控是按裝置當機時間計算的。

 

執行時間監控:如何影響您的業務以及您如何確保業務關鍵型網路裝置的執行時間?

在當今的數字時代,人們期望企業始終保持其網路執行時間。網路執行時間是指網路處於活動狀態並有效執行的時間跨度。

對於任何企業來說,擁有一個功能強大的IT網路是至關重要的,它可以確保IT基礎設施元件不斷高效地啟動和執行。這可以透過利用各種協議(如SNMP、WMI、TCP和ICMP)跨網路基礎設施(如路由器、伺服器和防火牆)監控關鍵元件的執行時間和可用性來確保。

 

為什麼執行時間監控至關重要?

沒有多少情況比經歷網路當機更糟糕。在過去5到7年中,每小時停機的成本持續增加,企業每小時停機的損失可能高達500萬美元。

雖然不可能經歷100%的執行時間,但即使是0.1%的停機時間,即99.999%的執行時間,也會導致一些損失。例如,一個大型網路將包含各種裝置和介面,因此不可能手動監視所有網路元件的可用性和效能。只有當監測裝置分佈在全球多個遠端站點時,挑戰才會增加。

 

監控網路執行時間的挑戰

在規劃早期,考慮到需要監控執行時間的裝置數量,管理和監控網路的執行時間是一項重大挑戰,通常會部署一個訓練有素的技術團隊來維護整個網路。

讓我們看看監控網路基礎設施執行時間方面的挑戰:

  • 處理網路可擴充套件性因素

  • 確定關鍵問題的優先順序

  • 平衡服務級別協議(SLA)和減少平均修復時間(MTTR)

  • 卓越的網路可視性

  • 處理網路可擴充套件性因素

當一個企業業務增長時,其IT基礎設施會呈指數級增長。一般來說,企業網路包括來自不同供應商的多種型別的裝置。監控網路中所有可用裝置的執行時間需要大量工作,但這項任務至關重要。企業網路中關鍵裝置的數量表明維護其執行時間有多複雜。

 

確定關鍵問題的優先順序

基於閾值的告警對於監控和避免網路停機至關重要。但是,如果父裝置出現故障或伺服器停機,您將深陷告警迴圈之中。告警資訊庫不僅會阻礙您識別問題的能力,還會延遲恢復正常。

然而,對於此類情況,有一些解決方案,包括廣泛、主動的監測、識別關鍵告警,以及透過適當的渠道將告警傳遞給正確的利益相關者,以便立即採取行動。

 

平衡SLA並降低MTTR

必須對關鍵裝置進行監控,以應對效能差和網路中斷。MTTR是一個監測系統可用性的引數。企業可以使用MTTR來支援SLA。SLA可用於測量網路裝置的可用性。為了提高網路的可用性,您應該監視網路裝置的可用性。一旦檢測到故障,主動告警。您可以使用諸如ServceNow和ServiceDesk Plus之類的IT服務管理工具來記錄有關可用性問題的記錄,並在網路停機之前快速解決這些問題。

 

卓越的網路可視性

您應該瞭解網路中工作的所有網路元件。在整個網路中的可見性有助於您在問題的早期階段識別問題,並在其影響終端使用者之前將其消除,從而建立一個穩定的網路。

 

使用OpManager監控執行時間

OpManager是一款動態網路監控軟體,提供實時網路監控,幫助您瞭解網路裝置的可用性和效能。在識別網路漏洞方面的任何延遲或失敗都可能導致災難性的停機,並花費數千美元。OpMangaer的執行時間監控功能有助於消除這一IT痛點。

 

OpManager提供:

  • 使用定期預防性維護措施主動監控網路的內部健康狀況,以幫助您減少裝置故障。

  • 計劃執行狀況報表,幫助您隨時瞭解網路中各種基礎設施元件的執行狀況。

  • 帶顏色程式碼的執行時間圖可以幫助您及時瞭解網路中所有裝置的可用性。

更多內容:  印表機監控  UPS監控  CPU溫度監控  硬體監控  網路對映


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70030677/viewspace-2996505/,如需轉載,請註明出處,否則將追究法律責任。

相關文章