linux效能監控工具——NAGIOS和OVO

長煙慢慢發表於2012-12-17

Nagios是一款開源的免費網路監視工具,能有效監控Windows、Linux和Unix的主機狀態,交換機路由器等網路設定,印表機等。在系統或服務狀態異常時發出郵件或簡訊報警第一時間通知網站運維人員,在狀態恢復後發出正常的郵件或簡訊通知。

Nagios是一個監視系統執行狀態和網路資訊的監視系統。Nagios能監視所指定的本地或遠端主機以及服務,同時提供異常通知功能等。 Nagios可執行在Linux/Unix平臺之上,同時提供一個可選的基於瀏覽器的WEB介面以方便系統管理人員檢視網路狀態,各種系統問題,以及日誌等等。


功能介紹

Nagios 可以監控的功能有:  

      1、監控網路服務(SMTP、POP3、HTTP、NNTP、PING等);

  2、監控主機資源(處理器負荷、磁碟利用率等);

  3、簡單地外掛設計使得使用者可以方便地擴充套件自己服務的檢測方法;

  4、並行服務檢查機制;

  5、具備定義網路分層結構的能力,用”parent”主機定義來表達網路主機間的關係,這種關係可被用來發現和明晰主機當機或不可達狀態;

  6、當服務或主機問題產生與解決時將告警傳送給聯絡人(通過EMail、簡訊、使用者定義方式);

  7、可以定義一些處理程式,使之能夠在服務或者主機發生故障時起到預防作用;

  8、自動的日誌滾動功能;

  9、可以支援並實現對主機冗餘監控;

  10、可選的WEB介面用於檢視當前的網路狀態、通知和故障歷史、日誌檔案等;

系統需求

  Nagios所需要的執行條件是機器必須可以執行Linux(或是Unix變種)並且有C語言編譯器。 你必須正確地配置TCP/IP協議棧以使大多數的服務檢測可以通過網路得以進行。你需要但並非必須正確地配置Nagios裡的CGIs程式,而一旦你要使用CGI程式時,你必須要安裝以下這些軟體…一個WEB服務(最好是Apache)

系統安裝

  1.安裝基礎支援套件和新增使用者

  nagios需要一些基礎支援套件才能執行,如apache,gcc,glibc,gd庫等。

  新增一個名為nagios的使用者用以專門跑nagios

  設定密碼

  新增nagcmd使用者組,用以通過web頁面提交外部控制命令

  將nagios使用者加入nagcmd組

  將apache使用者加入nagcmd組

  2.安裝nagios

  這時nagios基本已經安裝完成,預設安裝後的配置檔案用於啟動nagios是沒有問題的。

  修改nagiosadmin這行其中的郵件地址為你的email地址,以將報警郵件發到你的郵箱

  安裝nagios的web介面

  設定登陸web介面時HTTP驗證的賬號密碼

  3. 安裝nagios-plugins

  nagios-plugins是nagios官方提供的一套外掛程式,nagios監控主機的功能其實都是通過執行插件程式來實現的。

  4.安裝nagios-snmp-plugins

  nagios-snmp-plugins是一套用Perl編寫的通過SNMP方式監控主機外掛程式

  配置這些外掛的使用時需要配置cpan,CPAN是Comprehensive Perl Archive Network的縮寫.。它是一個巨大的Perl軟體收藏庫,收集了大量有用的Perl模組(modules)及其相關的檔案。這裡主要是使用Perl-Net-SNMP模組。有兩種方式安裝:

  A)通過CPAN來安裝

  B) 手工安裝

  首先去官方網站下載以下幾個模組

  Crypt::DES

  Digest::MD5

  Digest::SHA1

  Digest::HMAC

  Net::SNMP

  下載後對於每個模組依次按照下面的方式安裝

  表示模組名,具體請按上面提到的模組替換

  注意:Net::SNMP模組必須在最後安裝。至此Net::SNMP手動安裝完畢

  執行nagios-snmp-plugins安裝指令碼,執行之後會將外掛命令安裝到/usr/local/nagios/libexec下

  5.其他設定

  至此nagios基本已經安裝完畢,但這時還不能馬上啟動nagios,需要以下設定。

  將nagios新增到服務中

  設定服務為自啟動

  檢測nagios的配置是否正確,在後面配置nagios過程中我們為了檢測配置的是否正確需要不斷執行該命令來檢查配置檔案。

  #service nagios start 啟動nagios

  需要注意的是,Centos預設開啟了selinux並且執行於強制安全模式,這將導致在開啟nagios的web介面時會出現Internet Server Error的錯誤。

  檢視是否執行於強制模式,結果為1表示是

  更改selinux執行於寬容模式

  但是這個設定重啟後就會失效,如需要重啟後保持該設定需要修改/etc/sysconfig/selinux,將其中的SELINUX= enforcing更改為SELINUX= permissive並重啟系統。當然你也可以改成disable禁用selinux。

  也可以不更改selinux的執行模式,解決辦法為:

  6.實現MSN報警

  要實現MSN報警需要使用phpmsnclass,這是一個用php實現的msn機器人程式。

  下載phpmsnclass,此檔案為7zip壓縮格式,需要安裝7z

  phpmsnclass需要php支援,安裝php,這裡為了方便就直接完成LAMP環境的安裝

  安裝mysql資料庫,後面安裝cacti需要

  由於安全原因請將mysql設定為只監聽在127.0.0.1上,並刪除mysql庫中預設的除了外的所有使用者,相關設定請見以前的關於postfix安裝中的設定。

  安裝php相關模組

  msn報警有2種方式,一種是直接使用php進行登陸驗證傳送訊息,另外一個是以msn機器人的形式傳送,將訊息儲存在目錄內。這裡採用第二種。

  下面把msnbot.php, config.php和msn.class.php拷貝到/var/spool/msnbot/

  這個機器人的工作原理是如果要傳送訊息,就呼叫php生成訊息檔案到

  /var/spool/msnbot/spool目錄中,傳送程式檢查到該目錄有新檔案就會模擬msn登陸和發信將資訊傳送出去。

  在配置檔案中設定MSN的賬號和密碼(以後報警通過這個MSN發出)

  加上執行許可權

  在啟動函式裡執行的php檔案前要加上php (php後有空格)

  啟動MSN機器人

  下面發個訊息測試一下

  如果成功接收到資訊說明配置正確,此步驟到此結束,後面的能讓Nagios使用MSN進行報警的功能需要到Nagios裡設定了。

  如果需要支援離線訊息即當你在離線狀態下也能接收到機器人的資訊,需要使用MSNP15協議,修改相關發信的php檔案將宣告新類的地方new MSN的第一個引數改為MSNP15


HP Openview OVO主機管理

HP Openview OVO(Openview Operation)能夠對伺服器故障進行集中監控,對伺服器的程式、日誌、效能進行集中管理,並對伺服器的各項效能引數進行實時監控、分析和統計,同時提供面向應用的監控和根源故障定位,從而全面管理伺服器及應用效能。

 

功能:

l      整合性好,提供統一的管理與監控

能夠與網路管理平臺NNM和各種智慧外掛進行整合,提供對網路、作業系統、資料庫、中介軟體、企業應用進行全面管理。

主機事件管理:

•         對指定程式進行監控,如程式中止,可及時通知管理員,並自動重起程式;

•         設立多級告警機制,使CPU、記憶體等系統引數未超標時就提前告警;

•         對系統日誌進行匹配設定,出現異常,及時通知管理員;

•         對應用程式日誌進行匹配設定,可按出現次數、出現型別進行設定,對應用程式的潛在問題進行跟蹤分析;

•         多種事件關聯模板,簡化故障處理。

主機效能管理:

•         採集主機系統的效能引數,彙總到管理端,形成歷史記錄;

•         設定系統效能閥值報警,及時通知管理員系統的執行狀況;

•         根據系統資源利用的歷史記錄,提供資料化的決策支援;

•         提供系統效能、資源佔用的實時監測工具,幫助管理員快速瞭解系統執行情況。

l      面向業務應用的監控

能夠快速定位應用故障根源問題,減少故障修復時間。提供面向應用的監控檢視,從應用角度定位根源故障;

l      安全資訊傳輸

採用智慧agent機制,實現主機的自治管理;並採用了https、dce-rps通訊機制保證資訊傳輸安全,從而保證了主機的安全。

l      全中文支援

全中文監控介面和中文手冊,方便使用者使用。

 

特性:

•       提供集中的網路系統管理平臺,實現針對企業環境的綜合管理;並結合豐富的智慧外掛,對網路、作業系統、資料庫、中介軟體、企業應用進行全面管理;

•       實現面向業務應用的監控,並通過根源問題發現功能,快速定位影響業務應用的故障點,減少故障修復時間;

•       提供多角色的管理環境,為監控人員提供便利的操作環境。

 

目標客戶

•       所有需要對網路、系統、應用進行管理的使用者(伺服器數量大於10臺,或有重要伺服器需要管理的單位)

理想客戶

•        網路系統環境複雜的使用者,需要對大量網路裝置、主機裝置進行管理的使用者;

•        惠普的Install base;擁有大量惠普伺服器(HP-UX/TRU64、安騰)需要管理的使用者;

•       NNM的使用者,原來只對網路進行管理,現在需要擴充套件管理範圍。

 

配置產品:

HP OpenView Operation & Performance Manager

HP OpenView Smart Plug-ins

HP OpenView Operation & Performance Agent

執行平臺:

HP-UX、windows、Solaris

支援平臺:

HP-UX, Solaris, AIX, Tru64, Linux,Windows etc.

 

專案成本

1.      軟體

Windows平臺:

描述

Prod Nbr

數量

總價(人民幣)

HP Ops Mgr 7.x Windows Mgmt Svr SW LTU

B7405YA

1

 

HP Ops/Perf Agt Tier 1 Software LTU

B7420AA

30

 

HP Ops/Perf 7.5 Win S-CH Software Media

B7490YS

1

 

HP Ops Mgr 7.5 Win SCH Software Manual

B7491YS

1

 

 

 

總價:

 

UNIX平臺:

描述

Prod Nbr

數量

總價(人民幣)

HP Ops/Perf Mgr HP-UX Software LTU

B7405AA

1

 

HP Ops/Perf Agt Tier 1 Software LTU

B7420AA

30

 

HP Ops/Perf 8.x for HP-UX Software Media

B7490CA

1

 

HP Ops/Perf 8x UX SCH Software Manual

B7491CS

1

 

 

 

總價: 

 


相關文章