使用Python寫一個小小的專案監控

發表於2015-01-06

在公司裡做的一個介面系統,主要是對接第三方的系統介面,所以,這個系統裡會和很多其他公司的專案互動。隨之而來一個很蛋疼的問題,這麼多公司的介面,不同公司介面的穩定性差別很大,訪問量大的時候,有的不怎麼行的介面就各種出錯了。

這個介面系統剛剛開發不久,整個系統中,處於比較邊緣的位置,不像其他專案,有日誌庫,還有簡訊告警,一旦出問題,很多情況下都是使用者反饋回來,所以,我的想法是,拿起python,為這個專案寫一個監控。如果在呼叫某個第三方介面的過程中,大量出錯了,說明這個介面有有問題了,就可以更快的採取措施。

專案的也是有日誌庫的,所有的info,error日誌都是每隔一分鐘掃描入庫,日誌庫是用的mysql,表裡有幾個特別重要的欄位:

  • level 日誌級別
  • message 日誌內容 
  • file_name Java程式碼檔案
  • log_time 日誌時間

有日誌庫,就不用自己去線上環境掃日誌分析了,直接從日誌庫入手。由於日誌庫線上上時每隔1分鐘掃,那我就去日誌庫每隔2分鐘掃一次,如果掃到有一定數量的error日誌就報警,如果只有一兩條錯誤就可以無視了,也就是短時間爆發大量錯誤日誌,就可以斷定系統有問題了。報警方式就用傳送郵件,所以,需要做下面幾件事情:
1. 操作MySql。
2. 傳送郵件。
3. 定時任務。
4. 日誌。
5. 執行指令碼。

明確了以上幾件事情,就可以動手了。

運算元據庫

使用MySQLdb這個驅動,直接運算元據庫,主要就是查詢操作。
獲取資料庫的連線:

從日誌庫裡獲取資料,獲取當前時間之前2分鐘的資料,首先,根據當前時間進行計算一下時間。之前,計算有問題,現在已經修改。

然後,根據時間和日誌級別去日誌庫查詢資料

傳送郵件

使用python傳送郵件比較簡單,使用標準庫smtplib就可以
這裡使用163郵箱進行傳送,你可以使用其他郵箱或者企業郵箱都行,不過host和port要設定正確。

定時任務

使用一個單獨的執行緒,每2分鐘掃描一次,如果ERROR級別的日誌條數超過5條,就發郵件通知。

日誌

為這個小小的指令碼配置一下日誌log.py,讓日誌可以輸出到檔案和控制檯中。

所以,最後,這個監控小程式就是這樣的app_monitor.py

執行指令碼

指令碼在伺服器上執行,使用supervisor進行管理。
在伺服器(centos6)上安裝supervisor,然後在/etc/supervisor.conf中加入一下配置:

然後在終端中執行supervisord啟動supervisor。
在終端中執行supervisorctl,進入shell,執行status檢視指令碼的執行狀態。

總結

這個小監控思路很清晰,還可以繼續修改,比如:監控特定的介面,傳送簡訊通知等等。
因為有日誌庫,就少了去線上正式環境掃描日誌的麻煩,所以,如果沒有日誌庫,就要自己上線上環境掃描,在正式線上環境一定要小心哇~

相關文章