7. 監控MySQL主從狀態

最愛喝酸奶發表於2019-01-21

在生產環境裡,常見的MySQL架構使用最多的就是主從了,所以對於主從是否同步資料的監控尤為重要。如果使用了專業的監控軟體(如zabbix)監控MySQL,那麼選擇監控工具提供的模板或外掛去監控非常方便,但如果涉及到一些特殊要求就另當別論了。當然還可以寫shell指令碼來實現定製化的需求,本案例需要寫一個shell指令碼來監控MySQL主從。

具體要求如下:

1)每分鐘檢測一次,本次執行指令碼時要檢測上一次是否執行完成,如果還未完成則本次不執行;

2)如果不同步需要傳送告警郵件給admin@admin.com;

3)做告警收斂,在沒有解決問題之前每隔30分鐘發一次告警郵件;

4)假設mysql賬戶為root,密碼是tpH40kznv 。

郵件指令碼如下:

#!/usr/bin/python
#coding:utf-8
import smtplib
from email.mine.text import MIMEText
import sys
mail_host = 'stmp.163.com'
mail_user = 'test@163.com'
mail_pass = 'your_mail_password'
mail_postfix = '163.com'
def send_mail(to_list,subject,content):
    me = "zabbix 監控告警平臺"+"<"+mail_user+"@"+mail_postfix+">"
    msg = MIMEText(content,'plain','utf-8')
    msg['Subject'] = subject
    msg['From'] = me
    msg['to'] = to_list
    try:
        s = smtplib:SMTP()
        s.connect(mail_host)
        s.login(mail_user,mail_pass)
        s.sendmail(me,to_list,msg.as_string())
        s.close()
        return True
    except Exception,e:
        print str(e)
        return False
if __name__ == "__main__"
    send_mail(sys.argv[1], sys.argv[2], sys.argv[3])

參考指令碼如下:

# vim /usr/local/sbin/mysql_check.sh
#!/bin/bash
#檢測MySQL主從是否同步

#把指令碼名字存入變數s_name
s_name=`echo $0 |awk -F '/' '{print $NF}'`
mysql_c="mysql -uroot -ptpH40kznv"

#定義收件人郵箱
mail="/usr/local/sbin/mail.py"
mail_user=admin@admin.com

#該函式實現郵件告警收斂
m_mail()
{
    log=$1
    t_s=`date +%s`
    t_s2=`date -d "1 hour ago" +%s`
    if [ ! -f /tmp/$log ]
    then
        touch /tmp/$log         #建立$log檔案
        chattr +a /tmp/$log         #增加a許可權,僅允許追加內容
        echo $t_s2 >> /tmp/$log         #第一次告警,可直接寫入1小時前的時間戳
    fi
    
    t_s2=`tail -1 /tmp/$log |awk '{print $1}'`          #檢視$log檔案最後一行的時間戳
    echo $t_s >> /tmp/$log          #取出最後一行即上次告警的時間戳後,立即寫入當前的時間戳
    v=$[$t_s-$t_s2]         #取兩次時間戳差值
    if [ $v -gt 1800 ]          #差值如果超過1800s,立即發郵件
    then
        python $mail $mail_user $1 "`cat $2`" 2>/dev/null         #發郵件,$2為mail函式第二個引數,這裡是一個檔案
        echo "0" > /tmp/$log.count          #定義計時器臨時檔案,並寫入0
    else
        if [ ! -f /tmp/$log.count ]
        then
            echo "0" > /tmp/$log.count          #如果計時器臨時檔案不存在,需要建立並寫入0
        fi
        
        nu=`cat /tmp/$log.count`
        nu2=$[$nu+1]        #30分鐘內每發生一次告警,計數器加1
        echo $nu2 > /tmp/$log.count
        
        if [ $nu2 -gt 30 ]
        then
            python $mail $mail_user "$1 30min" "`cat $2`" 2>/dev/null
            echo "0" > /tmp/$log.count          #第二次告警後,計數器歸0
        fi
    fi
}

#把程式情況存入臨時檔案
ps aux |grep "$s_name" |grep -vE "$$|grep" > /tmp/ps.tmp        #$$為本程式PID
p_n=`wc -l /tmp/ps.tmp |awk '{print $1}'`

#當程式數大於0,則說明上次的指令碼還未執行完
if [ $p_n -gt 0 ]
then
    exit
fi

#先執行一條 show processlist,看是否執行成功
$mysql_c -e "show processlist" >/tmp/mysql_pro.log 2>/tmp/mysql_log.err

#如果上一條命令執行不成功,說明這個MySQL服務出現了問題
if [ $? -gt 0 ]
then
    m_mail mysql_service_error /tmp/mysql_s.log
else
    $mysql_c -e "show slave status\G" > /tmp/mysql_s.log
    n1=`wc -l /tmp/mysql_s.log |awk '{print $1}'`
    
    if [ $n1 -gt 0 ]
    then
        y1=`grep 'Slave_IO_Running:' /tmp/mysql_s.log |awk -F : '{print $2}' |sed 's/ //'`
        y1=`grep 'Slave_MYSQL_Running:' /tmp/mysql_s.log |awk -F : '{print $2}' |sed 's/ //'`
        
        if [ $y1 == "No" ] || [ $y2 == "No" ]
        then
            m_mail mysql_slavestatus_error /tmp/mysql_s.log
        fi
    fi
fi

增加計劃任務:

* * * * * /bin/bash /usr/local/sbin/mysql_check.sh

相關文章