Crontab自動執行指令碼Kill掉MySQL的僵死程式

season0891發表於2012-01-12
MySQL + PHP的模式在大併發壓力下經常會導致MySQL中存在大量僵死程式,導致服務掛死。為了自動幹掉這些程式,弄了個指令碼,放在伺服器後臺透過crontab自動執行。發現這樣做了以後,的確很好的緩解了這個問題。把這個指令碼發出來和大家Share。

根據自己的實際需要,做了一些修改:

  SHELL指令碼:mysqld_kill_sleep.sh

#!/bin/sh
mysql_pwd="root的密碼"
mysqladmin_exec="/usr/local/bin/mysqladmin"
mysql_exec="/usr/local/bin/mysql"
"/tmp"
mysql_timeout_log="$mysql_timeout_dir/mysql_timeout.log"
mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"
"$mysql_timeout_dir/mysql_kill_timeout.log"
$mysqladmin_exec -uroot -p"$mysql_pwd" processlist | awk '{ print $12 , $2 ,$4}' | grep -v Time | grep -v '|' | sort -rn > $mysql_timeout_log
awk '{if($1>30 && $3!="root") print "'""$mysql_exec""' -e " "/"" "kill",$2 "/"" " -uroot " "-p""/"""'""$mysql_pwd""'""/"" ";" }' $mysql_timeout_log > $mysql_kill_timeout_sh
echo "check start ...." >> $mysql_kill_timeout_log
echo `date` >> $mysql_kill_timeout_log
cat $mysql_kill_timeout_sh

  把這個寫到mysqld_kill_sleep.sh。然後chmod 0 mysqld_kill_sleep.sh,chmod u+rx mysqld_kill_sleep.sh,然後用root賬戶到cron裡面執行即可,時間自己調整。執行之後顯示:

www# ./mysqld_kill_sleep.sh
/usr/local/bin/mysql -e "kill 27549" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27750" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27840" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27867" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27899" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27901" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27758" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27875" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27697" -uroot -p"mysql root的密碼";
"kill 27888" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27861" -uroot -p"mysql root的密碼";

  如果確認沒有問題了,把最後的cat修改為sh即可。本人改寫了下上面的指令碼:

#!/bin/bash
mysql_pwd="密碼"
mysql_exec="/usr/local/mysql/bin/mysql"
mysql_timeout_dir="/tmp"
mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"
"$mysql_timeout_dir/mysql_kill_timeout.log"
$mysql_exec -uroot -p$mysql_pwd -e "show processlist" | grep -i "Locked" >> $mysql_kill_timeout_log

for line in `$mysql_kill_timeout_log  | awk '{print $1}'`
do
echo "$mysql_exec -uroot -p$mysql_pwd -e /"kill $line/"" >> $mysql_kill_timeout_sh
done

cat $mysql_kill_timeout_sh

  很多時候!一不小心就鎖表!這裡講解決鎖表終極方法!

案例一

mysql>showprocesslist;

  參看sql語句,一般少的話

mysql>killthread_id;

  就可以解決了,kill掉第一個鎖表的程式, 依然沒有改善.既然不改善,我們們就想辦法將所有鎖表的程式kill掉吧,簡單的指令碼如下:

#!/bin/bash
mysql-uroot-e"show processlist"|grep-i"Locked">>locked_log.txt

forlinein`cat locked_log.txt | awk '{print$1}'`
do
echo"kill$line;">>kill_thread_id.sql
done

現在kill_thread_id.sql的內容像這個樣子

kill66402982;
kill66402983;
kill66402986;
kill66402991;
.....

好了,我們在mysql的shell中執行,就可以把所有鎖表的程式殺死了。

mysql>sourcekill_thread_id.sql

當然了,也可以一行搞定。

foridin`mysqladmin processlist | grep -i locked | awk '{print$1}'`
do
mysqladminkill${id}
done

案例二

  如果大批次的操作能夠透過一系列的select語句產生,那麼理論上就能對這些結果批次處理。但是mysql並沒用提供eval這樣的對結果集進行分析操作的功能。所以只能現將select結果儲存到臨時檔案中,然後再執行臨時檔案中的指令。具體過程如下:

mysql> SELECT concat('KILL ',id,';') FROM information_schema.processlist WHERE user='root';
+------------------------+
| concat('KILL ',id,';')
+------------------------+
| KILL 3101;            
| KILL 2946;            
+------------------------+
2 rows IN SET (0.00 sec)

mysql> SELECT concat('KILL ',id,';') FROM information_schema.processlist WHERE user='root' INTO OUTFILE '/tmp/a.txt';
Query OK, 2 rows affected (0.00 sec)

mysql> source /tmp/a.txt;
Query OK, 0 rows affected (0.00 sec)

案例三

   MySQL + PHP的模式在大併發壓力下經常會導致MySQL中存在大量僵死程式,導致服務掛死。為了自動幹掉這些程式,弄了個指令碼,放在伺服器後臺透過 crontab自動執行。發現這樣做了以後,的確很好的緩解了這個問題。把這個指令碼發出來和大家Share。根據自己的實際需要,做了一些修改:

SHELL指令碼:mysqld_kill_sleep.sh

#!/bin/sh
mysql_pwd="root的密碼"
mysqladmin_exec="/usr/local/bin/mysqladmin"
mysql_exec="/usr/local/bin/mysql"
mysql_timeout_dir="/tmp"
mysql_timeout_log="$mysql_timeout_dir/mysql_timeout.log"
mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"
mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"
$mysqladmin_exec -uroot -p"$mysql_pwd" processlist | awk '{ print $12 , $2 ,$4}' | grep -v Time | grep -v '|' | sort -rn > $mysql_timeout_log
awk '{if($1>30 && $3!="root") print "'""$mysql_exec""' -e " "\"" "kill",$2 "\"" " -uroot " "-p""\"""'""$mysql_pwd""'""\"" ";" }' $mysql_timeout_log > $mysql_kill_timeout_sh
echo "check start ...." >> $mysql_kill_timeout_log
echo `date` >> $mysql_kill_timeout_log
cat $mysql_kill_timeout_sh

  把這個寫到mysqld_kill_sleep.sh。然後chmod 0 mysqld_kill_sleep.sh,chmod u+rx mysqld_kill_sleep.sh,然後用root賬戶到cron裡面執行即可,時間自己調整。執行之後顯示:

www# ./mysqld_kill_sleep.sh
/usr/local/bin/mysql -e "kill 27549" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27750" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27840" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27867" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27899" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27901" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27758" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27875" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27697" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27888" -uroot -p"mysql root的密碼";
/usr/local/bin/mysql -e "kill 27861" -uroot -p"mysql root的密碼";

  如果確認沒有問題了,把最後的cat修改為sh即可。本人改寫了下上面的指令碼:

#!/bin/bash
mysql_pwd="密碼"
mysql_exec="/usr/local/mysql/bin/mysql"
mysql_timeout_dir="/tmp"
mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"
mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"
$mysql_exec -uroot -p$mysql_pwd -e "show processlist" | grep -i "Locked" >> $mysql_kill_timeout_log
chmod 777 $mysql_kill_timeout_log
for line in `$mysql_kill_timeout_log  | awk '{print $1}'`
do
echo "$mysql_exec -uroot -p$mysql_pwd -e \"kill $line\"" >> $mysql_kill_timeout_sh
done
chmod 777 $mysql_kill_timeout_sh
cat $mysql_kill_timeout_sh

  是不是很方便呢!processlist命令的輸出結果顯示了有哪些執行緒在執行,可以幫助識別出有問題的查詢語句,兩種方式使用這個命令。

  • 1、進入mysql/bin目錄下輸入mysqladmin processlist;
  • 2、啟動mysql,輸入show processlist;

  如果有SUPER許可權,則可以看到全部的執行緒,否則,只能看到自己發起的執行緒(這是指,當前對應的MySQL帳戶執行的執行緒)。得到資料形式如下(只擷取了三條):

mysql> show processlist;

+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------

| Id | User | Host | db | Command | Time| State | Info

+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------

|207|root |192.168.0.20:51718 |mytest | Sleep | 5 | | NULL

|208|root |192.168.0.20:51719 |mytest | Sleep | 5 | | NULL

|220|root |192.168.0.20:51731 |mytest |Query | 84 | Locked |

select bookname,culture,value,type from book where id=001

   先簡單說一下各列的含義和用途,第一列,id,不用說了吧,一個標識,你要kill一個語句的時候很有用。user列,顯示單前使用者,如果不是 root,這個命令就只顯示你許可權範圍內的sql語句。host列,顯示這個語句是從哪個ip的哪個埠上發出的。呵呵,可以用來追蹤出問題語句的使用者。 db列,顯示這個程式目前連線的是哪個資料庫。command列,顯示當前連線的執行的命令,一般就是休眠(sleep),查詢(query),連線 (connect)。time列,此這個狀態持續的時間,單位是秒。state列,顯示使用當前連線的sql語句的狀態,很重要的列,後續會有所有的狀態 的描述,請注意,state只是語句執行中的某一個狀態,一個sql語句,已查詢為例,可能需要經過copying to tmp table,Sorting result,Sending data等狀態才可以完成,info列,顯示這個sql語句,因為長度有限,所以長的sql語句就顯示不全,但是一個判斷問題語句的重要依據。

  這個命令中最關鍵的就是state列,mysql列出的狀態主要有以下幾種:

Checking table

  正在檢查資料表(這是自動的)。

Closing tables

  正在將表中修改的資料重新整理到磁碟中,同時正在關閉已經用完的表。這是一個很快的操作,如果不是這樣的話,就應該確認磁碟空間是否已經滿了或者磁碟是否正處於重負中。

Connect Out

  複製從伺服器正在連線主伺服器。

Copying to tmp table on disk

  由於臨時結果集大於tmp_table_size,正在將臨時表從記憶體儲存轉為磁碟儲存以此節省記憶體。

Creating tmp table

  正在建立臨時表以存放部分查詢結果。

deleting from main table

  伺服器正在執行多表刪除中的第一部分,剛刪除第一個表。

deleting from reference tables

  伺服器正在執行多表刪除中的第二部分,正在刪除其他表的記錄。

Flushing tables

  正在執行FLUSH TABLES,等待其他執行緒關閉資料表。

Killed

   傳送了一個kill請求給某執行緒,那麼這個執行緒將會檢查kill標誌位,同時會放棄下一個kill請求。MySQL會在每次的主迴圈中檢查kill標誌 位,不過有些情況下該執行緒可能會過一小段才能死掉。如果該執行緒程被其他執行緒鎖住了,那麼kill請求會在鎖釋放時馬上生效。

Locked

  被其他查詢鎖住了。

Sending data

  正在處理Select查詢的記錄,同時正在把結果傳送給客戶端。

Sorting for group

  正在為GROUP BY做排序。

Sorting for order

  正在為ORDER BY做排序。

Opening tables

  這個過程應該會很快,除非受到其他因素的干擾。例如,在執Alter TABLE或LOCK TABLE語句行完以前,資料表無法被其他執行緒開啟。正嘗試開啟一個表。

Removing duplicates

  正在執行一個Select DISTINCT方式的查詢,但是MySQL無法在前一個階段最佳化掉那些重複的記錄。因此,MySQL需要再次去掉重複的記錄,然後再把結果傳送給客戶端。

Reopen table

  獲得了對一個表的鎖,但是必須在表結構修改之後才能獲得這個鎖。已經釋放鎖,關閉資料表,正嘗試重新開啟資料表。

Repair by sorting

  修復指令正在排序以建立索引。

Repair with keycache

  修復指令正在利用索引快取一個一個地建立新索引。它會比Repair by sorting慢些。

Searching rows for update

  正在講符合條件的記錄找出來以備更新。它必須在Update要修改相關的記錄之前就完成了。

Sleeping

  正在等待客戶端傳送新請求.

System lock

  正在等待取得一個外部的系統鎖。如果當前沒有執行多個mysqld伺服器同時請求同一個表,那麼可以透過增加--skip-external-locking引數來禁止外部系統鎖。

Upgrading lock

  Insert DELAYED正在嘗試取得一個鎖表以插入新記錄。

Updating

  正在搜尋匹配的記錄,並且修改它們。

User Lock

  正在等待GET_LOCK()。

Waiting for tables

  該執行緒得到通知,資料表結構已經被修改了,需要重新開啟資料表以取得新的結構。然後,為了能的重新開啟資料表,必須等到所有其他執行緒關閉這個表。以下幾種情況下會產生這個通知:

FLUSH TABLES tbl_name, Alter TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,OPTIMIZE TABLE。

waiting for handler insert

  Insert DELAYED已經處理完了所有待處理的插入操作,正在等待新的請求。大部分狀態對應很快的操作,只要有一個執行緒保持同一個狀態好幾秒鐘,那麼可能是有問題發生了,需要檢查一下。

  還有其他的狀態沒在上面中列出來,不過它們大部分只是在檢視伺服器是否有存在錯誤是才用得著。

轉自:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/90618/viewspace-714783/,如需轉載,請註明出處,否則將追究法律責任。

相關文章