監控Oracle資料庫的常用shell指令碼(轉)

gugu99發表於2007-08-13
監控Oracle資料庫的常用shell指令碼(轉)[@more@]

  前言

  這篇文章介紹了DBA每天在監控Oracle資料庫方面的職責,講述瞭如何透過shell指令碼來完成這些重複的監控工作。本文首先回顧了一些DBA常用的Unix命令,以及解釋瞭如何透過Unix Cron來定時執行DBA指令碼。同時文章還介紹了8個重要的指令碼來監控Oracle資料庫:

  檢查例項的可用性

  檢查監聽器的可用性

  檢查alert日誌檔案中的錯誤資訊

  在存放log檔案的地方滿以前清空舊的log檔案

  分析table和index以獲得更好的效能

  檢查表空間的使用情況

  找出無效的物件

  監控使用者和事務

  DBA需要的Unix基本知識

  基本的UNIX命令

  以下是一些常用的Unix命令:

  ps--顯示程式

  grep--搜尋檔案中的某種文字模式

  mailx--讀取或者傳送mail

  cat--連線檔案或者顯示它們

  cut--選擇顯示的列

  awk--模式匹配語言

  df--顯示剩餘的磁碟空間

  以下是DBA如何使用這些命令的一些例子:

  顯示伺服器上的可用例項:

  $ ps -ef | grep smonoracle 21832 1 0 Feb 24 ? 19:05 ora_smon_oradb1oracle 898 1 0 Feb 15 ? 0:00 ora_smon_oradb2dliu 25199 19038 0 10:48:57 pts/6 0:00 grep smonoracle 27798 1 0 05:43:54 ? 0:00 ora_smon_oradb3oracle 28781 1 0 Mar 03 ? 0:01 ora_smon_oradb4、

  顯示伺服器上的可用監聽器:

  $ ps -ef | grep listener | grep -v grep(譯者注:grep命令應該加上-i引數,即grep -i listener,該引數的作用是忽略大小寫,因為有些時候listener是大寫的,這時就會看不到結果)oracle 23879 1 0 Feb 24 ? 33:36 /8.1.7/bin/tnslsnr listener_db1 -inheritoracle 27939 1 0 05:44:02 ? 0:00 /8.1.7/bin/tnslsnr listener_db2 -inheritoracle 23536 1 0 Feb 12 ? 4:19 /8.1.7/bin/tnslsnr listener_db3 -inheritoracle 28891 1 0 Mar 03 ? 0:01 /8.1.7/bin/tnslsnr listener_db4 -inherit

  檢視Oracle存檔目錄的檔案系統使用情況

  $ df -k | grep oraarch/dev/vx/dsk/proddg/oraarch 71123968 4754872 65850768 7% /u09/oraarch

  統計alter.log檔案中的行數:

  $ cat alert.log | wc -l2984

  列出alert.log檔案中的全部Oracle錯誤資訊:

  $ grep ORA- alert.logORA-00600: internal error code, arguments: [kcrrrfswda.1], [], [], [], [], []ORA-00600: internal error code, arguments: [1881], [25860496], [25857716], []

  CRONTAB基本

  一個crontab檔案中包含有六個欄位:

  分鐘 0-59

  小時 0-23

  月中的第幾天 1-31

  月份 1 - 12

  星期幾 0 - 6, with 0 = Sunday

  Unix命令或者Shell指令碼

  要編輯一個crontab檔案,輸入:

  Crontab -e

  要檢視一個crontab檔案,輸入:

  Crontab -l0 4 * * 5 /dba/admin/analyze_table.ksh30 3 * * 3,6 /dba/admin/hotbackup.ksh /dev/null 2>&1

  在上面的例子中,第一行顯示了一個分析表的指令碼在每個星期5的4:00am執行。第二行顯示了一個執行熱備份的指令碼在每個週三和週六的3:00a.m.執行。

  監控資料庫的常用Shell指令碼

  以下提供的8個shell指令碼覆蓋了DBA每日監控工作的90%,你可能還需要修改UNIX的環境變數。

  檢查Oracle例項的可用性

  oratab檔案中列出了伺服器上的所有資料庫

  $ cat /var/opt/oracle/oratab##################################################################### /var/opt/oracle/oratab #####################################################################oradb1:/u01/app/oracle/product/8.1.7:Yoradb2:/u01/app/oracle/product/8.1.7:Yoradb3:/u01/app/oracle/product/8.1.7:Noradb4:/u01/app/oracle/product/8.1.7:Y

  以下的指令碼檢查oratab檔案中列出的所有資料庫,並且找出該資料庫的狀態(啟動還是關閉)

  ##################################################################### ckinstance.ksh ## ###################################################################ORATAB=/var/opt/oracle/oratabecho "`date` "echo "Oracle Database(s) Status `hostname` :

"db=`egrep -i ":Y|:N" $ORATAB | cut -d":" -f1 | grep -v "#" | grep -v "*"`pslist="`ps -ef | grep pmon`"for i in $db ; doecho "$pslist" | grep "ora_pmon_$i" > /dev/null 2>$1if (( $? )); thenecho "Oracle Instance - $i: Down"elseecho "Oracle Instance - $i: Up"fidone

  使用以下的命令來確認該指令碼是可以執行的:

  $ chmod 744 ckinstance.ksh$ ls -l ckinstance.ksh-rwxr--r-- 1 oracle dba 657 Mar 5 22:59 ckinstance.ksh*

  以下是例項可用性的報表:

  $ ckinstance.kshMon Mar 4 10:44:12 PST 2002Oracle Database(s) Status for DBHOST server:Oracle Instance - oradb1: UpOracle Instance - oradb2: UpOracle Instance - oradb3: DownOracle Instance - oradb4: Up

  檢查Oracle監聽器的可用性

  以下有一個類似的指令碼檢查Oracle監聽器。如果監聽器停了,該指令碼將會重新啟動監聽器:

  ######################################################################### cklsnr.sh ##########################################################################!/bin/kshDBALIST="primary.dba@company.com,another.dba@company.com";export DBALISTcd /var/opt/oraclerm -f lsnr.existps -ef | grep mylsnr | grep -v grep > lsnr.existif [ -s lsnr.exist ]thenechoelseecho "Alert" | mailx -s "Listener 'mylsnr' on `hostname` is down" $DBALISTTNS_ADMIN=/var/opt/oracle; export TNS_ADMINORACLE_SID=db1; export ORACLE_SIDORAENV_ASK=NO; export ORAENV_ASKPATH=$PATH:/bin:/usr/local/bin; export PATH. oraenvLD_LIBRARY_PATH=${ORACLE_HOME}/lib;export LD_LIBRARY_PATHlsnrctl start mylsnrfi

  檢查Alert日誌(ORA-XXXXX)

  每個指令碼所使用的一些環境變數可以放到一個profile中:

  ######################################################################### oracle.profile #########################################################################EDITOR=vi;export EDITOR ORACLE_BASE=/u01/app/oracle; exportORACLE_BASE ORACLE_HOME=$ORACLE_BASE/product/8.1.7; exportORACLE_HOME LD_LIBRARY_PATH=$ORACLE_HOME/lib; exportLD_LIBRARY_PATH TNS_ADMIN=/var/opt/oracle;exportTNS_ADMIN NLS_LANG=american; exportNLS_LANG NLS_DATE_FORMAT='Mon DD YYYY HH24:MI:SS'; exportNLS_DATE_FORMAT ORATAB=/var/opt/oracle/oratab;exportORATAB PATH=$PATH:$ORACLE_HOME:$ORACLE_HOME/bin:/usr/ccs/bin:/bin:/usr/bin:/usr/sbin:/sbin:/usr/openwin/bin:/opt/bin:.; exportPATH DBALIST="primary.dba@company.com,another.dba@company.com";exportDBALIST

  以下的指令碼首先呼叫oracle.profile來設定全部的環境變數。如果發現任何的Oracle錯誤,該指令碼還會給DBA傳送一個警告的email。

  ###################################################################### ckalertlog.sh #######################################################################!/bin/ksh.. /etc/oracle.profilefor SID in `cat $ORACLE_HOME/sidlist`docd $ORACLE_BASE/admin/$SID/bdumpif [ -f alert_${SID}.log ]thenmv alert_${SID}.log alert_work.logtouch alert_${SID}.logcat alert_work.log >> alert_${SID}.histgrep ORA- alert_work.log > alert.errfiif [ `cat alert.err|wc -l` -gt 0 ]thenmailx -s "${SID} ORACLE ALERT ERRORS" $DBALIST < alert.errfirm -f alert.errrm -f alert_work.logdone

  清除舊的歸檔檔案

  以下的指令碼將會在log檔案達到90%容量的時候清空舊的歸檔檔案:

  $ df -k | grep archFilesystem kbytes used avail capacity Mounted on/dev/vx/dsk/proddg/archive 71123968 30210248 40594232 43% /u08/archive######################################################################### clean_arch.ksh ##########################################################################!/bin/kshdf -k | grep arch > dfk.resultarchive_filesystem=`awk -F" " '{ print $6 }' dfk.result`archive_capacity=`awk -F" " '{ print $5 }' dfk.result`if [[ $archive_capacity > 90% ]]thenecho "Filesystem ${archive_filesystem} is ${archive_capacity} filled"# try one of the following option depend on your needfind $archive_filesystem -type f -mtime +2 -exec rm -r {} ;tarrmanfi

  分析表和索引(以得到更好的效能)

  以下我將展示如果傳送引數到一個指令碼中:

  ###################################################################### analyze_table.sh #######################################################################!/bin/ksh# input parameter: 1: password # 2: SIDif (($#<1)) then echo "Please enter 'oracle' user password as the first parameter !" exit 0fiif (($#<2)) then echo "Please enter instance name as the second parameter!" exit 0fi

  要傳入引數以執行該指令碼,輸入:

  $ analyze_table.sh manager oradb1

  指令碼的第一部分產生了一個analyze.sql檔案,裡面包含了分析表用的語句。指令碼的第二部分分析全部的表:

  ####################################################################### analyze_table.sh #######################################################################sqlplus -s

  以下是analyze.sql的一個例子:

  $ cat analyze.sqlANALYZE TABLE HIRWIN.JANUSAGE_SUMMARY ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE HIRWIN.JANUSER_PROFILE ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE APPSSYS.HIST_SYSTEM_ACTIVITY ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE HTOMEH.QUEST_IM_VERSION ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE JSTENZEL.HIST_SYS_ACT_0615 ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE JSTENZEL.HISTORY_SYSTEM_0614 ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE JSTENZEL.CALC_SUMMARY3 ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE IMON.QUEST_IM_LOCK_TREE ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE APPSSYS.HIST_USAGE_SUMMARY ESTIMATE STATISTICS SAMPLE 10 PERCENT;ANALYZE TABLE PATROL.P$LOCKCONFLICTTX ESTIMATE STATISTICS SAMPLE 10 PERCENT;

  檢查表空間的使用

  以下的指令碼檢測表空間的使用。如果表空間只剩下10%,它將會傳送一個警告email。

  ####################################################################### ck_tbsp.sh ########################################################################!/bin/kshsqlplus -s tablespace.tmpmailx -s "TABLESPACE ALERT for ${2}" $DBALIST < tablespace.tmpfi

  警告email輸出的例子如下:

  TABLESPACE_NAME USED (MB) FREE (MB) TOTAL (MB) PER_FREE------------------- --------- ----------- ------------------- ------------------SYSTEM 2,047 203 2,250 9 %STBS01 302 25 327 8 %STBS02 241 11 252 4 %STBS03 233 19 252 8 %

  查詢出無效的資料庫物件

  以下查詢出無效的資料庫物件:

  ##################################################################### ## invalid_object_alert.sh ## ##################################################################### #!/bin/ksh . /etc/oracle.profilesqlplus -s

  監視使用者和事務(死鎖等)

  以下的指令碼在死鎖發生的時候傳送一個警告e-mail:

  ##################################################################### deadlock_alert.sh ######################################################################!/bin/ksh.. /etc/oracle.profilesqlplus -s 0 OR BLOCK > 0ORDER BY block DESC;spool offexit!if [ `cat deadlock.alert|wc -l` -gt 0 ]thenmailx -s "DEADLOCK ALERT for ${2}" $DBALIST < deadlock.alertfi

  結論

  0,20,40 7-17 * * 1-5 /dba/scripts/ckinstance.sh > /dev/null 2>&10,20,40 7-17 * * 1-5 /dba/scripts/cklsnr.sh > /dev/null 2>&10,20,40 7-17 * * 1-5 /dba/scripts/ckalertlog.sh > /dev/null 2>&130 * * * 0-6 /dba/scripts/clean_arch.sh > /dev/null 2>&1* 5 * * 1,3 /dba/scripts/analyze_table.sh > /dev/null 2>&1* 5 * * 0-6 /dba/scripts/ck_tbsp.sh > /dev/null 2>&1* 5 * * 0-6 /dba/scripts/invalid_object_alert.sh > /dev/null 2>&10,20,40 7-17 * * 1-5 /dba/scripts/deadlock_alert.sh > /dev/null 2>&1

  透過以上的指令碼,可大大減輕你的工作。你可以使用這些是來做更重要的工作,例如效能調整。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10748419/viewspace-954159/,如需轉載,請註明出處,否則將追究法律責任。

相關文章