8個DBA最常用的監控Oracle資料庫的常用shell指令碼

zlingyi發表於2015-04-10
本文介紹了8個常用的監控資料shell指令碼。首先回顧了一些DBA常用的Unix命令,以及解釋瞭如何透過Unix Cron來定時執行DBA指令碼。網上也有好多類似的文章,但基本上都不能正常執行,花點時間重新整理了下,以後就能直接使用了。 

一.同時文章還介紹了8個重要的指令碼來監控Oracle資料庫: 
1.檢查例項的可用性 
2.檢查監聽器的可用性 
3.檢查alert日誌檔案中的錯誤資訊 
4.在存放log檔案的地方滿以前清空舊的log檔案 
5.分析table和index以獲得更好的效能 
6.檢查表空間的使用情況 
7.找出無效的物件 
8.監控使用者和事務 

二.DBA需要的Unix基本知識 
基本的UNIX命令,以下是一些常用的Unix命令: 
ps--顯示程式 
grep--搜尋檔案中的某種文字模式 
mailx--讀取或者傳送mail 
cat--連線檔案或者顯示它們 
cut--選擇顯示的列 
awk--模式匹配語言 
df--顯示剩餘的磁碟空間 

以下是DBA如何使用這些命令的一些例子: 

1. 顯示伺服器上的可用例項: 
$ ps -ef| grep smon 
  oracle 22086     1  0 02:32:24 ?        0:04 ora_smon_PPRD10 
oracle  5215 28972  0 08:10:19 pts/4    0:00 grep smon 

2. 顯示伺服器上的可用監聽器: 
$ ps -ef grep listener grep -v grep 
(grep命令應該加上-i引數,即grep -i listener,該引數的作用是忽略大小寫,因為有些時候listener是大寫的,這時就會看不到結果) 
$ ps -ef|grep -i listener 
  oracle  9655     1  0   Mar 12 ?        0:01 /data/app/oracle/9.2.0/bin/tnslsnr LISTENER -inherit 
  oracle 22610     1  0 02:45:02 ?        0:02 /data/app/oracle/10.2.0/bin/tnslsnr LISTENER -inherit 
oracle  5268 28972  0 08:13:02 pts/4    0:00 grep -i listener 

3. 檢視Oracle存檔目錄的檔案系統使用情況 
$ df -k | grep /data 
/dev/md/dsk/d50      104977675 88610542 15317357    86%    /data 

4. 統計alter.log檔案中的行數: 
$ cat alert_PPRD10.log | wc -l 
   13124 
$ more alert_PPRD10.log | wc -l 
   13124 

5. 列出alert.log檔案中的全部Oracle錯誤資訊: 
$ grep ORA-* alert.log 
ORA-00600: internal error code, arguments: [kcrrrfswda.1], [], [], [], [], [] 
ORA-00600: internal error code, arguments: [1881], [25860496], [25857716], [] 

6. CRONTAB基本 
一個crontab檔案中包含有六個欄位: 
分鐘 0-59 
小時 0-23 
月中的第幾天 1-31 
月份 1 - 12 
星期幾 0 - 6, with 0 = Sunday 

7. Unix命令或者Shell指令碼 
要編輯一個crontab檔案,輸入: Crontab -e 
要檢視一個crontab檔案,輸入: Crontab -l 
0 4 * * 5 /dba/admin/analyze_table.ksh 
30 3 * * 3,6 /dba/admin/hotbackup.ksh /dev/null 2>&1 
在上面的例子中,第一行顯示了一個分析表的指令碼在每個星期5的4:00am執行。第二行顯示了一個執行熱備份的指令碼在每個週三和週六的3:00a.m.執行。 

三.監控資料庫的常用Shell指令碼 
以下提供的8個shell指令碼覆蓋了DBA每日監控工作的90%,你可能還需要修改UNIX的環境變數。 

1. 檢查Oracle例項的可用性 
oratab檔案中列出了伺服器上的所有資料庫 
$ cat /var/opt/oracle/oratab 


# This file is used by ORACLE utilities.  It is created by root.sh 
# and updated by the Database Configuration Assistant when creating 
# a database. 

# A colon, ':', is used as the field terminator.  A new line terminates 
# the entry.  Lines beginning with a pound sign, '#', are comments. 

# Entries are of the form: 
#   $ORACLE_SID:$ORACLE_HOME:

# The first and second fields are the system identifier and home 
# directory of the database respectively.  The third filed indicates 
# to the dbstart utility that the database should , "Y", or should not, 
# "N", be brought up at system boot time. 

# Multiple entries with the same $ORACLE_SID are not allowed. 


# *:/data/app/oracle/9.2.0:N 
TRNG:/data/app/oracle/9.2.0:Y 
*:/data/app/oracle/9.2.0:N 
PPRD:/data/app/oracle/10.2.0:Y 
PPRD10:/data/app/oracle/10.2.0:N 

以下的指令碼檢查oratab檔案中列出的所有資料庫,並且找出該資料庫的狀態(啟動還是關閉) 
################################################################### 
## ckinstance.ksh ## 
################################################################### 
ORATAB=/var/opt/oracle/oratab 
echo "`date` " 
echo "Oracle Database(s) Status `hostname` :/n" 
db=`egrep -i ":Y|:N" $ORATAB | cut -d":" -f1 | grep -v "/#" | grep -v "/*"` 
pslist="`ps -ef | grep pmon`" 
for i in $db ; do 
echo "$pslist" | grep "ora_pmon_$i" > /dev/null 2>$1 
if (( $? )); then 
echo "Oracle Instance - $i: Down" 
else 
echo "Oracle Instance - $i: Up" 
fi 
done 

使用以下的命令來確認該指令碼是可以執行的: 
$ chmod 744 ckinstance.ksh 
$ ls -l ckinstance.ksh 
-rwxr--r-- 1 oracle dba 657 Mar 5 22:59 ckinstance.ksh 

以下是例項可用性的報表: 
$ sh ckinstance.ksh 
Wed May 13 12:51:20 PDT 2009 
Oracle Database(s) Status gambels : 
Oracle Instance - PPRD: Up 
Oracle Instance - PPRD10: Up 

2. 檢查Oracle監聽器的可用性 
以下有一個類似的指令碼檢查Oracle監聽器。假如監聽器停了,該指令碼將會重新啟動監聽器: 
##################################################################### 
## cklsnr.sh ## 
##################################################################### 
#!/bin/ksh 
TNS_ADMIN=/var/opt/oracle; export TNS_ADMIN 
ORACLE_SID= PPRD10; export ORACLE_SID 
ORAENV_ASK=NO; export ORAENV_ASK 
PATH=$PATH:/bin:/usr/local/bin; export PATH 
. oraenv 
DBALIST="tianlesoftware@vip.qq.com,tianlesoftware@hotmail.com";export DBALIST 
cd /var/opt/oracle 
rm -f lsnr.exist 
ps -ef | grep PPRD10 | grep -v grep > lsnr.exist 
if [ -s lsnr.exist ] 
then 
echo 
else 
echo "Alert" | mailx -s "Listener 'PPRD10' on `hostname` is down" $DBALIST 
lsnrctl start PPRD10 
fi 

3. 檢查Alert日誌(ORA-XXXXX) 
#################################################################### 
## ckalertlog.sh ## 
#################################################################### 
#!/bin/ksh 

EDITOR=vi; export EDITOR 
ORACLE_SID=PPRD10; export ORACLE_SID 
ORACLE_BASE=/data/app/oracle; export ORACLE_BASE 
ORACLE_HOME=$ORACLE_BASE/10.2.0; export ORACLE_HOME 
LD_LIBRARY_PATH=$ORACLE_HOME/lib; export LD_LIBRARY_PATH 
TNS_ADMIN=/var/opt/oracle;export TNS_ADMIN 
NLS_LANG=american; export NLS_LANG 
NLS_DATE_FORMAT='Mon DD YYYY HH24:MI:SS'; export NLS_DATE_FORMAT 
ORATAB=/var/opt/oracle/oratab;export ORATAB 
PATH=$PATH:$ORACLE_HOME:$ORACLE_HOME/bin:/usr/ccs/bin:/bin:/usr/bin:/usr/sbin:/sbin:/usr/openwin/bin:/opt/bin:.; export PATH 
DBALIST="tianlesoftware@vip.qq.com,tianlesoftware@hotmail.com";export DBALIST 

cd $ORACLE_BASE/admin/PPRD10/bdump 
if [ -f alert_PPRD10.log ] 
then 
mv alert_PPRD10.log alert_work.log 
touch alert_PPRD10.log 
cat alert_work.log >> alert_PPRD10.hist 
grep ORA- alert_work.log > alert.err 
fi 
if [ `cat alert.err | wc -l` -gt 0 ] 
then 
mailx -s " PPRD10  ORACLE  ALERT  ERRORS" $DBALIST < alert.err 
fi 
rm -f alert.err 
rm -f alert_work.log 


4. 清除舊的歸檔檔案 
以下的指令碼將會在log檔案達到90%容量的時候清空舊的歸檔檔案: 
$ df -k | grep arch 
Filesystem kbytes used avail capacity Mounted on 
/dev/vx/dsk/proddg/archive 71123968 30210248 40594232 43% /u08/archive 

####################################################################### 
## clean_arch.ksh ## 
####################################################################### 
#!/bin/ksh 
df -k | grep arch > dfk.result 
archive_filesystem=`awk -F" " '{ print $6 }' dfk.result` 
archive_capacity=`awk -F" " '{ print $5 }' dfk.result` 

if [ $archive_capacity > 90% ] 
then 
echo "Filesystem ${archive_filesystem} is ${archive_capacity} filled" 
# try one of the following option depend on your need 
find $archive_filesystem -type f -mtime +2 -exec rm -r {} ; 
tar 
rman 
fi 

5. 分析表和索引(以得到更好的效能) 
以下我將展示假如傳送引數到一個指令碼中: 
#################################################################### 
## analyze_table.sh ## 
#################################################################### 
#!/bin/ksh 
# input parameter: 1: passWord # 2: SID 
if (($#<1)) then echo "Please enter 'oracle' user password as the first parameter !" exit 0 
fi 
if (($#<2)) then echo "Please enter instance name as the second parameter!" exit 0 
fi 
要傳入引數以執行該指令碼,輸入: 
$ analyze_table.sh manager oradb1 
指令碼的第一部分產生了一個analyze.sql檔案,裡面包含了分析表用的語句。指令碼的第二部分分析全部的表: 
################################################################# 
## analyze_table.sh ## 
################################################################# 
sqlplus -s '/ as sysdba' <
set heading off 
set feed off 
set pagesize 200 
set linesize 100 
spool analyze_table.sql 
select 'ANALYZE TABLE ' || owner || '.' || segment_name || 
' ESTIMATE STATISTICS SAMPLE 10 PERCENT;' 
from dba_segments 
where segment_type = 'TABLE' 
and owner not in ('SYS', 'SYSTEM'); 
spool off 
exit 
EOF 
sqlplus -s '/ as sysdba' <
@./analyze_table.sql 
exit 
EOF 

以下是analyze.sql的一個例子: 
$ cat analyze.sql 
ANALYZE TABLE HIRWIN.JANUSAGE_SUMMARY ESTIMATE STATISTICS SAMPLE 10 PERCENT; 
ANALYZE TABLE HIRWIN.JANUSER_PROFILE ESTIMATE STATISTICS SAMPLE 10 PERCENT; 
ANALYZE TABLE APPSSYS.HIST_SYSTEM_ACTIVITY ESTIMATE STATISTICS SAMPLE 10 PERCENT; 
ANALYZE TABLE HTOMEH.QUEST_IM_VERSION ESTIMATE STATISTICS SAMPLE 10 PERCENT; 
ANALYZE TABLE JSTENZEL.HIST_SYS_ACT_0615 ESTIMATE STATISTICS SAMPLE 10 PERCENT; 


6. 檢查表空間的使用 
以下的指令碼檢測表空間的使用。假如表空間只剩下10%,它將會傳送一個警告email。 
##################################################################### 
## ck_tbsp.sh ## 
##################################################################### 
#!/bin/ksh 

EDITOR=vi; export EDITOR 
ORACLE_SID=PPRD10; export ORACLE_SID 
ORACLE_BASE=/data/app/oracle; export ORACLE_BASE 
ORACLE_HOME=$ORACLE_BASE/10.2.0; export ORACLE_HOME 
LD_LIBRARY_PATH=$ORACLE_HOME/lib; export LD_LIBRARY_PATH 
TNS_ADMIN=/var/opt/oracle;export TNS_ADMIN 
NLS_LANG=american; export NLS_LANG 
NLS_DATE_FORMAT='Mon DD YYYY HH24:MI:SS'; export NLS_DATE_FORMAT 
ORATAB=/var/opt/oracle/oratab;export ORATAB 
PATH=$PATH:$ORACLE_HOME:$ORACLE_HOME/bin:/usr/ccs/bin:/bin:/usr/bin:/usr/sbin:/sbin:/usr/openwin/bin:/opt/bin:.; export PATH 
DBALIST="tianlesoftware@vip.qq.com,tianlesoftware@hotmail.com";export DBALIST 


sqlplus -s '/ as sysdba' <
set feed off 
set linesize 100 
set pagesize 200 
column "USED (MB)" format a10 
column "FREE (MB)" format a10 
column "TOTAL (MB)" format a10 
column PER_FREE format a10 
spool tablespace.alert 
SELECT F.TABLESPACE_NAME, 
TO_CHAR ((T.TOTAL_SPACE - F.FREE_SPACE),'999,999') "USED (MB)", 
TO_CHAR (F.FREE_SPACE, '999,999') "FREE (MB)", 
TO_CHAR (T.TOTAL_SPACE, '999,999') "TOTAL (MB)", 
TO_CHAR ((ROUND ((F.FREE_SPACE/T.TOTAL_SPACE)*100)),'999')||' %' PER_FREE 
FROM ( 
SELECT TABLESPACE_NAME, 
ROUND (SUM (BLOCKS*(SELECT VALUE/1024 
FROM V/$PARAMETER 
WHERE NAME = 'db_block_size')/1024) 
) FREE_SPACE 
FROM DBA_FREE_SPACE 
GROUP BY TABLESPACE_NAME 
) F, 

SELECT TABLESPACE_NAME, 
ROUND (SUM (BYTES/1048576)) TOTAL_SPACE 
FROM DBA_DATA_FILES 
GROUP BY TABLESPACE_NAME 
) T 
WHERE F.TABLESPACE_NAME = T.TABLESPACE_NAME 
AND (ROUND ((F.FREE_SPACE/T.TOTAL_SPACE)*100)) < 80; 
spool off 
exit 
EOF 
if [ `cat tablespace.alert|wc -l` -gt 0 ] 
then 
cat tablespace.alert > tablespace.tmp 
mailx -s "TABLESPACE  ALERT  for  PPRD10" $DBALIST < tablespace.tmp 
fi 

警告email輸出的例子如下: 
TABLESPACE_NAME                USED (MB)  FREE (MB)  TOTAL (MB) PER_FREE                             
------------------------------ ---------- ---------- ---------- ----------                           
SYSTEM                              519        401        920     44 %                               
MILLDATA                            559        441      1,000     44 %                               
SYSAUX                              331        609        940     65 %                               
MILLREPORTS                         146        254        400     64 %         

7. 查詢出無效的資料庫物件 
以下查詢出無效的資料庫物件: 
##################################################################### 
##invalid_object_alert.sh 
##################################################################### 
#!/bin/ksh 
EDITOR=vi; export EDITOR 
ORACLE_SID=PPRD10; export ORACLE_SID 
ORACLE_BASE=/data/app/oracle; export ORACLE_BASE 
ORACLE_HOME=$ORACLE_BASE/10.2.0; export ORACLE_HOME 
LD_LIBRARY_PATH=$ORACLE_HOME/lib; export LD_LIBRARY_PATH 
TNS_ADMIN=/var/opt/oracle;export TNS_ADMIN 
NLS_LANG=american; export NLS_LANG 
NLS_DATE_FORMAT='Mon DD YYYY HH24:MI:SS'; export NLS_DATE_FORMAT 
ORATAB=/var/opt/oracle/oratab;export ORATAB 
PATH=$PATH:$ORACLE_HOME:$ORACLE_HOME/bin:/usr/ccs/bin:/bin:/usr/bin:/usr/sbin:/sbin:/usr/openwin/bin:/opt/bin:.; export PATH 
DBALIST="tianlesoftware@vip.qq.com,tianlesoftware@hotmail.com";export DBALIST 

sqlplus -s '/ as sysdba' <
set feed off 
set heading off 
column OWNER format a10 
column OBJECT_NAME format a35 
column OBJECT_TYPE format a10 
column STATUS format a10 
spool invalid_object.alert 
SELECT OWNER, OBJECT_NAME, OBJECT_TYPE, STATUS FROM DBA_OBJECTS WHERE STATUS = 'INVALID' ORDER BY OWNER, OBJECT_TYPE, OBJECT_NAME; 
spool off 
exit 
EOF 
if [ `cat invalid_object.alert | wc -l` -gt 0 ] then 
mailx -s "INVALID OBJECTS for PPRD10" $DBALIST < invalid_object.alert 
fi 

$ more invalid_object.alert 

PUBLIC     ALL_WM_LOCKED_TABLES                SYNONYM    INVALID 
PUBLIC     ALL_WM_VERSIONED_TABLES             SYNONYM    INVALID 
PUBLIC     DBA_WM_VERSIONED_TABLES             SYNONYM    INVALID 
PUBLIC     SDO_CART_TEXT                       SYNONYM    INVALID 
PUBLIC     SDO_GEOMETRY                        SYNONYM    INVALID 
PUBLIC     SDO_REGAGGR                         SYNONYM    INVALID 
PUBLIC     SDO_REGAGGRSET                      SYNONYM    INVALID 
PUBLIC     SDO_REGION                          SYNONYM    INVALID 
PUBLIC     SDO_REGIONSET                       SYNONYM    INVALID 
PUBLIC     USER_WM_LOCKED_TABLES               SYNONYM    INVALID 
PUBLIC     USER_WM_VERSIONED_TABLES            SYNONYM    INVALID 
PUBLIC     WM_COMPRESS_BATCH_SIZES             SYNONYM    INVALID 

8. 監視使用者和事務(死鎖等) 
以下的指令碼在死鎖發生的時候傳送一個警告e-mail: 
################################################################### 
## deadlock_alert.sh ## 
################################################################### 
#!/bin/ksh 

EDITOR=vi; export EDITOR 
ORACLE_SID=PPRD10; export ORACLE_SID 
ORACLE_BASE=/data/app/oracle; export ORACLE_BASE 
ORACLE_HOME=$ORACLE_BASE/10.2.0; export ORACLE_HOME 
LD_LIBRARY_PATH=$ORACLE_HOME/lib; export LD_LIBRARY_PATH 
TNS_ADMIN=/var/opt/oracle;export TNS_ADMIN 
NLS_LANG=american; export NLS_LANG 
NLS_DATE_FORMAT='Mon DD YYYY HH24:MI:SS'; export NLS_DATE_FORMAT 
ORATAB=/var/opt/oracle/oratab;export ORATAB 
PATH=$PATH:$ORACLE_HOME:$ORACLE_HOME/bin:/usr/ccs/bin:/bin:/usr/bin:/usr/sbin:/sbin:/usr/openwin/bin:/opt/bin:.; export PATH 
DBALIST="tianlesoftware@vip.qq.com,tianlesoftware@hotmail.com";export DBALIST 

sqlplus -s '/ as sysdba' <
set feed off 
set heading off 
spool deadlock.alert 
SELECT SID, DECODE(BLOCK, 0, 'NO', 'YES' ) BLOCKER, 
DECODE(REQUEST, 0, 'NO','YES' ) WAITER 
FROM V/$LOCK 
WHERE REQUEST > 0 OR BLOCK > 0 
ORDER BY block DESC; 
spool off 
exit 
EOF 
if [ `cat deadlock.alert | wc -l` -gt 0 ] 
then 
mailx -s "DEADLOCK ALERT for PPRD10" $DBALIST < deadlock.alert 
fi 

四. 結論 
0,20,40 7-17 * * 1-5 /dba/scripts/ckinstance.sh > /dev/null 2>&1 
0,20,40 7-17 * * 1-5 /dba/scripts/cklsnr.sh > /dev/null 2>&1 
0,20,40 7-17 * * 1-5 /dba/scripts/ckalertlog.sh > /dev/null 2>&1 
30 * * * 0-6 /dba/scripts/clean_arch.sh > /dev/null 2>&1 
* 5 * * 1,3 /dba/scripts/analyze_table.sh > /dev/null 2>&1 
* 5 * * 0-6 /dba/scripts/ck_tbsp.sh > /dev/null 2>&1 
* 5 * * 0-6 /dba/scripts/invalid_object_alert.sh > /dev/null 2>&1 
0,20,40 7-17 * * 1-5 /dba/scripts/deadlock_alert.sh > /dev/null 2>&1 
透過以上的指令碼,可大大減輕你的工作。你可以使用這些是來做更重要的工作,例如效能調整。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28686045/viewspace-1561639/,如需轉載,請註明出處,否則將追究法律責任。

相關文章