[zt]當資料庫變慢時,我們應如何入手

tolywang發表於2008-11-14

第一章 檢查系統的狀態
1.1 使用sar來檢查作業系統是否存在IO問題
1.2 關注記憶體vmstat
1.3 找到使用資源特別大的Oracle的session及其執行的語句
1.4 查詢前十條效能差的sql語句

[@more@]第二章 檢查會話狀態


當資料庫變慢時,我們應如何入手


當應用管理員通告現在應用很慢、資料庫很慢時,當Oracle DBA在資料庫上做幾個示例的Select也發現同樣的問題時,有些時侯就會無從下手,因為DBA認為資料庫的各種命種率都是滿足Oracle文件的建議。實際上如今的最佳化己經向最佳化等待(waits)轉型了,實際中效能最佳化最根本的出現點也都集中在I/O,這是影響效能最主要的方面,由系統中的等待去發現Oracle庫中的不足、作業系統某些資源利用的不合理是一個比較好的辦法。下面把一些實踐經驗與大家分享,本文測重於Unix環境。

第一章 檢查系統的狀態
透過作業系統的一些工具檢查系統的狀態,比如CPU、記憶體、交換、磁碟的利用率,根據經驗或與系統正常時的狀態相比對,有時系統表面上看起來看空閒,這也可能不是一個正常的狀態,因為cpu可能正等待IO的完成。除此之外,還應觀注那些佔用系統資源(cpu、記憶體)的程式。

1.1 使用sar來檢查作業系統是否存在IO問題
#sar -u 2 10 -- 即每隔2秒檢察一次,共執行20次。
結果示例:
注:在redhat下,%system就是所謂的%wio。
Linux 2.4.21-20.ELsmp (YY075) 05/19/2005
10:36:07 AM CPU %user %nice %system %idle
10:36:09 AM all 0.00 0.00 0.13 99.87
10:36:11 AM all 0.00 0.00 0.00 100.00
10:36:13 AM all 0.25 0.00 0.25 99.49
10:36:15 AM all 0.13 0.00 0.13 99.75
10:36:17 AM all 0.00 0.00 0.00 100.00
其中:
Ø %usr指的是使用者程式使用的cpu資源的百分比;
Ø %sys指的是系統資源使用cpu資源的百分比;
Ø %wio指的是等待io完成的百分比,這是值得觀注的一項;
Ø %idle即空閒的百分比。
如果wio列的值很大,如在35%以上,說明系統的IO存在瓶頸,CPU花費了很大的時間去等待I/O的完成。Idle很小說明系統CPU很忙。像以上的示例,可以看到wio平均值為11,說明I/O沒什麼特別的問題,而idle值為零,說明cpu已經滿負荷執行了。
當系統存在IO問題時,可以從以下幾個方面解決:
Ø 聯絡相應的作業系統的技術支援對這方面進行最佳化,比如hp-ux在劃定卷組時的條帶化等方面。
Ø 查詢Oracle中不合理的sql語句,對其進行最佳化;
Ø 對Oracle中訪問量頻繁的表除合理建索引外,再就是把這些表分表空間存放以免訪問上產生熱點,再有就是對錶合理分割槽。

1.2 關注記憶體
常用的工具便是vmstat,對於hp-unix來說,可以用glance。Aix來說可以用topas。當發現vmstat中pi列非零,memory中的free列的值很小,glance、topas中記憶體的利用率多於80%時,這時說明記憶體方面應該調節一下。方法大體有以下幾項:
Ø 劃給Oracle使用的記憶體不要超過系統記憶體的1/2,一般保在系統記憶體的40%為益。
Ø 為系統增加記憶體;
Ø 如果你的連線特別多,可以使用MTS的方式;
Ø 打全補丁,防止記憶體漏洞。

1.3 找到使用資源特別大的Oracle的session及其執行的語句
Hp-unix可以用glance或top。IBM AIX可以用topas。此外可以使用ps的命令。
透過這些程式可以找到點用系統資源特別大的這些程式的程式號,就可以透過以下的sql語句發現這個pid正在執行哪個sql,這個sql最好在pl/sql developer、toad等軟體中執行:
SELECT a.username, a.machine, a.program, a.sid, a.serial#, a.status,
c.piece, c.sql_text
FROM v$session a, v$process b, v$sqltext c
WHERE b.spid = 'ORCL'
AND b.addr = a.paddr
AND a.sql_address = c.address(+)
ORDER BY c.piece;
可以把得到的這個sql分析一下,看一下它的執行計劃是否走索引。對其最佳化避免全表掃描,以減少IO等待,從而加快語句的執行速度。
提示:在做最佳化sql時,經常碰到使用in的語句,這時一定要用exists把它給換掉,因為Oracle在處理In時是按Or的方式做的,即使使用了索引也會很慢。比如:
SELECT col1, col2, col3 FROM table1 a
WHERE a.col1 NOT IN (SELECT col1 FROM table2)

可以換成:
SELECT col1, col2, col3 FROM table1 a
WHERE NOT EXISTS
(SELECT 'x' FROM table2 b WHERE a.col1=b.col1)

1.4 查詢前十條效能差的sql語句
SELECT * FROM (SELECT parsing_user_id, executions, sorts, command_type,
disk_reads, sql_text FROM v$sqlarea
ORDER BY disk_reads DESC)
WHERE ROWNUM<10;
第二章 檢查會話狀態
要快速發現Oracle Server的效能問題的原因,可以求助於v$session_wait檢視,看系統的這些session在等什麼,使用了多少的IO。以下是參考指令碼:
-- 指令碼說明:檢視佔I/O較大的正在執行的session:
SELECT se.sid, se.serial#, pr.spid, se.username, se.status, se.terminal,
se.program, se.module, se.sql_address, st.event, st.p1text,
si.physical_reads, si.block_changes
FROM v$session se, v$session_wait st, v$sess_io si, v$process pr
WHERE st.sid=se.sid AND st.sid=si.sid
AND se.PADDR=pr.ADDR
AND se.sid>6
AND st.wait_time=0
AND st.event NOT LIKE '%SQL%'
ORDER BY physical_reads DESC;

對檢索出的結果的幾點說明:
1. 以上是按每個正在等待的session已經發生的物理讀排的序,因為它與實際的I/O相關。
2. 可以看一下這些等待的程式都在忙什麼,語句是否合理?
SELECT sql_address FROM v$session WHERE sid=;
SELECT * FROM v$sqltext WHERE address=;
執行以上兩個語句便可以得到這個session的語句。
也以用alter system kill session 'sid, serial#';把這個session殺掉。
3. 應觀注一下event列,這是調優的關鍵一列,下面對常出現的event做以簡要的說明:
1) buffer busy waits,free buffer waits這兩個引數所標識是dbwr是否夠用的問題,與IO很大相關的,當v$session_wait中的free buffer wait的條目很小或沒有時,說明系統的dbwr程式決對夠用,不用調整;free buffer wait的條目很多,系統感覺起來一定很慢,這時說明dbwr已經不夠用了,它產生的wio已經成為資料庫效能的瓶頸,這時的解決辦法如下:
Ø 增加寫程式,同時要調整db_block_lru_latches引數:
示例:修改或新增如下兩個引數
db_writer_processes=4
db_block_lru_latches=8
Ø 開非同步IO。IBM這方面簡單得多,hp則麻煩一些,可以與Hp工程師聯絡。
2) db file sequential read,指的是順序讀,即全表掃描,這也是應儘量減少的部分,解決方法就是使用索引、sql調優,同時可以增大db_file_multiblock_read_count這個引數。
3) db file scattered read引數指的是透過索引來讀取,同樣可以透過增加db_file_multiblock_read_count這個引數來提高效能。
4) latch free與栓相關,需要專門調節。
5) 其他引數可以不特別觀注。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/35489/viewspace-1013379/,如需轉載,請註明出處,否則將追究法律責任。

相關文章