Oracle之等待事件log file sync + log file parallel write (awr優化)

張衝andy發表於2017-09-10

原文網址 : http://blog.itpub.net/31383567/viewspace-2144750/

Oracle事件Parallel優化

這是3月份某客戶的情況，原因是server硬體故障後進行更換之後，業務翻譯偶爾出現提交緩慢的情況。我們先來看下awr的情況。

我們能夠看到，該系統的load profile資訊事實上並不高，每秒才21個transaction。先來看看top5events：

從top 5event，我們能夠發現，log file sync的avg wait很之高，高達124ms。大家應該知道，對於絕大多數情況

下，log file sync的平均等待時間是小於5ms的，這個值有點高的離譜。

我們知道，產生log file sync等待的原因有非常多。關於log file sync，tanel Poder大神寫過一篇非常牛的pdf，大家能夠參考下。

這裡我主要引用大神的圖，來簡單描寫敘述產生log file sync的原因可能有哪些，首先我們來看下從前端程式提交到最後得到反饋時，以及中間處理的整個流程情況：

從上圖中，我們能夠清楚的看到整個流程。這裡能夠進行簡單的描寫敘述：

1、當user發起一個commit後；

2、前端程式（即Server 程式）會post一個資訊給lgwr程式，告訴它，你應該去寫redo buffer了。

3、當LGWR程式得到指示後，開始呼叫作業系統函式進行物理寫，在進行物理寫的這段時間內，會出現

log file parallel write等待。這裡也許有人會有疑問，為什麼12c之前僅僅有一個lgwr程式，這裡卻是parallel

write呢？這裡須要說明一下，lgwr程式在將redo buffer中的資料寫出到log file檔案裡時，也是以batch方式

程式的（實際上，dbwN程式也是batch的模式），有相關的隱含引數控制。

4、當LGWR完畢wrtie操作之後，LGWR程式會返回一個資訊給前端程式（Server程式），告訴它，我已經寫完了，

你能夠完畢提交了。

5. user 完畢commit操作。

這裡補充一下，這是因為Oracle 日誌寫優先的原則，如果在commit之前redo buffer的相關entry資訊不馬上寫到redo

log file中，那麼假設資料庫出現crash，那麼這是會丟資料的。

從上面的流程圖，我們事實上也能夠看到，log file sync和log file parallel write能夠說是相互關聯的。換句話講，假設log file parallel write的時間非常長，那麼必定導致log file sync等待時間拉長。

我們如果log file parallel write 等待非常高，那麼著可能一般是物理磁碟IO的問題，例如以下：

我們從上圖能夠發行，假設LGWR程式在完畢IO操作的過程中時間過長，那麼將導致log file parallel write等待升高。

實際上，在整個當使用者發出commit到完畢commit的過程中，涉及到非常多環節，並非只唯獨物理IO會影響log file sync/log file parallel write。還有CPU也會影響Log file sync和log file parallel write。我們再來看個圖：

我們能夠看到，上述流程中的4個環節都涉及到CPU的排程，假設在整個事務commit的過程中，系統CPU出現極度緊張，那麼這可能會導致LGWR程式無法獲得CPU，會進行排隊等待，顯然，這勢必將導致log file sync或log file parallel write等待

的升高。

備註：Oracle中還能夠通過隱含引數_high_priority_processes 來控制程式獲取CPU的優先順序。在一個cpu相對缺乏的系統中，能夠通過設定該引數來進行緩解。

最後我們再回到這個案例中來，客戶這裡的環境，我們是能夠排除CPU問題。那麼最大的嫌疑可能就是儲存本身的問題，導致IO非常慢，然而，實際上這也是能夠排除的，大家事實上應該注意到前面的Top 5 event了，log file parallel write的平均等待

時間並不高，假設是儲存IO問題，那麼這個event的平均等待時間應該是比較高才對。

我們能夠看到log file sync和log file parallel write的waits都是差點兒相同的。可是log file parallel write的avg wait time只唯獨4ms，這是一個正常的值。也就是說能夠我們排除儲存IO問題。

那麼問題是什麼呢？我們利用Oracle MOS提供的指令碼來查詢下log file sync和log file parallel write等待的分佈情況：（實時檢視）

		
								   INST_ID EVENT                                    WAIT_TIME_MILLI WAIT_COUNT
							
								---------- ---------------------------------------- --------------- ----------
							
								         1 log file sync                                          1     259306
							
								         1 log file sync                                          2    2948999
							
								         1 log file sync                                          4    1865918
							
								         1 log file sync                                          8     173699
							
								         1 log file sync                                         16      43194
							
								         1 log file sync                                         32       6095
							
								         1 log file sync                                         64       1717
							
								         1 log file sync                                        128       2458
							
								          1 log file sync                                        256       5180
							
								          1 log file sync                                        512       9140
							
								          1 log file sync                                       1024     558347
							
								          1 log file parallel write                                1       5262
							
								          1 log file parallel write                                2    4502377
							
								          1 log file parallel write                                4    1319211
							
								          1 log file parallel write                                8      46055
							
								          1 log file parallel write                               16      23694
							
								          1 log file parallel write                               32       3149
							
								          1 log file parallel write                               64        283
							
								          1 log file parallel write                              128        267
							
								          1 log file parallel write                              256        157
							
								          1 log file parallel write                              512         73
							
								          1 log file parallel write                             1024         42
							
								          1 log file parallel write                             2048         39
							
								          1 log file parallel write                             4096        103
							
								          1 log file parallel write                             8192         21
							
								          1 log file parallel write                            16384         22
							
								          1 log file parallel write                            32768        190
							
								          1 log file parallel write                            65536          1

大家能夠簡單的計算一下，事實上log file sync和log file parallel write 等待事件，差點兒99%左右的平均等待時間都是

小於等於4ms的，這是屬於正常的情況；然而有少數的情況其等待時間是非常長的，比如log file sync最高的單次等待

時間高達1秒，因為偶爾的等待非常高，因此將整個log file sync的平均等待時間拉高了。

到最後，問題就比較清楚了，我覺得這是因為主機和儲存之間的鏈路可能出現異常或不穩定導致。暫時的解決方法

將redo logfile 挪到本地磁碟，攻克了該問題。

後記：經客戶後面確認，確實是儲存光纖線介面鬆了。

source : http://www.cnblogs.com/hrhguanli/p/3891951.html

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31383567/viewspace-2144750/，如需轉載，請註明出處，否則將追究法律責任。

【TUNE_ORACLE】等待事件之日誌等待“log file parallel write”
2021-07-28
Oracle事件Parallel
log file sync等待事件
2018-11-06
事件
【等待事件】log file sync
2021-01-01
事件
【TUNE_ORACLE】等待事件之日誌等待“log file sync”
2021-07-16
Oracle事件
【TUNE_ORACLE】等待事件之IO等待“db file parallel write”
2021-04-30
Oracle事件Parallel
【WAIT】 log file sync等待事件說明
2021-12-09
AI事件
log file sync等待事件處理思路
2022-10-11
事件
[20201204]關於等待事件Log File Sync.txt
2020-12-04
事件
I/O上的等待事件 —— control file sequential read/control file parallel write
2018-04-09
事件Parallel
Oracle資料庫由dataguard備庫引起的log file sync等待
2020-11-26
Oracle資料庫
一個os thread startup、log file sync等待的故障回顧
2018-10-31
thread
0316理解db file parallel read等待事件
2018-03-19
Parallel事件
LOG FILE SYNC概述（第五篇）
2018-04-23
LOG FILE SYNC概述（第四篇）
2018-04-22
0322理解db file parallel read等待事件2
2018-03-23
Parallel事件
【ASK_ORACLE】Linux從6升級到7導致Oracle產生大量Log file sync等待事件處理辦法
2022-07-21
OracleLinux事件
LOG FILE SYNC概述（第一篇）
2018-04-17
log file switch
2018-05-30
Script to Collect Log File Sync Diagnostic Information (lfsdiag.sql)
2020-01-20
ORMSQL
redo log file 最佳化
2018-06-20
【TUNE_ORACLE】等待事件之IO等待“db file scattered read”
2021-04-22
Oracle事件
【TUNE_ORACLE】等待事件之IO等待“db file sequential read”
2021-04-29
Oracle事件
[20210315]理解db file parallel read等待事件3.txt
2021-03-15
Parallel事件
[20210315]理解db file parallel read等待事件4.txt
2021-03-15
Parallel事件
Oracle RAC+DG 調整redo/standby log file
2021-02-23
Oracle
【TUNE_ORACLE】等待事件之IO等待“direct path write”
2021-05-18
Oracle事件
db file scattered read等待事件
2018-11-08
事件
db file sequential read等待事件
2018-11-07
事件
【等待事件】db file sequential read
2021-01-12
事件
【等待事件】db file scattered read
2021-01-12
事件
【TUNE_ORACLE】等待事件之IO等待“direct path write temp”
2021-05-21
Oracle事件
How to Dump Redo Log File Information --metalink
2019-06-27
ORM
關於log file switch and checkpoint機制
2021-10-08
ssserver -c /etc/shadowsocks.json --log-file /var/log/shadowsocks.log -d start啟動失敗
2018-12-24
ServerJSON
如何選擇配置 MySQL innodb_log_file_size
2024-05-04
MySql
[20211013]Oracle 19c新特性Listener自動清理(Network Log File Segmentation).txt
2021-10-13
OracleSegmentation
等待事件db file sequential read、db file scattered read和direct read的區別
2020-04-28
事件
log_archive_dest與log_archive_dest_n與USE_DB_RECOVERY_FILE_DEST
2021-11-04
Hive
Resource is out of sync with the file system
2018-10-15

Oracle之 等待事件log file sync + log file parallel write (awr優化)

相關文章

Oracle之等待事件log file sync + log file parallel write (awr優化)