Oracle中的死鎖Dead Lock(二)

路途中的人2012發表於2018-01-08

Oracle死鎖監控和解決

 

在前文中提到,死鎖問題解決方法分為死鎖監控和死鎖處理。所謂死鎖監控就是發現死鎖。Oracle中,透過鎖之間的連線關係,有自動的監控死鎖、解決死鎖的機制。但是實際中,特別是開發測試過程中,還是可能出現死鎖的情況。下面是一些網路上推薦的指令碼,可以發現和解決死鎖。

 

1、  發現鎖物件和對應的SID

//發現鎖定

SELECT s.username, l.OBJECT_ID, l.SESSION_ID, s.SERIAL#, l.ORACLE_USERNAME, l.OS_USER_NAME, l.PROCESS FROM V$LOCKED_OBJECT l,V$SESSION S WHERE l.SESSION_ID=S.SID;

 

2、  解決方法——kill掉指定的session

 

alter system kill session sid,serial#;  (其中sid=l.session_id

 

killsession,也可以在EM中進行,使用圖形化介面。

 

3、  解決方法——kill掉指定的process

 

透過sid找到對應service程式的id資訊,透過作業系統級別進行kill

 

select pro.spid from v$session ses,v$process pro where ses.sid=XX and ses.paddr=pro.addr; 

 其中sid用死鎖的sid替換。

exit

ps -ef|grep spid

 

其中spid是這個程式的程式號,kill掉這個Oracle程式。

 

OS層面kill程式的情況很多,比如使用dbms_job呼叫的session,大部分時候都需要在OS層面kill掉。

 

 

Oracle死鎖與應用設計

 

一般情況下,應用程式對資料庫的操作基本上是瞬時的(除非需要Tunning)。只有涉及到批次事務操作的時候,才會出現長時間對一個物件的獨佔。一旦這種情況出現,所獨佔的物件又是為其他會話(批次操作)所請求,就有可能出現死鎖。

 

長時間的批次事務一般都組織在系統專門的作業管理器中,根據特定的排程規則進行執行。為了提高效率,作業管理器通常使用多執行緒技術,同時多個執行緒執行多個任務,這種情況下,出現死鎖的機率也有大大提升。在這個問題上,筆者有如下想法:

 

1、  按照模組劃分執行緒,模組內作業順序執行,模組間並行。一般來說,一個模組的作業之間,會出現比較嚴重的資源請求共享,比如對同一個表中同一批資料的操作。這樣很容易出現死鎖狀態。無論是手工解鎖、還是藉助Oracle自身機制解鎖,都至少引起一個作業的回滾。所以,根據模組進行劃分,相同模組的作業儘可能順序執行,減少表資料之間共用。不同模組之間的作業,操作更新的表範圍差別比較大,所以不同業務模組之間作業進行並行。

2、  作業中顯示進行錯誤00060的處理。在作業的開發中,要加入對於00060死鎖錯誤的處理,如果接受到了該錯誤異常,要主動從應用層面進行操作回滾,接觸其他作業阻塞情況。

3、  藉助Oracle自身鎖機制,監控長時間鎖住物件和會話狀況,儘快通知DBA手工解決死鎖。

 

 

綜上所述:死鎖在Oracle中是一種比較少見的情況,而且自身有相應的監控防護機制。作為應用開發者的我們,也要儘可能的合理化應用處理結構,儘可能不要顯示的鎖定物件和設計不合理的並行操作,加大出現死鎖的機率。

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29067253/viewspace-2149854/,如需轉載,請註明出處,否則將追究法律責任。

相關文章