記一次公司倉庫資料庫伺服器死鎖過程
倉庫揀貨卡死,排查了資料庫的很多地方,都沒有頭緒,最後到SQL Server 錯誤日誌裡檢視,終於發現了蛛絲馬跡
EXEC xp_readerrorlog 0,1,NULL,NULL,'2015-09-21','2015-10-10','DESC'
waiter id=process5c30e08 mode=U requestType=wait waiter-list owner id=process5c26988 mode=X owner-list keylock hobtid=72057597785604096 dbid=33 objectname=stoxxx.dbo.Orderxxx indexname=IX_PricingExpressProductCode_State id=lock17fa96980 mode=X associatedObjectId=72057597785604096 waiter id=process5c26988 mode=U requestType=wait waiter-list owner id=process5c30e08 mode=X owner-list keylock hobtid=72057597785604096 dbid=33 objectname=stoxxx.dbo.Orderxxx indexname=IX_PricingExpressProductCode_State id=lock87d69e780 mode=X associatedObjectId=72057597785604096 resource-list(@OperateState money,@HandledByNewWms bit,@State int,@OrderOut int)UPDATE [Orderxx] SET [OperateState] = @OperateState,[HandledByNewWms] = @HandledByNewWms WHERE (([Orderxxx].[State] = @State) And ([Orderxxx].[OrderOut] = @OrderOut) And ([Orderxxx].[PricingExpressProductCode] IN ('UKNIR'))) inputbufunknown frame procname=unknown line=1 sqlhandle=0x000000000000000000000000000000000000000000000000UPDATE [Orderxxx] SET [OperateState] = @OperateState,[HandledByNewWms] = @HandledByNewWms WHERE (([Orderxxx].[State] = @State) And ([Orderxxx].[OrderOut] = @OrderOut) And ([Orderxxx].[PricingExpressProductCode] IN ('UKNIR'))) frame procname=adhoc line=1 stmtstart=134 sqlhandle=0x020000009d376d18a17e7ea51289d8caa2fb4de65c976389 executionStack process id=process5c30e08 taskpriority=0 logused=10320 waitresource=KEY: 33:72057597785604096 (112399c2054a) waittime=4813 ownerId=31578743038 transactionname=user_transaction lasttranstarted=2015-09-24T10:22:58.410 XDES=0x372e95950 lockMode=U schedulerid=17 kpid=8496 status=suspended spid=153 sbid=0 ecid=0 priority=0 trancount=2 lastbatchstarted=2015-09-24T10:22:58.540 lastbatchcompleted=2015-09-24T10:22:58.540 clientapp=.Net SqlClient Data Provider hostname=CK1-WIN-WEB02 hostpid=37992 loginname=ck1.biz isolationlevel=read committed (2) xactid=31578743038 currentdb=33 lockTimeout=4294967295 clientoption1=671088672 clientoption2=128056(@OperateState money,@HandledByNewWms bit,@State int,@OrderOut int)UPDATE [Orderxxx] SET [OperateState] = @OperateState,[HandledByNewWms] = @HandledByNewWms WHERE (([Orderxxx].[State] = @State) And ([Orderxxx].[OrderOut] = @OrderOut) And ([Orderxxx].[PricingExpressProductCode] IN ('UKNIR'))) inputbufunknown frame procname=unknown line=1 sqlhandle=0x000000000000000000000000000000000000000000000000UPDATE [Orderxxx] SET [OperateState] = @OperateState,[HandledByNewWms] = @HandledByNewWms WHERE (([Orderxxx].[State] = @State) And ([Orderxxx].[OrderOut] = @OrderOut) And ([Orderxxx].[PricingExpressProductCode] IN ('UKNIR'))) frame procname=adhoc line=1 stmtstart=134 sqlhandle=0x020000009d376d18a17e7ea51289d8caa2fb4de65c976389 executionStack process id=process5c26988 taskpriority=0 logused=9892 waitresource=KEY: 33:72057597785604096 (70f5b089bb2b) waittime=4813 ownerId=31579268946 transactionname=user_transaction lasttranstarted=2015-09-24T10:27:01.357 XDES=0x98312f950 lockMode=U schedulerid=16 kpid=9184 status=suspended spid=454 sbid=0 ecid=0 priority=0 trancount=2 lastbatchstarted=2015-09-24T10:27:01.490 lastbatchcompleted=2015-09-24T10:27:01.487 clientapp=.Net SqlClient Data Provider hostname=CK1-WIN-WEB02 hostpid=37992 loginname=ck1.biz isolationlevel=read committed (2) xactid=31579268946 currentdb=33 lockTimeout=4294967295 clientoption1=671088672 clientoption2=128056 process-list deadlock victim=process5c26988deadlock-list
咋一看上面的錯誤資訊,可以發現兩條相同的語句造成的死鎖,但是這麼短的語句不可能持有排他鎖太久
再仔細分析一下錯誤日誌,發現都死鎖在同一個非聚集索引上,再問了一下開發,開發那邊說,這條語句是在一個大事務裡面,這個事務會做7、8件事
索引屬性
還有索引裡面的資料,發現很多重複值
SQL語句是這樣的
(@OperateState money,@HandledByNewWms bit,@State int,@OrderOut int)@HandledByNewWms=(1) @OperateState=($1.0000) @OrderOut=(4055484) @State=(3) UPDATE [Orderxxx] SET [OperateState] = $1.0000,[HandledByNewWms] = 1WHERE (([Orderxxx].[State] = 3) And ([Orderxxx].[OrderOut] = 4055484) And ([Orderxxx].[PricingExpressProductCode] IN ('UKRRM','UKRLE')))
下圖為語句生成的執行計劃
當時的情況是大量SQL語句被阻塞,而阻塞的語句正是下面這條語句
UPDATE [Orderxxx] SET [OperateState] = $1.0000,[HandledByNewWms] = 1WHERE (([Orderxxx].[State] = 3) And ([Orderxxx].[OrderOut] = 4055484) And ([Orderxxx].[PricingExpressProductCode] IN ('UKRRM','UKRLE')))
解決方法
上面得出幾個症狀
1、update語句是在一個大事務裡面,事務太大導致其他session等待排他鎖的時間變長
2、大家都在使用同一個非聚集索引,並掃描PricingExpressProductCode欄位
3、索引裡的重複值很多
從上面的症狀基本可以判斷,這個非聚集索引無啥用,可以禁用之
ALTER INDEX [IX_PricingExpressProductCode_State] ON [dbo].[Orderxxx] DISABLE
禁用之後,死鎖消失,問題解決,倉庫的怨氣也隨之消失
這一次排查過程時間有點長,但是很好定位,SQL Server錯誤日誌給出了足夠的資訊定位死鎖問題,所以遇到問題的時候一定要分析清楚日誌
如有不對的地方,歡迎大家拍磚o(∩_∩)o
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/1817/viewspace-2812958/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 一次詭異的線上資料庫的死鎖問題排查過程資料庫
- 記錄一次 MySQL 死鎖排查過程MySql
- 即刻殺死資料庫鎖資料庫
- 解決Oracle資料庫死鎖Oracle資料庫
- 記一次開啟資料庫慢原因分析過程資料庫
- 資料庫的一次資料恢復過程資料庫資料恢復
- 一次Oracle資料庫恢復過程Oracle資料庫
- 記錄一次資料庫CPU被打滿的排查過程資料庫
- 記一次資料庫高CPU佔用率處理過程資料庫
- 【資料庫】資料庫儲存過程(一)資料庫儲存過程
- Oracle遷移資料庫過程記錄Oracle資料庫
- ORACLE 死鎖分析過程Oracle
- 一次資料庫異常的處理過程資料庫
- 一次資料庫硬解析的分析全過程資料庫
- 一次客戶資料庫恢復的過程資料庫
- 資料庫死鎖排查思路分享(糾正篇)資料庫
- 殺死所有的指定資料庫的程式的儲存過程資料庫儲存過程
- 記一次排查線上MySQL死鎖過程,不能只會curd,還要知道加鎖原理MySql
- 伺服器斷電Oracle資料庫修復資料過程伺服器Oracle資料庫
- 一次使用duplicate建立測試資料庫的過程資料庫
- 一次客戶資料庫恢復的過程 [轉]資料庫
- 資料庫恢復過程資料庫
- 資料庫啟動過程資料庫
- 資料庫儲存過程資料庫儲存過程
- 金倉資料庫KingbaseES儲存過程 RETURN語句資料庫儲存過程
- 資料庫已死資料庫
- 關於資料庫死鎖問題的解釋資料庫
- 記一次線上mysql死鎖MySql
- 一次客戶資料庫CPU 100%處理過程資料庫
- 資料湖 vs 倉庫 vs 資料庫資料庫
- (資料庫十)資料庫中的鎖機制以及死鎖產生的原因及解決辦法資料庫
- MySql資料庫——儲存過程MySql資料庫儲存過程
- 手動建立資料庫過程資料庫
- Oracle資料庫啟動過程Oracle資料庫
- DUL恢復資料庫過程資料庫
- standby 資料庫的建立過程資料庫
- 資料庫的連線過程資料庫
- 豈止刪庫,程式設計師鎖死伺服器,遊戲公司解散虧 600 萬程式設計師伺服器遊戲