【Mongo】使用killOp幹掉Long Running Operation

小亮520cl發表於2018-05-24

原文地址:

詳解:

  1. 詳解currentOp()

  2. gechongrepl:PRIMARY> db.currentOp()
  3. {
  4.     "inprog" : [
  5.         {
  6.             "opid" : 6222,
  7.             "active" : true,
  8.             "secs_running" : 3,
  9.             "microsecs_running" : NumberLong(3662328),
  10.             "op" : "getmore",
  11.             "ns" : "local.oplog.rs",
  12.             "query" : {
  13.                  
  14.             },
  15.             "client" : "192.168.91.132:45745",
  16.             "desc" : "conn5",
  17.             "threadId" : "0x7f1370cb4700",
  18.             "connectionId" : 5,
  19.             "waitingForLock" : false,
  20.             "numYields" : 0,
  21.             "lockStats" : {
  22.                 "timeLockedMicros" : {
  23.                     "r" : NumberLong(141),
  24.                     "w" : NumberLong(0)
  25.                 },
  26.                 "timeAcquiringMicros" : {
  27.                     "r" : NumberLong(16),
  28.                     "w" : NumberLong(0)
  29.                 }
  30.             }
  31.         }
  32.     ]
  33. }

  34.  
  35. "opid" : 6222,#程式號
  36. "active" : true,#是否活動狀態
  37. "secs_running" : 3,#操作執行了多少秒
  38. "microsecs_running" : NumberLong(3662328),
  39. "op" : "getmore",#操作型別,包括(insert/query/update/remove/getmore/command)
  40. "ns" : "local.oplog.rs",#名稱空間
  41. "query" : {},#如果op是查詢操作,這裡將顯示查詢內容;也有說這裡顯示具體的操作語句的

  42. "client" : "192.168.91.132:45745",#連線的客戶端資訊
  43. "desc" : "conn5",#資料庫的連線資訊
  44. "threadId" : "0x7f1370cb4700",#執行緒ID
  45. "connectionId" : 5,#資料庫的連線ID
  46. "waitingForLock" : false,#是否等待獲取鎖
  47. "numYields" : 0,
  48. "lockStats" : {
  49. "timeLockedMicros" : {#持有的鎖時間微秒
  50. "r" : NumberLong(141),#整個MongoDB例項的全域性讀鎖
  51. "w" : NumberLong(0)},#整個MongoDB例項的全域性寫鎖
  52. "timeAcquiringMicros" : {#為了獲得鎖,等待的微秒時間
  53. "r" : NumberLong(16),#整個MongoDB例項的全域性讀鎖
  54. "w" : NumberLong(0)}#整個MongoDB例項的全域性寫鎖


MongoDB提供了killOp請求,用於幹掉執行時間很長的請求,killOp通常需要與currentOp組合起來使用;先根據currentOp查詢到請求的opid,然後根據opid傳送killOp的請求。

currentOp

currentOp的使用,參考官方文件

currentOp會將後端Mongod上正在執行的請求都列出來,也可根據查詢條件(如請求型別,請求是否正在等待鎖,請求操作的DB或collection)來進行過濾。

例1:查詢所有正在等待鎖的寫操作

db.currentOp(
   {
     "waitingForLock" : true,
     $or: [
        { "op" : { "$in" : [ "insert", "update", "remove" ] } },
        { "query.findandmodify": { $exists: true } }
    ]
   }
) 

例2:查詢所有操作db1並且執行時間已超過3s的請求

db.currentOp(
   {
     "active" : true,
     "secs_running" : { "$gt" : 3 },
     "ns" : /^db1\./
   }
) 

currentOp的過濾條件包括

  1. 請求操作型別,insert、update、delete…
  2. 請求對應的connectionId,threadId
  3. 請求是否正在等待鎖
  4. 請求執行時間
  5. 請求操作的DB或collection
  6. 請求query的內容

killOp

currentOp的輸出結果裡,每個請求包含一個opid欄位,有了opid,就可以傳送killOp來幹掉對應的請求。

db.killOp(opid) 

要了解killOp的意義,需要先搞清楚幾個問題

客戶端到Monogd Server連線斷掉後,連線上執行的請求是否會立即結束?

比如你透過mongo shell,傳送了一個createIndex的請求,給某個包含1000w個文件的集合建立索引,這個請求會耗時很久,你想提前中止請求,Ctrl-C停掉了mongo shell,此時mongo shell到server的連線會關閉掉。

但後端createIndex的請求(MongoDB每個連線的請求由一個對應的執行緒來處理)不會立即結束,而是會一直執行下去,直到createIndex結束,給客戶端傳送應答時,發現連線已經關閉,然後執行緒才退出。

為了讓createIndex早點結束,你就需要killOp來幫忙,透過currentOp找到craeteIndex請求的opid,然後傳送killOp,createIndex會在下個『檢查點』就結束執行,整個執行緒退出。

傳送killOp後,請求是否會立即結束?

killOp的實現原理如下

每個連線對應的服務執行緒儲存了一個killPending的欄位,當傳送killOp時,會將該欄位置1;請求在執行過程中,可以透過不斷的呼叫OperationContext::checkForInterrupt()來檢查killPending是否被設定,如果被設定,則執行緒退出。



一個請求要支援killOp,必須在請求的處理邏輯里加上checkForInterrupt()檢查點才行,否則即使傳送了killOp,也只能等待請求完全處理完畢執行緒才會退出。

比如createIndex的處理邏輯裡包含了類似如下的程式碼,在createIndex的迴圈過程中,一旦killPending被置1了,createIndex的執行可以在當前迴圈結束時退出。

while (!createIndexFinished) {
    createIndexForOneElement();
    checkForInterupt();
} 

所以傳送killOp後,請求要執行到下一個『檢查點』執行緒才會退出,MongoDB在很多可能耗時長的請求中,都加入了checkForInterrupt()檢查點,如建立索引,repair database,mapreduce、aggregation等。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29096438/viewspace-2155067/,如需轉載,請註明出處,否則將追究法律責任。

相關文章