前言
在 Java 的併發程式設計中,有一個問題需要特別注意,那就是死鎖,如果發生了死鎖,基本就是重啟,而重啟將會丟失執行中的資料。所以,瞭解死鎖的形成並排查死鎖到預防死鎖成了一個重要的問題。
我們瞭解任何一個事情的步驟是:what,how,why,why not。
1. 什麼是死鎖?
我們還是直接寫一段程式碼來看看:
package hello;
public class DeadLock {
public static void main(String[] args) {
new Thread(() -> {
try {
new DeadLock().resource1();
} catch (InterruptedException e) {
}
}
).start();
new Thread(() -> {
try {
new DeadLock().resource2();
} catch (InterruptedException e) {
}
}
).start();
}
void resource1() throws InterruptedException {
synchronized ("resource1") {
System.out.println("獲取資源1");
// 等待 1 秒讓另一個執行緒拿到鎖
Thread.sleep(1000);
resource2();
}
}
void resource2() throws InterruptedException {
synchronized ("resource2") {
System.out.println("獲取資源2");
// 等待 1 秒讓另一個執行緒拿到鎖
Thread.sleep(1000);
resource1();
}
}
}
複製程式碼
上面的程式碼中,我們啟用了兩個執行緒,分別搶佔2個資源,但這兩個資源又分別被不同的物件(字串)鎖住了。當第一個執行緒呼叫 resource1 方法,進入同步塊,拿到鎖,並等待 1 秒鐘讓另一個執行緒進入 resource2 同步塊,當第二個執行緒進入同步塊後,注意:此時, 拿著 resourec1 鎖的執行緒企圖拿到 resource2 的鎖,但這個時候,拿著 resource2 的執行緒也想去拿 resource1 的鎖。於是就出現了互相僵持的情況,誰也無法拿到對方的鎖,整個系統就卡死了。
這種情況就是死鎖。
像我們現在寫的程式碼是自己故意造出來的死鎖,我們能夠發現,那如果是線上環境怎麼辦,假如我們的系統卡死了,我們怎麼知道到底是哪一段程式碼出現了問題,有沒有可能使死鎖的問題。也就是如何檢測死鎖。
2. 如何檢測死鎖?
由於死鎖極難通過人工的方式查出來,因此JDK 提供了命令來檢測某個java程式中心執行緒的情況,並排查有沒有死鎖。上面命令呢? jps , 用來檢視java 程式的程式號,當然在 Linux 中也可以通過別的方式獲取, jstack 程式號
命令則可以答應對應程式的棧資訊,並找到死鎖。
我們就剛剛的程式,在 windows 上使用該命令。
C:Usersstateis0>jps
11060
2084 Launcher
10712 RemoteMavenServer
18040 Jps
11820 DeadLock
C:Usersstateis0>jstack 11820
2017-12-29 18:52:38
Full thread dump Java HotSpot(TM) Client VM (25.131-b11 mixed mode):
"DestroyJavaVM" #11 prio=5 os_prio=0 tid=0x051fe800 nid=0x1e0c waiting on condition [0x00000000]
java.lang.Thread.State: RUNNABLE
"Thread-1" #10 prio=5 os_prio=0 tid=0x18777800 nid=0x5664 waiting for monitor entry [0x18e0f000]
java.lang.Thread.State: BLOCKED (on object monitor)
at hello.DeadLock.resource1(DeadLock.java:31)
- waiting to lock <0x07415a50> (a java.lang.String)
at hello.DeadLock.resource2(DeadLock.java:43)
- locked <0x0742bd18> (a java.lang.String)
at hello.DeadLock.lambda$main$1(DeadLock.java:20)
at hello.DeadLock$$Lambda$2/4983748.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
"Thread-0" #9 prio=5 os_prio=0 tid=0x18776c00 nid=0x4dc4 waiting for monitor entry [0x18d7f000]
java.lang.Thread.State: BLOCKED (on object monitor)
at hello.DeadLock.resource2(DeadLock.java:41)
- waiting to lock <0x0742bd18> (a java.lang.String)
at hello.DeadLock.resource1(DeadLock.java:33)
- locked <0x07415a50> (a java.lang.String)
at hello.DeadLock.lambda$main$0(DeadLock.java:11)
at hello.DeadLock$$Lambda$1/5592464.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
"Service Thread" #8 daemon prio=9 os_prio=0 tid=0x186e4c00 nid=0x172c runnable [0x00000000]
java.lang.Thread.State: RUNNABLE
"C1 CompilerThread0" #7 daemon prio=9 os_prio=2 tid=0x186af000 nid=0x53f8 waiting on condition [0x00000000]
java.lang.Thread.State: RUNNABLE
"Monitor Ctrl-Break" #6 daemon prio=5 os_prio=0 tid=0x1861e800 nid=0x3928 runnable [0x18b3f000]
java.lang.Thread.State: RUNNABLE
at java.net.SocketInputStream.socketRead0(Native Method)
at java.net.SocketInputStream.socketRead(SocketInputStream.java:116)
at java.net.SocketInputStream.read(SocketInputStream.java:171)
at java.net.SocketInputStream.read(SocketInputStream.java:141)
at sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:284)
at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:326)
at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:178)
- locked <0x07861da0> (a java.io.InputStreamReader)
at java.io.InputStreamReader.read(InputStreamReader.java:184)
at java.io.BufferedReader.fill(BufferedReader.java:161)
at java.io.BufferedReader.readLine(BufferedReader.java:324)
- locked <0x07861da0> (a java.io.InputStreamReader)
at java.io.BufferedReader.readLine(BufferedReader.java:389)
at com.intellij.rt.execution.application.AppMainV2$1.run(AppMainV2.java:64)
"Attach Listener" #5 daemon prio=5 os_prio=2 tid=0x179c0800 nid=0x40a0 waiting on condition [0x00000000]
java.lang.Thread.State: RUNNABLE
"Signal Dispatcher" #4 daemon prio=9 os_prio=2 tid=0x17985c00 nid=0x5004 runnable [0x00000000]
java.lang.Thread.State: RUNNABLE
"Finalizer" #3 daemon prio=8 os_prio=1 tid=0x17972400 nid=0x41a8 in Object.wait() [0x17cff000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x0ca1b830> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:143)
- locked <0x0ca1b830> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:164)
at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:209)
"Reference Handler" #2 daemon prio=10 os_prio=2 tid=0x17960000 nid=0x4ef0 in Object.wait() [0x17c6f000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x0ca1b9d0> (a java.lang.ref.Reference$Lock)
at java.lang.Object.wait(Object.java:502)
at java.lang.ref.Reference.tryHandlePending(Reference.java:191)
- locked <0x0ca1b9d0> (a java.lang.ref.Reference$Lock)
at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:153)
"VM Thread" os_prio=2 tid=0x1795a800 nid=0x3f54 runnable
"VM Periodic Task Thread" os_prio=2 tid=0x18739400 nid=0x4a14 waiting on condition
JNI global references: 229
// 找到一個死鎖
Found one Java-level deadlock:
=============================
"Thread-1":
waiting to lock monitor 0x17978de4 (object 0x07415a50, a java.lang.String),
which is held by "Thread-0"
"Thread-0":
waiting to lock monitor 0x1797a974 (object 0x0742bd18, a java.lang.String),
which is held by "Thread-1"
Java stack information for the threads listed above:
===================================================
"Thread-1":
at hello.DeadLock.resource1(DeadLock.java:31)
// 等待 0x07415a50 鎖
- waiting to lock <0x07415a50> (a java.lang.String)
at hello.DeadLock.resource2(DeadLock.java:43)
// 持有 0x0742bd18
- locked <0x0742bd18> (a java.lang.String)
at hello.DeadLock.lambda$main$1(DeadLock.java:20)
at hello.DeadLock$$Lambda$2/4983748.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
"Thread-0":
at hello.DeadLock.resource2(DeadLock.java:41)
// 等待 0x0742bd18 鎖
- waiting to lock <0x0742bd18> (a java.lang.String)
at hello.DeadLock.resource1(DeadLock.java:33)
// 持有 0x07415a50
- locked <0x07415a50> (a java.lang.String)
at hello.DeadLock.lambda$main$0(DeadLock.java:11)
at hello.DeadLock$$Lambda$1/5592464.run(Unknown Source)
at java.lang.Thread.run(Thread.java:748)
// 發現了一個死鎖
Found 1 deadlock.
C:Usersstateis0>
複製程式碼
Thread-1 waiting to lock <0x07415a50> locked <0x0742bd18>
Thread-0 waiting to lock <0x0742bd18> locked <0x07415a50>
我們首先使用 jps 命令找到 java 程式號,然後使用 jstack 程式號
列印程式棧的資訊,其中,在最後的部分,jstack 告訴我們,他找到了一個死鎖,其中又詳細的資訊:Thread-1 執行緒(這裡我們沒有給執行緒其合適的名字,如果線上上,給執行緒起一個合適的名字將更有利於排查)持有 String 型別的編號為 0x07415a50 的鎖,等待編號為 0x07415a50 的鎖 , 但這個鎖由 Thread-0 持有,於此同時,Thread-0 和 Thread-1 相反。Thread-0 執行緒持有 0x07415a50 的鎖,等待 0x07415a50 的鎖。我們的註釋裡也寫上了。
那麼發生了死鎖,該怎麼辦呢?最簡單的辦法就是重啟,重啟之後,對 jstack 中列印的堆疊資訊中的程式碼進行修改。重新發布。當然還有一些高階策略,比如讓程式回滾到死鎖前的狀態,然後讓他們順序進入同步塊。
3. 死鎖有哪些形成的原因
一般來說,要出現死鎖問題需要滿足以下條件:
-
互斥條件:一個資源每次只能被一個執行緒使用。
-
請求與保持條件:一個程式因請求資源而阻塞時,對已獲得的資源保持不放。
-
不剝奪條件:程式已獲得的資源,在未使用完之前,不能強行剝奪。
-
迴圈等待條件:若干程式之間形成一種頭尾相接的迴圈等待資源關係。
死鎖是由四個必要條件導致的,所以一般來說,只要破壞這四個必要條件中的一個條件,死鎖情況就應該不會發生。
如果想要打破互斥條件,我們需要允許程式同時訪問某些資源,這種方法受制於實際場景,不太容易實現條件;
打破不可搶佔條件,這樣需要允許程式強行從佔有者那裡奪取某些資源,或者簡單一點理解,佔有資源的程式不能再申請佔有其他資源,必須釋放手上的資源之後才能發起申請,這個其實也很難找到適用場景;
程式在執行前申請得到所有的資源,否則該程式不能進入準備執行狀態。這個方法看似有點用處,但是它的缺點是可能導致資源利用率和程式併發性降低;
避免出現資源申請環路,即對資源事先分類編號,按號分配。這種方式可以有效提高資源的利用率和系統吞吐量,但是增加了系統開銷,增大了程式對資源的佔用時間。
4 總結
併發程式設計中的坑很多,尤其死鎖,造成的問題基本只能靠重啟來解決,如果遇到了資料儲存在記憶體中但沒有持久化的話,那麼重啟將出現很大的問題。因此我們在用鎖的時候,一定要小心。避免出現死鎖,如果出現了死鎖,則可以使用 jstack 命令檢視執行緒是否有死鎖。用以排查問題。
總之併發的坑很多,樓主以後將會多多分析。
good luck !!!!