Java中的ReentrantLock和synchronized兩種鎖定機制的對比

Mindy_Lou發表於2016-10-13

原文:http://www.ibm.com/developerworks/cn/java/j-jtp10264/index.html

多執行緒和併發性並不是什麼新內容,但是 Java 語言設計中的創新之一就是,它是第一個直接把跨平臺執行緒模型和正規的記憶體模型整合到語言中的主流語言。核心類庫包含一個 Thread 類,可以用它來構建、啟動和操縱執行緒,Java 語言包括了跨執行緒傳達併發性約束的構造 —— synchronized 和 volatile 。在簡化與平臺無關的併發類的開發的同時,它決沒有使併發類的編寫工作變得更繁瑣,只是使它變得更容易了。

synchronized 快速回顧

把程式碼塊宣告為 synchronized,有兩個重要後果,通常是指該程式碼具有 原子性(atomicity)和 可見性(visibility)。原子性意味著一個執行緒一次只能執行由一個指定監控物件(lock)保護的程式碼,從而防止多個執行緒在更新共享狀態時相互衝突。可見性則更為微妙;它要對付記憶體快取和編譯器優化的各種反常行為。一般來說,執行緒以某種不必讓其他執行緒立即可以看到的方式(不管這些執行緒在暫存器中、在處理器特定的快取中,還是通過指令重排或者其他編譯器優化),不受快取變數值的約束,但是如果開發人員使用了同步,如下面的程式碼所示,那麼執行庫將確保某一執行緒對變數所做的更新先於對現有synchronized 塊所進行的更新,當進入由同一監控器(lock)保護的另一個 synchronized 塊時,將立刻可以看到這些對變數所做的更新。類似的規則也存在於 volatile 變數上。

[java] view plain copy
  1. synchronized (lockObject) {   
  2.   // update object state  
  3. }  


所以,實現同步操作需要考慮安全更新多個共享變數所需的一切,不能有爭用條件,不能破壞資料(假設同步的邊界位置正確),而且要保證正確同步的其他執行緒可以看到這些變數的最新值。通過定義一個清晰的、跨平臺的記憶體模型(該模型在 JDK 5.0 中做了修改,改正了原來定義中的某些錯誤),通過遵守下面這個簡單規則,構建“一次編寫,隨處執行”的併發類是有可能的:

不論什麼時候,只要您將編寫的變數接下來可能被另一個執行緒讀取,或者您將讀取的變數最後是被另一個執行緒寫入的,那麼您必須進行同步。

不過現在好了一點,在最近的 JVM 中,沒有爭用的同步(一個執行緒擁有鎖的時候,沒有其他執行緒企圖獲得鎖)的效能成本還是很低的。(也不總是這樣;早期 JVM 中的同步還沒有優化,所以讓很多人都這樣認為,但是現在這變成了一種誤解,人們認為不管是不是爭用,同步都有很高的效能成本。)


對 synchronized 的改進

如此看來同步相當好了,是麼?那麼為什麼 JSR 166 小組花了這麼多時間來開發 java.util.concurrent.lock 框架呢?答案很簡單-同步是不錯,但它並不完美。它有一些功能性的限制 —— 它無法中斷一個正在等候獲得鎖的執行緒,也無法通過投票得到鎖,如果不想等下去,也就沒法得到鎖。同步還要求鎖的釋放只能在與獲得鎖所在的堆疊幀相同的堆疊幀中進行,多數情況下,這沒問題(而且與異常處理互動得很好),但是,確實存在一些非塊結構的鎖定更合適的情況。

ReentrantLock 類

java.util.concurrent.lock 中的 Lock 框架是鎖定的一個抽象,它允許把鎖定的實現作為 Java 類,而不是作為語言的特性來實現。這就為 Lock 的多種實現留下了空間,各種實現可能有不同的排程演算法、效能特性或者鎖定語義。 ReentrantLock 類實現了 Lock ,它擁有與 synchronized 相同的併發性和記憶體語義,但是新增了類似鎖投票、定時鎖等候和可中斷鎖等候的一些特性。此外,它還提供了在激烈爭用情況下更佳的效能。(換句話說,當許多執行緒都想訪問共享資源時,JVM 可以花更少的時候來排程執行緒,把更多時間用在執行執行緒上。)

reentrant 鎖意味著什麼呢?簡單來說,它有一個與鎖相關的獲取計數器,如果擁有鎖的某個執行緒再次得到鎖,那麼獲取計數器就加1,然後鎖需要被釋放兩次才能獲得真正釋放。這模仿了 synchronized 的語義;如果執行緒進入由執行緒已經擁有的監控器保護的 synchronized 塊,就允許執行緒繼續進行,當執行緒退出第二個(或者後續) synchronized 塊的時候,不釋放鎖,只有執行緒退出它進入的監控器保護的第一個 synchronized 塊時,才釋放鎖。

在檢視清單 1 中的程式碼示例時,可以看到 Lock 和 synchronized 有一點明顯的區別 —— lock 必須在 finally 塊中釋放。否則,如果受保護的程式碼將丟擲異常,鎖就有可能永遠得不到釋放!這一點區別看起來可能沒什麼,但是實際上,它極為重要。忘記在 finally 塊中釋放鎖,可能會在程式中留下一個定時炸彈,當有一天炸彈爆炸時,您要花費很大力氣才有找到源頭在哪。而使用同步,JVM 將確保鎖會獲得自動釋放。


清單 1. 用 ReentrantLock 保護程式碼塊。

[java] view plain copy
  1. Lock lock = new ReentrantLock();  
  2. lock.lock();  
  3. try {   
  4.   // update object state  
  5. }  
  6. finally {  
  7.   lock.unlock();   
  8. }  


除此之外,與目前的 synchronized 實現相比,爭用下的 ReentrantLock 實現更具可伸縮性。(在未來的 JVM 版本中,synchronized 的爭用效能很有可能會獲得提高。)這意味著當許多執行緒都在爭用同一個鎖時,使用 ReentrantLock 的總體開支通常要比 synchronized 少得多。


比較 ReentrantLock 和 synchronized 的可伸縮性

Tim Peierls 用一個簡單的線性全等偽隨機數生成器(PRNG)構建了一個簡單的評測,用它來測量 synchronized 和 Lock 之間相對的可伸縮性。這個示例很好,因為每次呼叫 nextRandom() 時,PRNG 都確實在做一些工作,所以這個基準程式實際上是在測量一個合理的、真實的 synchronized 和 Lock 應用程式,而不是測試純粹紙上談兵或者什麼也不做的程式碼(就像許多所謂的基準程式一樣。)

在這個基準程式中,有一個 PseudoRandom 的介面,它只有一個方法 nextRandom(int bound) 。該介面與 java.util.Random 類的功能非常類似。因為在生成下一個隨機數時,PRNG 用最新生成的數字作為輸入,而且把最後生成的數字作為一個例項變數來維護,其重點在於讓更新這個狀態的程式碼段不被其他執行緒搶佔,所以我要用某種形式的鎖定來確保這一點。( java.util.Random 類也可以做到這點。)我們為 PseudoRandom 構建了兩個實現;一個使用 syncronized,另一個使用 java.util.concurrent.ReentrantLock 。驅動程式生成了大量執行緒,每個執行緒都瘋狂地爭奪時間片,然後計算不同版本每秒能執行多少輪。圖 1 和 圖 2 總結了不同執行緒數量的結果。這個評測並不完美,而且只在兩個系統上執行了(一個是雙 Xeon 執行超執行緒 Linux,另一個是單處理器 Windows 系統),但是,應當足以表現 synchronized 與 ReentrantLock 相比所具有的伸縮性優勢了。



圖 1 和圖 2 中的圖表以每秒呼叫數為單位顯示了吞吐率,把不同的實現調整到 1 執行緒 synchronized 的情況。每個實現都相對迅速地集中在某個穩定狀態的吞吐率上,該狀態通常要求處理器得到充分利用,把大多數的處理器時間都花在處理實際工作(計算機隨機數)上,只有小部分時間花在了執行緒排程開支上。您會注意到,synchronized 版本在處理任何型別的爭用時,表現都相當差,而 Lock 版本在排程的開支上花的時間相當少,從而為更高的吞吐率留下空間,實現了更有效的 CPU 利用。


條件變數

根類 Object 包含某些特殊的方法,用來線上程的 wait() 、 notify() 和 notifyAll() 之間進行通訊。這些是高階的併發性特性,許多開發人員從來沒有用過它們 —— 這可能是件好事,因為它們相當微妙,很容易使用不當。幸運的是,隨著 JDK 5.0 中引入 java.util.concurrent ,開發人員幾乎更加沒有什麼地方需要使用這些方法了。

通知與鎖定之間有一個互動 —— 為了在物件上 wait 或 notify ,您必須持有該物件的鎖。就像 Lock 是同步的概括一樣, Lock 框架包含了對 wait 和notify 的概括,這個概括叫作 條件(Condition) 。 Lock 物件則充當繫結到這個鎖的條件變數的工廠物件,與標準的 wait 和 notify 方法不同,對於指定的 Lock ,可以有不止一個條件變數與它關聯。這樣就簡化了許多併發演算法的開發。例如, 條件(Condition) 的 Javadoc 顯示了一個有界緩衝區實現的示例,該示例使用了兩個條件變數,“not full”和“not empty”,它比每個 lock 只用一個 wait 設定的實現方式可讀性要好一些(而且更有效)。 Condition的方法與 wait 、 notify 和 notifyAll 方法類似,分別命名為 await 、 signal 和 signalAll ,因為它們不能覆蓋 Object 上的對應方法。


這不公平

如果檢視 Javadoc,您會看到, ReentrantLock 構造器的一個引數是 boolean 值,它允許您選擇想要一個 公平(fair)鎖,還是一個 不公平(unfair)鎖。公平鎖使執行緒按照請求鎖的順序依次獲得鎖;而不公平鎖則允許討價還價,在這種情況下,執行緒有時可以比先請求鎖的其他執行緒先得到鎖。

為什麼我們不讓所有的鎖都公平呢?畢竟,公平是好事,不公平是不好的,不是嗎?(當孩子們想要一個決定時,總會叫嚷“這不公平”。我們認為公平非常重要,孩子們也知道。)在現實中,公平保證了鎖是非常健壯的鎖,有很大的效能成本。要確保公平所需要的記帳(bookkeeping)和同步,就意味著被爭奪的公平鎖要比不公平鎖的吞吐率更低。作為預設設定,應當把公平設定為 false ,除非公平對您的演算法至關重要,需要嚴格按照執行緒排隊的順序對其進行服務。

那麼同步又如何呢?內建的監控器鎖是公平的嗎?答案令許多人感到大吃一驚,它們是不公平的,而且永遠都是不公平的。但是沒有人抱怨過執行緒飢渴,因為 JVM 保證了所有執行緒最終都會得到它們所等候的鎖。確保統計上的公平性,對多數情況來說,這就已經足夠了,而這花費的成本則要比絕對的公平保證的低得多。所以,預設情況下 ReentrantLock 是“不公平”的,這一事實只是把同步中一直是事件的東西表面化而已。如果您在同步的時候並不介意這一點,那麼在 ReentrantLock 時也不必為它擔心。

圖 3 和圖 4 包含與 圖 1和 圖 2 相同的資料,只是新增了一個資料集,用來進行隨機數基準檢測,這次檢測使用了公平鎖,而不是預設的協商鎖。正如您能看到的,公平是有代價的。如果您需要公平,就必須付出代價,但是請不要把它作為您的預設選擇。




處處都好?

看起來 ReentrantLock 無論在哪方面都比 synchronized 好 —— 所有 synchronized 能做的,它都能做,它擁有與 synchronized 相同的記憶體和併發性語義,還擁有 synchronized 所沒有的特性,在負荷下還擁有更好的效能。那麼,我們是不是應當忘記 synchronized ,不再把它當作已經已經得到優化的好主意呢?或者甚至用 ReentrantLock 重寫我們現有的 synchronized 程式碼?實際上,幾本 Java 程式設計方面介紹性的書籍在它們多執行緒的章節中就採用了這種方法,完全用 Lock 來做示例,只把 synchronized 當作歷史。但我覺得這是把好事做得太過了。

還不要拋棄 synchronized

雖然 ReentrantLock 是個非常動人的實現,相對 synchronized 來說,它有一些重要的優勢,但是我認為急於把 synchronized 視若敝屣,絕對是個嚴重的錯誤。 java.util.concurrent.lock 中的鎖定類是用於高階使用者和高階情況的工具 。一般來說,除非您對 Lock 的某個高階特性有明確的需要,或者有明確的證據(而不是僅僅是懷疑)表明在特定情況下,同步已經成為可伸縮性的瓶頸,否則還是應當繼續使用 synchronized。

為什麼我在一個顯然“更好的”實現的使用上主張保守呢?因為對於 java.util.concurrent.lock 中的鎖定類來說,synchronized 仍然有一些優勢。比如,在使用 synchronized 的時候,不能忘記釋放鎖;在退出 synchronized 塊時,JVM 會為您做這件事。您很容易忘記用 finally 塊釋放鎖,這對程式非常有害。您的程式能夠通過測試,但會在實際工作中出現死鎖,那時會很難指出原因(這也是為什麼根本不讓初級開發人員使用 Lock 的一個好理由。)

另一個原因是因為,當 JVM 用 synchronized 管理鎖定請求和釋放時,JVM 在生成執行緒轉儲時能夠包括鎖定資訊。這些對除錯非常有價值,因為它們能標識死鎖或者其他異常行為的來源。 Lock 類只是普通的類,JVM 不知道具體哪個執行緒擁有 Lock 物件。而且,幾乎每個開發人員都熟悉 synchronized,它可以在 JVM 的所有版本中工作。在 JDK 5.0 成為標準(從現在開始可能需要兩年)之前,使用 Lock 類將意味著要利用的特性不是每個 JVM 都有的,而且不是每個開發人員都熟悉的。

什麼時候選擇用 ReentrantLock 代替 synchronized

既然如此,我們什麼時候才應該使用 ReentrantLock 呢?答案非常簡單 —— 在確實需要一些 synchronized 所沒有的特性的時候,比如時間鎖等候、可中斷鎖等候、無塊結構鎖、多個條件變數或者鎖投票。 ReentrantLock 還具有可伸縮性的好處,應當在高度爭用的情況下使用它,但是請記住,大多數 synchronized 塊幾乎從來沒有出現過爭用,所以可以把高度爭用放在一邊。我建議用 synchronized 開發,直到確實證明 synchronized 不合適,而不要僅僅是假設如果使用 ReentrantLock “效能會更好”。請記住,這些是供高階使用者使用的高階工具。(而且,真正的高階使用者喜歡選擇能夠找到的最簡單工具,直到他們認為簡單的工具不適用為止。)。一如既往,首先要把事情做好,然後再考慮是不是有必要做得更快。


Lock 框架是同步的相容替代品,它提供了 synchronized 沒有提供的許多特性,它的實現在爭用下提供了更好的效能。但是,這些明視訊記憶體在的好處,還不足以成為用 ReentrantLock 代替 synchronized 的理由。相反,應當根據您是否 需要 ReentrantLock 的能力來作出選擇。大多數情況下,您不應當選擇它 —— synchronized 工作得很好,可以在所有 JVM 上工作,更多的開發人員瞭解它,而且不太容易出錯。只有在真正需要 Lock 的時候才用它。在這些情況下,您會很高興擁有這款工具。

相關文章