上文詳細講述了執行緒、程式的關係及在作業系統中的表現,這是多執行緒學習必須瞭解的基礎。本文將接著講一下執行緒優先順序和執行緒安全。
執行緒優先順序
現在主流作業系統(如Windows、Linux、Mac OS X)的任務排程除了具有前面提到的時間片輪轉的特點外,還有優先順序排程(Priority Schedule)的特點。優先順序排程決定了執行緒按照什麼順序輪流執行,在具有優先順序排程的系統中,執行緒擁有各自的執行緒優先順序(Thread Priority)。具有高優先順序的執行緒會更早地執行,而低優先順序的執行緒通常要等沒有更高優先順序的可執行執行緒時才會被執行。
執行緒的優先順序可以由使用者手動設定,此外系統也會根據不同情形調整優先順序。通常情況下,頻繁地進入等待狀態(進入等待狀態會放棄之前仍可佔用的時間份額)的執行緒(如IO執行緒),比頻繁進行大量計算以至於每次都把所有時間片全部用盡的執行緒更受作業系統的歡迎。因為頻繁進入等待的執行緒只會佔用很少的時間,這樣作業系統可以處理更多的任務。我們把頻繁等待的執行緒稱之為IO密集型執行緒(IO Bound Thread),而把很少等待的執行緒稱之為CPU密集型執行緒(CPU Bound Thread)。IO密集型執行緒總是比CPU密集型執行緒更容易得到優先順序的提升。
執行緒餓死:
在優先順序排程下,容易出現一種執行緒餓死的現象。一個執行緒餓死是說它的優先順序較低,在它執行之前總是有比它優先順序更高的執行緒等待執行,因此這個低優先順序的執行緒始終得不到執行。當CPU密集型的執行緒優先順序較高時,其它低優先順序的執行緒就很可能出現餓死的情況;當IO密集型執行緒優先順序較高時,其它執行緒相對不容易造成餓死的善,因為IO執行緒有大量的等待時間。為了避免執行緒餓死,排程系統通常會逐步提升那些等待了很久而得不到執行的執行緒的優先順序。這樣,一個執行緒只要它等待了足夠長的時間,其優先順序總會被提升到可以讓它執行的程度,也就是說這種情況下執行緒始終會得到執行,只是時間的問題。
在優先順序排程環境下,執行緒優先順序的改變有三種方式:
1. 使用者指定優先順序;
2. 根據進入等待狀態的頻繁程度提升或降低優先順序(由作業系統完成);
3. 長時間得不到執行而被提升優先順序。
執行緒安全與鎖
在多個執行緒併發執行訪問同一個資料時,如果不採取相應的措施,將會是非常危險的。假設你在工行有一個銀行賬戶,兩張銀聯卡(自己手裡一張,女朋友手裡一張),裡面有100萬。假設取錢就兩個過程:1.檢查賬戶餘額,2.取出現金(如果要取出的金額 > 賬戶餘額,則出現成功,否則取現失敗)。有一天你要買房想把錢取出來,而此時你女朋友也想買一輛車(假設你們事先沒有商量)。兩個人都在取錢,你在A號ATM機取100萬,女朋友在B號ATM機取80萬。這時A號ATM檢查賬戶餘額發現有100萬,可以取出;而與此同時,同一時刻B號ATM也在檢查賬戶餘額發現有100萬,可以取出;這樣,A、B都把錢取出來了。
100萬的存款取出180萬,銀行就虧大發了(當然你就笑呵呵了……)!這就是執行緒併發的不安全性。為避免這種情況發生,我們要將多個執行緒對同一資料的訪問同步,確保執行緒安全。
所謂同步(synchronization)就是指一個執行緒訪問資料時,其它執行緒不得對同一個資料進行訪問,即同一時刻只能有一個執行緒訪問該資料,當這一執行緒訪問結束時其它執行緒才能對這它進行訪問。同步最常見的方式就是使用鎖(Lock),也稱為執行緒鎖。鎖是一種非強制機制,每一個執行緒在訪問資料或資源之前,首先試圖獲取(Acquire)鎖,並在訪問結束之後釋放(Release)鎖。在鎖被佔用時試圖獲取鎖,執行緒會進入等待狀態,直到鎖被釋放再次變為可用。
二元訊號量
二元訊號量(Binary Semaphore)是一種最簡單的鎖,它有兩種狀態:佔用和非佔用。它適合只能被唯一一個執行緒獨佔訪問的資源。當二元訊號量處於非佔用狀態時,第一個試圖獲取該二元訊號量鎖的執行緒會獲得該鎖,並將二元訊號量鎖置為佔用狀態,之後其它試圖獲取該二元訊號量的執行緒會進入等待狀態,直到該鎖被釋放。
訊號量
多元訊號量允許多個執行緒訪問同一個資源,多元訊號量簡稱訊號量(Semaphore),對於允許多個執行緒併發訪問的資源,這是一個很好的選擇。一個初始值為N的訊號量允許N個執行緒併發訪問。執行緒訪問資源時首先獲取訊號量鎖,進行如下操作:
1. 將訊號量的值減1;
2. 如果訊號量的值小於0,則進入等待狀態,否則繼續執行;
訪問資源結束之後,執行緒釋放訊號量鎖,進行如下操作:
1. 將訊號量的值加1;
2. 如果訊號量的值小於1(等於0),喚醒一個等待中的執行緒;
互斥量
互斥量(Mutex)和二元訊號量類似,資源僅允許一個執行緒訪問。與二元訊號量不同的是,訊號量在整個系統中可以被任意執行緒獲取和釋放,也就是說,同一個訊號量可以由一個執行緒獲取而由另一執行緒釋放。而互斥量則要求哪個執行緒獲取了該互斥量鎖就由哪個執行緒釋放,其它執行緒越俎代庖釋放互斥量是無效的。
臨界區
臨界區(Critical Section)是一種比互斥量更加嚴格的同步手段。互斥量和訊號量在系統的任何程式都是可見的,也就是說一個程式建立了一個互斥量或訊號量,另一程式試圖獲取該鎖是合法的。而臨界區的作用範圍僅限於本程式,其它的程式無法獲取該鎖。除此之處,臨界區與互斥量的性質相同。
讀寫鎖
讀寫鎖(Read-Write Lock)允許多個執行緒同時對同一個資料進行讀操作,而只允許一個執行緒進行寫操作。這是因為讀操作不會改變資料的內容,是安全的;而寫操作會改變資料的內容,是不安全的。對同一個讀寫鎖,有兩種獲取方式:共享的(Shared)和獨佔的(Exclusive)。當鎖處於自由狀態時,試圖以任何一種方式獲取鎖都能成功,並將鎖置為對應的狀態;如果鎖處於共享狀態,其它執行緒以共享方式獲取該鎖,仍然能成功,此時該鎖分配給了多個執行緒;如果其它執行緒試圖如獨佔的方式獲取處於共享狀態的鎖,它必須等待所有執行緒釋放該鎖;處於獨佔狀態的鎖阻止任何執行緒獲取該鎖,不論它們以何種方式。獲取讀寫鎖的方式總結如下:
讀寫鎖的狀態 | 以共享方式獲取 | 以獨佔方式獲取 |
---|---|---|
自由 | 成功 | 成功 |
共享 | 成功 | 等待 |
獨佔 | 等待 | 等待 |
表 1 :獲取讀寫鎖的方式