Linux 多執行緒程式設計(不限Linux)

發表於2016-07-11

——本文一個例子展開,介紹Linux下面執行緒的操作、多執行緒的同步和互斥。

前言

執行緒?為什麼有了程式還需要執行緒呢,他們有什麼區別?使用執行緒有什麼優勢呢?還有多執行緒程式設計的一些細節問題,如執行緒之間怎樣同步、互斥,這些東西將在本文中介紹。我在某QQ群裡見到這樣一道面試題:

是否熟悉POSIX多執行緒程式設計技術?如熟悉,編寫程式完成如下功能:

1)有一int型全域性變數g_Flag初始值為0;

2) 在主線稱中起動執行緒1,列印“this is thread1”,並將g_Flag設定為1

3) 在主線稱中啟動執行緒2,列印“this is thread2”,並將g_Flag設定為2

4) 執行緒序1需要線上程2退出後才能退出

5) 主執行緒在檢測到g_Flag從1變為2,或者從2變為1的時候退出

我們帶著這題開始這篇文章,結束之後,大家就都會做了。本文的框架如下:

  • 1、程式與執行緒
  • 2、使用執行緒的理由
  • 3、有關執行緒操作的函式
  • 4、執行緒之間的互斥
  • 5、執行緒之間的同步
  • 6、試題最終程式碼

1、程式與執行緒

程式是程式執行時的一個例項,即它是程式已經執行到何種程度的資料結構的彙集。從核心的觀點看,程式的目的就是擔當分配系統資源(CPU時間、記憶體等)的基本單位。

執行緒是程式的一個執行流,是CPU排程和分派的基本單位,它是比程式更小的能獨立執行的基本單位。一個程式由幾個執行緒組成(擁有很多相對獨立的執行流的使用者程式共享應用程式的大部分資料結構),執行緒與同屬一個程式的其他的執行緒共享程式所擁有的全部資源。

“程式——資源分配的最小單位,執行緒——程式執行的最小單位”

程式有獨立的地址空間,一個程式崩潰後,在保護模式下不會對其它程式產生影響,而執行緒只是一個程式中的不同執行路徑。執行緒有自己的堆疊和區域性變數,但執行緒沒有單獨的地址空間,一個執行緒死掉就等於整個程式死掉,所以多程式的程式要比多執行緒的程式健壯,但在程式切換時,耗費資源較大,效率要差一些。但對於一些要求同時進行並且又要共享某些變數的併發操作,只能用執行緒,不能用程式。

2、使用執行緒的理由

從上面我們知道了程式與執行緒的區別,其實這些區別也就是我們使用執行緒的理由。總的來說就是:程式有獨立的地址空間,執行緒沒有單獨的地址空間(同一程式內的執行緒共享程式的地址空間)。(下面的內容摘自Linux下的多執行緒程式設計

使用多執行緒的理由之一是和程式相比,它是一種非常”節儉”的多工操作方式。我們知道,在Linux系統下,啟動一個新的程式必須分配給它獨立的地址空間,建立眾多的資料表來維護它的程式碼段、堆疊段和資料段,這是一種”昂貴”的多工工作方式。而執行於一個程式中的多個執行緒,它們彼此之間使用相同的地址空間,共享大部分資料,啟動一個執行緒所花費的空間遠遠小於啟動一個程式所花費的空間,而且,執行緒間彼此切換所需的時間也遠遠小於程式間切換所需要的時間。據統計,總的說來,一個程式的開銷大約是一個執行緒開銷的30倍左右,當然,在具體的系統上,這個資料可能會有較大的區別。

使用多執行緒的理由之二是執行緒間方便的通訊機制。對不同程式來說,它們具有獨立的資料空間,要進行資料的傳遞只能通過通訊的方式進行,這種方式不僅費時,而且很不方便。執行緒則不然,由於同一程式下的執行緒之間共享資料空間,所以一個執行緒的資料可以直接為其它執行緒所用,這不僅快捷,而且方便。當然,資料的共享也帶來其他一些問題,有的變數不能同時被兩個執行緒所修改,有的子程式中宣告為static的資料更有可能給多執行緒程式帶來災難性的打擊,這些正是編寫多執行緒程式時最需要注意的地方。

除了以上所說的優點外,不和程式比較,多執行緒程式作為一種多工、併發的工作方式,當然有以下的優點:

  • 提高應用程式響應。這對圖形介面的程式尤其有意義,當一個操作耗時很長時,整個系統都會等待這個操作,此時程式不會響應鍵盤、滑鼠、選單的操作,而使用多執行緒技術,將耗時長的操作(time consuming)置於一個新的執行緒,可以避免這種尷尬的情況。
  • 使多CPU系統更加有效。作業系統會保證當執行緒數不大於CPU數目時,不同的執行緒執行於不同的CPU上。
  • 改善程式結構。一個既長又複雜的程式可以考慮分為多個執行緒,成為幾個獨立或半獨立的執行部分,這樣的程式會利於理解和修改。

=============================

從函式呼叫上來說,程式建立使用fork()操作;執行緒建立使用clone()操作。Richard Stevens大師這樣說過:

  • fork is expensive. Memory is copied from the parent to the child, all descriptors are duplicated in the child, and so on. Current implementations use a technique called copy-on-write, which avoids a copy of the parent’s data space to the child until the child needs its own copy. But, regardless of this optimization, fork is expensive.
  • IPC is required to pass information between the parent and child after the fork. Passing information from the parent to the child before the fork is easy, since the child starts with a copy of the parent’s data space and with a copy of all the parent’s descriptors. But, returning information from the child to the parent takes more work.

Threads help with both problems. Threads are sometimes called lightweight processes since a thread is “lighter weight” than a process. That is, thread creation can be 10–100 times faster than process creation.

All threads within a process share the same global memory. This makes the sharing of information easy between the threads, but along with this simplicity comes the problem of synchronization.

=============================

3、有關執行緒操作的函式

pthread_create用於建立一個執行緒,成功返回0,否則返回Exxx(為正數)。

  • pthread_t *tid:執行緒id的型別為pthread_t,通常為無符號整型,當呼叫pthread_create成功時,通過*tid指標返回。
  • const pthread_attr_t *attr:指定建立執行緒的屬性,如執行緒優先順序、初始棧大小、是否為守護程式等。可以使用NULL來使用預設值,通常情況下我們都是使用預設值。
  • void *(*func) (void *):函式指標func,指定當新的執行緒建立之後,將執行的函式。
  • void *arg:執行緒將執行的函式的引數。如果想傳遞多個引數,請將它們封裝在一個結構體中。

pthread_join用於等待某個執行緒退出,成功返回0,否則返回Exxx(為正數)。

  • pthread_t tid:指定要等待的執行緒ID
  • void ** status:如果不為NULL,那麼執行緒的返回值儲存在status指向的空間中(這就是為什麼status是二級指標的原因!這種才引數也稱為“值-結果”引數)。

pthread_self用於返回當前執行緒的ID。

pthread_detach用於是指定執行緒變為分離狀態,就像程式脫離終端而變為後臺程式類似。成功返回0,否則返回Exxx(為正數)。變為分離狀態的執行緒,如果執行緒退出,它的所有資源將全部釋放。而如果不是分離狀態,執行緒必須保留它的執行緒ID,退出狀態直到其它執行緒對它呼叫了pthread_join。

程式也是類似,這也是當我們開啟程式管理器的時候,發現有很多僵死程式的原因!也是為什麼一定要有僵死這個程式狀態。

pthread_exit用於終止執行緒,可以指定返回值,以便其他執行緒通過pthread_join函式獲取該執行緒的返回值。

  • void *status:指標執行緒終止的返回值。

知道了這些函式之後,我們試圖來完成本文一開始的問題:

1)有一int型全域性變數g_Flag初始值為0;

2)在主線稱中起動執行緒1,列印“this is thread1”,並將g_Flag設定為1

3)在主線稱中啟動執行緒2,列印“this is thread2”,並將g_Flag設定為2

這3點很簡單嘛!!!不就是呼叫pthread_create建立執行緒。程式碼如下:

這樣就完成了1)、2)、3)這三點要求。編譯執行得如下結果:

netsky@ubuntu:~/workspace/pthead_test$ gcc -lpthread test.c

如果程式中使用到了pthread庫中的函式,除了要#include,在編譯的時候還有加上-lpthread 選項。

netsky@ubuntu:~/workspace/pthead_test$ ./a.out
enter main
enter thread2
this is thread2, g_Flag: 0, thread id is 3079588720
this is thread1, g_Flag: 2, thread id is 3079588720
leave thread2
leave main
enter thread1
this is thread1, g_Flag: 2, thread id is 3071196016
this is thread1, g_Flag: 1, thread id is 3071196016
leave thread1

但是執行結果不一定是上面的,還有可能是:

netsky@ubuntu:~/workspace/pthead_test$ ./a.out
enter main
leave main
enter thread1
this is thread1, g_Flag: 0, thread id is 3069176688
this is thread1, g_Flag: 1, thread id is 3069176688
leave thread1

或者是:

netsky@ubuntu:~/workspace/pthead_test$ ./a.out
enter main
leave main

等等。這也很好理解因為,這取決於主執行緒main函式何時終止,執行緒thread1、thread2是否能夠來得急執行它們的函式。這也是多執行緒程式設計時要注意的問題,因為有可能一個執行緒會影響到整個程式中的所有其它執行緒!如果我們在main函式退出前,sleep()一段時間,就可以保證thread1、thread2來得及執行。

Attention:大家肯定已經注意到了,我們線上程函式thread1()、thread2()執行完之前都呼叫了pthread_exit。如果我是呼叫exit()又或者是return會怎樣呢?自己動手試試吧!

pthread_exit()用於執行緒退出,可以指定返回值,以便其他執行緒通過pthread_join()函式獲取該執行緒的返回值。
return是函式返回,只有執行緒函式return,執行緒才會退出。
exit是程式退出,如果線上程函式中呼叫exit,程式中的所有函式都會退出!

“4) 執行緒序1需要線上程2退出後才能退出”第4點也很容易解決,直接在thread1的函式退出之前呼叫pthread_join就OK了。

4、執行緒之間的互斥

上面的程式碼似乎很好的解決了問題的前面4點要求,其實不然!!!因為g_Flag是一個全域性變數,執行緒thread1和thread2可以同時對它進行操作,需要對它進行加鎖保護,thread1和thread2要互斥訪問才行。下面我們就介紹如何加鎖保護——互斥鎖。

互斥鎖:

使用互斥鎖(互斥)可以使執行緒按順序執行。通常,互斥鎖通過確保一次只有一個執行緒執行程式碼的臨界段來同步多個執行緒。互斥鎖還可以保護單執行緒程式碼。

互斥鎖的相關操作函式如下:

在對臨界資源進行操作之前需要pthread_mutex_lock先加鎖,操作完之後pthread_mutex_unlock再解鎖。而且在這之前需要宣告一個pthread_mutex_t型別的變數,用作前面兩個函式的引數。具體程式碼見第5節。

5、執行緒之間的同步

第5點——主執行緒在檢測到g_Flag從1變為2,或者從2變為1的時候退出。就需要用到執行緒同步技術!執行緒同步需要條件變數。

條件變數:

使用條件變數可以以原子方式阻塞執行緒,直到某個特定條件為真為止。條件變數始終與互斥鎖一起使用。對條件的測試是在互斥鎖(互斥)的保護下進行的。

如果條件為假,執行緒通常會基於條件變數阻塞,並以原子方式釋放等待條件變化的互斥鎖。如果另一個執行緒更改了條件,該執行緒可能會向相關的條件變數發出訊號,從而使一個或多個等待的執行緒執行以下操作:

  • 喚醒
  • 再次獲取互斥鎖
  • 重新評估條件

在以下情況下,條件變數可用於在程式之間同步執行緒:

  • 執行緒是在可以寫入的記憶體中分配的
  • 記憶體由協作程式共享

“使用條件變數可以以原子方式阻塞執行緒,直到某個特定條件為真為止。”即可用到第5點,主執行緒main函式阻塞於等待g_Flag從1變為2,或者從2變為1。條件變數的相關函式如下:

pthread_cond_wait用於等待某個特定的條件為真,pthread_cond_signal用於通知阻塞的執行緒某個特定的條件為真了。在呼叫者兩個函式之前需要宣告一個pthread_cond_t型別的變數,用於這兩個函式的引數。

為什麼條件變數始終與互斥鎖一起使用,對條件的測試是在互斥鎖(互斥)的保護下進行的呢?因為“某個特性條件”通常是在多個執行緒之間共享的某個變數。互斥鎖允許這個變數可以在不同的執行緒中設定和檢測。

通常,pthread_cond_wait只是喚醒等待某個條件變數的一個執行緒。如果需要喚醒所有等待某個條件變數的執行緒,需要呼叫:

預設情況下面,阻塞的執行緒會一直等待,知道某個條件變數為真。如果想設定最大的阻塞時間可以呼叫:

如果時間到了,條件變數還沒有為真,仍然返回,返回值為ETIME。

6、試題最終程式碼

通過前面的介紹,我們可以輕鬆的寫出程式碼了,如下所示:

編譯執行可以得到符合要求的結果!

——這篇日誌就算是獻給我自己生日的禮物!

加油,努力,不要放棄!

相關文章