《java學習三》併發程式設計 -------執行緒池原理剖析

x號開發者發表於2019-03-23

 

阻塞佇列與非阻塞隊

阻塞佇列與普通佇列的區別在於,當佇列是空的時,從佇列中獲取元素的操作將會被阻塞,或者當佇列是滿時,往佇列裡新增元素的操作會被阻塞。試圖從空的阻塞佇列中獲取元素的執行緒將會被阻塞,直到其他的執行緒往空的佇列插入新的元素。同樣,試圖往已滿的阻塞佇列中新增新元素的執行緒同樣也會被阻塞,直到其他的執行緒使佇列重新變得空閒起來,如從佇列中移除一個或者多個元素,或者完全清空佇列.

1.ArrayDeque, (陣列雙端佇列) 
2.PriorityQueue, (優先順序佇列) 
3.ConcurrentLinkedQueue, (基於連結串列的併發佇列) 
4.DelayQueue, (延期阻塞佇列)(阻塞佇列實現了BlockingQueue介面) 
5.ArrayBlockingQueue, (基於陣列的併發阻塞佇列) 
6.LinkedBlockingQueue, (基於連結串列的FIFO阻塞佇列) 
7.LinkedBlockingDeque, (基於連結串列的FIFO雙端阻塞佇列) 
8.PriorityBlockingQueue, (帶優先順序的無界阻塞佇列) 
9.SynchronousQueue (併發同步阻塞佇列)

 

ConcurrentLinkedDeque
ConcurrentLinkedQueue : 是一個適用於高併發場景下的佇列,通過無鎖的方式,實現
了高併發狀態下的高效能,通常ConcurrentLinkedQueue效能好於BlockingQueue.它
是一個基於連結節點的無界執行緒安全佇列。該佇列的元素遵循先進先出的原則。頭是最先
加入的,尾是最近加入的,該佇列不允許null元素。
ConcurrentLinkedQueue重要方法:
add 和offer() 都是加入元素的方法(在ConcurrentLinkedQueue中這倆個方法沒有任何區別)
poll() 和peek() 都是取頭元素節點,區別在於前者會刪除元素,後者不會。

     ConcurrentLinkedDeque q = new ConcurrentLinkedDeque();

     q.offer("基金");

     q.offer("碼雲");

     q.offer("課堂");

     q.offer("張傑");

     q.offer("地方");

     //從頭獲取元素,刪除該元素

     System.out.println(q.poll());

     //從頭獲取元素,不刪除該元素

     System.out.println(q.peek());

     //獲取總長度

     System.out.println(q.size());

BlockingQueue

阻塞佇列(BlockingQueue)是一個支援兩個附加操作的佇列。這兩個附加的操作是:

在佇列為空時,獲取元素的執行緒會等待佇列變為非空。

當佇列滿時,儲存元素的執行緒會等待佇列可用。

阻塞佇列常用於生產者和消費者的場景,生產者是往佇列裡新增元素的執行緒,消費者是從佇列裡拿元素的執行緒。阻塞佇列就是生產者存放元素的容器,而消費者也只從容器裡拿元素。

BlockingQueue即阻塞佇列,從阻塞這個詞可以看出,在某些情況下對阻塞佇列的訪問可能會造成阻塞。被阻塞的情況主要有如下兩種:

1. 當佇列滿了的時候進行入佇列操作

2. 當佇列空了的時候進行出佇列操作

因此,當一個執行緒試圖對一個已經滿了的佇列進行入佇列操作時,它將會被阻塞,除非有另一個執行緒做了出佇列操作;同樣,當一個執行緒試圖對一個空佇列進行出佇列操作時,它將會被阻塞,除非有另一個執行緒進行了入佇列操作。

在Java中,BlockingQueue的介面位於java.util.concurrent 包中(在Java5版本開始提供),由上面介紹的阻塞佇列的特性可知,阻塞佇列是執行緒安全的。

在新增的Concurrent包中,BlockingQueue很好的解決了多執行緒中,如何高效安全“傳輸”資料的問題。通過這些高效並且執行緒安全的佇列類,為我們快速搭建高質量的多執行緒程式帶來極大的便利。本文詳細介紹了BlockingQueue家庭中的所有成員,包括他們各自的功能以及常見使用場景。

認識BlockingQueue

阻塞佇列,顧名思義,首先它是一個佇列,而一個佇列在資料結構中所起的作用大致如下圖所示:

從上圖我們可以很清楚看到,通過一個共享的佇列,可以使得資料由佇列的一端輸入,從另外一端輸出;

常用的佇列主要有以下兩種:(當然通過不同的實現方式,還可以延伸出很多不同型別的佇列,DelayQueue就是其中的一種)

  先進先出(FIFO):先插入的佇列的元素也最先出佇列,類似於排隊的功能。從某種程度上來說這種佇列也體現了一種公平性。

  後進先出(LIFO):後插入佇列的元素最先出佇列,這種佇列優先處理最近發生的事件。

      多執行緒環境中,通過佇列可以很容易實現資料共享,比如經典的“生產者”和“消費者”模型中,通過佇列可以很便利地實現兩者之間的資料共享。假設我們有若干生產者執行緒,另外又有若干個消費者執行緒。如果生產者執行緒需要把準備好的資料共享給消費者執行緒,利用佇列的方式來傳遞資料,就可以很方便地解決他們之間的資料共享問題。但如果生產者和消費者在某個時間段內,萬一發生資料處理速度不匹配的情況呢?理想情況下,如果生產者產出資料的速度大於消費者消費的速度,並且當生產出來的資料累積到一定程度的時候,那麼生產者必須暫停等待一下(阻塞生產者執行緒),以便等待消費者執行緒把累積的資料處理完畢,反之亦然。然而,在concurrent包釋出以前,在多執行緒環境下,我們每個程式設計師都必須去自己控制這些細節,尤其還要兼顧效率和執行緒安全,而這會給我們的程式帶來不小的複雜度。好在此時,強大的concurrent包橫空出世了,而他也給我們帶來了強大的BlockingQueue。(在多執行緒領域:所謂阻塞,在某些情況下會掛起執行緒(即阻塞),一旦條件滿足,被掛起的執行緒又會自動被喚醒)

下面兩幅圖演示了BlockingQueue的兩個常見阻塞場景:

 

ArrayBlockingQueue

ArrayBlockingQueue是一個有邊界的阻塞佇列,它的內部實現是一個陣列。有邊界的意思是它的容量是有限的,我們必須在其初始化的時候指定它的容量大小,容量大小一旦指定就不可改變。

ArrayBlockingQueue是以先進先出的方式儲存資料,最新插入的物件是尾部,最新移出的物件是頭部。下面

是一個初始化和使用ArrayBlockingQueue的例子:

    

 

 

<String> arrays = new ArrayBlockingQueue<String>(3);

     arrays.add("李四");

      arrays.add("張軍");

     arrays.add("張軍");

     // 新增阻塞佇列

     arrays.offer("張三", 1, TimeUnit.SECONDS);

LinkedBlockingQueue

LinkedBlockingQueue阻塞佇列大小的配置是可選的,如果我們初始化時指定一個大小,它就是有邊界的,如果不指定,它就是無邊界的。說是無邊界,其實是採用了預設大小為Integer.MAX_VALUE的容量 。它的內部實現是一個連結串列。

和ArrayBlockingQueue一樣,LinkedBlockingQueue 也是以先進先出的方式儲存資料,最新插入的物件是尾部,最新移出的物件是頭部。下面是一個初始化和使LinkedBlockingQueue的例子:

LinkedBlockingQueuelinkedBlockingQueue = new LinkedBlockingQueue(3);

linkedBlockingQueue.add("張三");

linkedBlockingQueue.add("李四");

linkedBlockingQueue.add("李四");

System.out.println(linkedBlockingQueue.size());

PriorityBlockingQueue

PriorityBlockingQueue是一個沒有邊界的佇列,它的排序規則和 java.util.PriorityQueue一樣。需要注

 

意,PriorityBlockingQueue中允許插入null物件。

所有插入PriorityBlockingQueue的物件必須實現 java.lang.Comparable介面,佇列優先順序的排序規則就

 

是按照我們對這個介面的實現來定義的。

另外,我們可以從PriorityBlockingQueue獲得一個迭代器Iterator,但這個迭代器並不保證按照優先順序順

 

序進行迭代。

下面我們舉個例子來說明一下,首先我們定義一個物件型別,這個物件需要實現Comparable介面:

SynchronousQueue

SynchronousQueue佇列內部僅允許容納一個元素。當一個執行緒插入一個元素後會被阻塞,除非這個元素被另一個執行緒消費。

使用BlockingQueue模擬生產者與消費者

 

class ProducerThread implements Runnable {

      private BlockingQueue<String> blockingQueue;

      private AtomicInteger count = new AtomicInteger();

      private volatile boolean FLAG = true;

 

      public ProducerThread(BlockingQueue<String> blockingQueue) {

           this.blockingQueue = blockingQueue;

      }

 

      @Override

      public void run() {

           System.out.println(Thread.currentThread().getName() + "生產者開始啟動....");

           while (FLAG) {

                 String data = count.incrementAndGet() + "";

                 try {

                      boolean offer = blockingQueue.offer(data, 2, TimeUnit.SECONDS);

                      if (offer) {

                            System.out.println(Thread.currentThread().getName() + ",生產佇列" + data + "成功..");

                      } else {

                            System.out.println(Thread.currentThread().getName() + ",生產佇列" + data + "失敗..");

                      }

                      Thread.sleep(1000);

                 } catch (Exception e) {

 

                 }

           }

           System.out.println(Thread.currentThread().getName() + ",生產者執行緒停止...");

      }

 

      public void stop() {

           this.FLAG = false;

      }

 

}

 

class ConsumerThread implements Runnable {

      private volatile boolean FLAG = true;

      private BlockingQueue<String> blockingQueue;

 

      public ConsumerThread(BlockingQueue<String> blockingQueue) {

           this.blockingQueue = blockingQueue;

      }

 

      @Override

      public void run() {

           System.out.println(Thread.currentThread().getName() + "消費者開始啟動....");

           while (FLAG) {

                 try {

                      String data = blockingQueue.poll(2, TimeUnit.SECONDS);

                      if (data == null || data == "") {

                            FLAG = false;

                            System.out.println("消費者超過2秒時間未獲取到訊息.");

                            return;

                      }

                      System.out.println("消費者獲取到佇列資訊成功,data:" + data);

 

                 } catch (Exception e) {

                      // TODO: handle exception

                 }

           }

      }

 

}

 

public class Test0008 {

 

      public static void main(String[] args) {

           BlockingQueue<String> blockingQueue = new LinkedBlockingQueue<>(3);

           ProducerThread producerThread = new ProducerThread(blockingQueue);

           ConsumerThread consumerThread = new ConsumerThread(blockingQueue);

           Thread t1 = new Thread(producerThread);

           Thread t2 = new Thread(consumerThread);

           t1.start();

           t2.start();

           //10秒後 停止執行緒..

           try {

                 Thread.sleep(10*1000);

                 producerThread.stop();

           } catch (Exception e) {

                 // TODO: handle exception

           }

      }

 

}

 

執行緒池

什麼是執行緒池

Java中的執行緒池是運用場景最多的併發框架,幾乎所有需要非同步或併發執行任務的程式
都可以使用執行緒池。在開發過程中,合理地使用執行緒池能夠帶來3個好處。
第一:降低資源消耗。通過重複利用已建立的執行緒降低執行緒建立和銷燬造成的消耗。
第二:提高響應速度。當任務到達時,任務可以不需要等到執行緒建立就能立即執行。
第三:提高執行緒的可管理性。執行緒是稀缺資源,如果無限制地建立,不僅會消耗系統資源,
還會降低系統的穩定性,使用執行緒池可以進行統一分配、調優和監控。但是,要做到合理利用
執行緒池,必須對其實現原理了如指掌。

執行緒池作用

執行緒池是為突然大量爆發的執行緒設計的,通過有限的幾個固定執行緒為大量的操作服務,減少了建立和銷燬執行緒所需的時間,從而提高效率。

如果一個執行緒的時間非常長,就沒必要用執行緒池了(不是不能作長時間操作,而是不宜。),況且我們還不能控制執行緒池中執行緒的開始、掛起、和中止。

執行緒池的分類

ThreadPoolExecutor

Java是天生就支援併發的語言,支援併發意味著多執行緒,執行緒的頻繁建立在高併發及大資料量是非常消耗資源的,因為java提供了執行緒池。在jdk1.5以前的版本中,執行緒池的使用是及其簡陋的,但是在JDK1.5後,有了很大的改善。JDK1.5之後加入了java.util.concurrent包,java.util.concurrent包的加入給予開發人員開發併發程式以及解決併發問題很大的幫助。這篇文章主要介紹下併發包下的Executor介面,Executor介面雖然作為一個非常舊的介面(JDK1.5 2004年釋出),但是很多程式設計師對於其中的一些原理還是不熟悉,因此寫這篇文章來介紹下Executor介面,同時鞏固下自己的知識。如果文章中有出現錯誤,歡迎大家指出。

Executor框架的最頂層實現是ThreadPoolExecutor類,Executors工廠類中提供的newScheduledThreadPool、newFixedThreadPool、newCachedThreadPool方法其實也只是ThreadPoolExecutor的建構函式引數不同而已。通過傳入不同的引數,就可以構造出適用於不同應用場景下的執行緒池,那麼它的底層原理是怎樣實現的呢,這篇就來介紹下ThreadPoolExecutor執行緒池的執行過程。

 

corePoolSize: 核心池的大小。 當有任務來之後,就會建立一個執行緒去執行任務,當執行緒池中的執行緒數目達到corePoolSize後,就會把到達的任務放到快取佇列當中
maximumPoolSize: 執行緒池最大執行緒數,它表示線上程池中最多能建立多少個執行緒;
keepAliveTime: 表示執行緒沒有任務執行時最多保持多久時間會終止。
unit: 引數keepAliveTime的時間單位,有7種取值,在TimeUnit類中有7種靜態屬性:

執行緒池四種建立方式

Java通過Executors(jdk1.5併發包)提供四種執行緒池,分別為:

newCachedThreadPool建立一個可快取執行緒池,如果執行緒池長度超過處理需要,可靈活回收空閒執行緒,若無可回收,則新建執行緒。

newFixedThreadPool 建立一個定長執行緒池,可控制執行緒最大併發數,超出的執行緒會在佇列中等待。

newScheduledThreadPool 建立一個定長執行緒池,支援定時及週期性任務執行。

newSingleThreadExecutor 建立一個單執行緒化的執行緒池,它只會用唯一的工作執行緒來執行任務,保證所有任務按照指定順序(FIFO, LIFO, 優先順序)執行。

newCachedThreadPool

建立一個可快取執行緒池,如果執行緒池長度超過處理需要,可靈活回收空閒執行緒,若無可回收,則新建執行緒。示例程式碼如下:

           // 無限大小執行緒池 jvm自動回收

           ExecutorService newCachedThreadPool = Executors.newCachedThreadPool();

           for (inti = 0; i < 10; i++) {

                 finalinttemp = i;

                 newCachedThreadPool.execute(new Runnable() {

 

                      @Override

                      publicvoid run() {

                            try {

                                  Thread.sleep(100);

                            } catch (Exception e) {

                                  // TODO: handle exception

                            }

                            System.out.println(Thread.currentThread().getName() + ",i:" + temp);

 

                      }

                 });

           }

 

總結: 執行緒池為無限大,當執行第二個任務時第一個任務已經完成,會複用執行第一個任務的執行緒,而不用每次新建執行緒。

newFixedThreadPool

建立一個定長執行緒池,可控制執行緒最大併發數,超出的執行緒會在佇列中等待。示例程式碼如下:

ExecutorService newFixedThreadPool = Executors.newFixedThreadPool(5);

           for (inti = 0; i < 10; i++) {

                 finalinttemp = i;

                 newFixedThreadPool.execute(new Runnable() {

 

                      @Override

                      publicvoid run() {

                            System.out.println(Thread.currentThread().getId() + ",i:" + temp);

 

                      }

                 });

           }

總結:因為執行緒池大小為3,每個任務輸出index後sleep 2秒,所以每兩秒列印3個數字。

定長執行緒池的大小最好根據系統資源進行設定。如Runtime.getRuntime().availableProcessors()

newScheduledThreadPool

建立一個定長執行緒池,支援定時及週期性任務執行。延遲執行示例程式碼如下:

ScheduledExecutorService newScheduledThreadPool = Executors.newScheduledThreadPool(5);

           for (inti = 0; i < 10; i++) {

                 finalinttemp = i;

                 newScheduledThreadPool.schedule(new Runnable() {

                      publicvoid run() {

                            System.out.println("i:" + temp);

                      }

                 }, 3, TimeUnit.SECONDS);

}

表示延遲3秒執行。

newSingleThreadExecutor

建立一個單執行緒化的執行緒池,它只會用唯一的工作執行緒來執行任務,保證所有任務按照指定順序(FIFO, LIFO, 優先順序)執行。示例程式碼如下:

     ExecutorService newSingleThreadExecutor = Executors.newSingleThreadExecutor();

         for (inti = 0; i < 10; i++) {

              finalintindex = i;

              newSingleThreadExecutor.execute(new Runnable() {

 

                   @Override

                   publicvoid run() {

                       System.out.println("index:" + index);

                       try {

                            Thread.sleep(200);

                       } catch (Exception e) {

                            // TODO: handle exception

                       }

                   }

              });

         }

注意: 結果依次輸出,相當於順序執行各個任務。

執行緒池原理剖析

提交一個任務到執行緒池中,執行緒池的處理流程如下:

1、判斷執行緒池裡的核心執行緒是否都在執行任務,如果不是(核心執行緒空閒或者還有核心執行緒沒有被建立)則建立一個新的工作執行緒來執行任務。如果核心執行緒都在執行任務,則進入下個流程。

2、執行緒池判斷工作佇列是否已滿,如果工作佇列沒有滿,則將新提交的任務儲存在這個工作佇列裡。如果工作佇列滿了,則進入下個流程。

3、判斷執行緒池裡的執行緒是否都處於工作狀態,如果沒有,則建立一個新的工作執行緒來執行任務。如果已經滿了,則交給飽和策略來處理這個任務。

 

自定義執行緒執行緒池

如果當前執行緒池中的執行緒數目小於corePoolSize,則每來一個任務,就會建立一個執行緒去執行這個任務;

如果當前執行緒池中的執行緒數目>=corePoolSize,則每來一個任務,會嘗試將其新增到任務快取佇列當中,若新增成功,則該任務會等待空閒執行緒將其取出去執行;若新增失敗(一般來說是任務快取佇列已滿),則會嘗試建立新的執行緒去執行這個任務;

如果佇列已經滿了,則在匯流排程數不大於maximumPoolSize的前提下,則建立新的執行緒

如果當前執行緒池中的執行緒數目達到maximumPoolSize,則會採取任務拒絕策略進行處理;

如果執行緒池中的執行緒數量大於 corePoolSize時,如果某執行緒空閒時間超過keepAliveTime,執行緒將被終止,直至執行緒池中的執行緒數目不大於corePoolSize;如果允許為核心池中的執行緒設定存活時間,那麼核心池中的執行緒空閒時間超過keepAliveTime,執行緒也會被終止。

public class Test0007 {

 

      public static void main(String[] args) {

           ThreadPoolExecutor executor = new ThreadPoolExecutor(1, 2, 60L, TimeUnit.SECONDS, new ArrayBlockingQueue<>(3));

           for (int i = 1; i <= 6; i++) {

                 TaskThred t1 = new TaskThred("任務" + i);

                 executor.execute(t1);

           }

           executor.shutdown();

      }

}

 

class TaskThred implements Runnable {

      private String taskName;

 

      public TaskThred(String taskName) {

           this.taskName = taskName;

      }

 

      @Override

      public void run() {

           System.out.println(Thread.currentThread().getName()+taskName);

      }

 

}

 

 

 

 

合理配置執行緒池

 

CPU密集

CPU密集的意思是該任務需要大量的運算,而沒有阻塞,CPU一直全速執行。

CPU密集任務只有在真正的多核CPU上才可能得到加速(通過多執行緒),而在單核CPU上,無論你開幾個模擬的多執行緒,該任務都不可能得到加速,因為CPU總的運算能力就那些。

IO密集

IO密集型,即該任務需要大量的IO,即大量的阻塞。在單執行緒上執行IO密集型的任務會導致浪費大量的CPU運算能力浪費在等待。所以在IO密集型任務中使用多執行緒可以大大的加速程式執行,即時在單核CPU上,這種加速主要就是利用了被浪費掉的阻塞時間。

 

接著上一篇探討執行緒池留下的尾巴,如何合理的設定執行緒池大小。

要想合理的配置執行緒池的大小,首先得分析任務的特性,可以從以下幾個角度分析:

1.   任務的性質:CPU密集型任務、IO密集型任務、混合型任務。

2.   任務的優先順序:高、中、低。

3.   任務的執行時間:長、中、短。

4.   任務的依賴性:是否依賴其他系統資源,如資料庫連線等。

性質不同的任務可以交給不同規模的執行緒池執行。

對於不同性質的任務來說,CPU密集型任務應配置儘可能小的執行緒,如配置CPU個數+1的執行緒數,IO密集型任務應配置儘可能多的執行緒,因為IO操作不佔用CPU,不要讓CPU閒下來,應加大執行緒數量,如配置兩倍CPU個數+1,而對於混合型的任務,如果可以拆分,拆分成IO密集型和CPU密集型分別處理,前提是兩者執行的時間是差不多的,如果處理時間相差很大,則沒必要拆分了。

若任務對其他系統資源有依賴,如某個任務依賴資料庫的連線返回的結果,這時候等待的時間越長,則CPU空閒的時間越長,那麼執行緒數量應設定得越大,才能更好的利用CPU。

當然具體合理執行緒池值大小,需要結合系統實際情況,在大量的嘗試下比較才能得出,以上只是前人總結的規律。

 

最佳執行緒數目 = ((執行緒等待時間+執行緒CPU時間)/執行緒CPU時間 )* CPU數目

比如平均每個執行緒CPU執行時間為0.5s,而執行緒等待時間(非CPU執行時間,比如IO)為1.5s,CPU核心數為8,那麼根據上面這個公式估算得到:((0.5+1.5)/0.5)*8=32。這個公式進一步轉化為:

最佳執行緒數目 = (執行緒等待時間與執行緒CPU時間之比 + 1)* CPU數目

可以得出一個結論: 
執行緒等待時間所佔比例越高,需要越多執行緒。執行緒CPU時間所佔比例越高,需要越少執行緒。 
以上公式與之前的CPU和IO密集型任務設定執行緒數基本吻合。

CPU密集型時,任務可以少配置執行緒數,大概和機器的cpu核數相當,這樣可以使得每個執行緒都在執行任務

IO密集型時,大部分執行緒都阻塞,故需要多配置執行緒數,2*cpu核數

作業系統之名稱解釋:

某些程式花費了絕大多數時間在計算上,而其他則在等待I/O上花費了大多是時間,

前者稱為計算密集型(CPU密集型)computer-bound,後者稱為I/O密集型,I/O-bound。

 

相關文章