Java執行緒池詳解

交给时间發表於2024-08-20

Java執行緒池詳解

構造一個執行緒池為什麼需要幾個引數?如果避免執行緒池出現OOM?RunnableCallable的區別是什麼?本文將對這些問題一一解答,同時還將給出使用執行緒池的常見場景和程式碼片段。

基礎知識

Executors建立執行緒池

Java中建立執行緒池很簡單,只需要呼叫Executors中相應的便捷方法即可,比如Executors.newFixedThreadPool(int nThreads),但是便捷不僅隱藏了複雜性,也為我們埋下了潛在的隱患(OOM,執行緒耗盡)。

Executors建立執行緒池便捷方法列表:

方法名 功能
newFixedThreadPool(int nThreads) 建立固定大小的執行緒池
newSingleThreadExecutor() 建立只有一個執行緒的執行緒池
newCachedThreadPool() 建立一個不限執行緒數上限的執行緒池,任何提交的任務都將立即執行

小程式使用這些快捷方法沒什麼問題,對於服務端需要長期執行的程式,建立執行緒池應該直接使用ThreadPoolExecutor的構造方法。沒錯,上述Executors方法建立的執行緒池就是ThreadPoolExecutor

ThreadPoolExecutor構造方法

Executors中建立執行緒池的快捷方法,實際上是呼叫了ThreadPoolExecutor的構造方法(定時任務使用的是ScheduledThreadPoolExecutor),該類構造方法引數列表如下:

// Java執行緒池的完整建構函式
public ThreadPoolExecutor(
  int corePoolSize, // 執行緒池長期維持的執行緒數,即使執行緒處於Idle狀態,也不會回收。
  int maximumPoolSize, // 執行緒數的上限
  long keepAliveTime, TimeUnit unit, // 超過corePoolSize的執行緒的idle時長,
                                     // 超過這個時間,多餘的執行緒會被回收。
  BlockingQueue<Runnable> workQueue, // 任務的排隊佇列
  ThreadFactory threadFactory, // 新執行緒的產生方式
  RejectedExecutionHandler handler) // 拒絕策略

竟然有7個引數,很無奈,構造一個執行緒池確實需要這麼多引數。這些引數中,比較容易引起問題的有corePoolSizemaximumPoolSizeworkQueue以及handler

  • corePoolSizemaximumPoolSize設定不當會影響效率,甚至耗盡執行緒;
  • workQueue設定不當容易導致OOM;
  • handler設定不當會導致提交任務時丟擲異常。

正確的引數設定方式會在下文給出。

執行緒池的工作順序

If fewer than corePoolSize threads are running, the Executor always prefers adding a new thread rather than queuing.
If corePoolSize or more threads are running, the Executor always prefers queuing a request rather than adding a new thread.
If a request cannot be queued, a new thread is created unless this would exceed maximumPoolSize, in which case, the task will be rejected.

corePoolSize -> 任務佇列 -> maximumPoolSize -> 拒絕策略

Runnable和Callable

可以向執行緒池提交的任務有兩種:RunnableCallable,二者的區別如下:

  1. 方法簽名不同,void Runnable.run()V Callable.call() throws Exception
  2. 是否允許有返回值,Callable允許有返回值
  3. 是否允許丟擲異常,Callable允許丟擲異常。

Callable是JDK1.5時加入的介面,作為Runnable的一種補充,允許有返回值,允許丟擲異常。

三種提交任務的方式:

提交方式 是否關心返回結果
Future<T> submit(Callable<T> task)
void execute(Runnable command)
Future<?> submit(Runnable task) 否,雖然返回Future,但是其get()方法總是返回null

如何正確使用執行緒池

避免使用無界佇列

不要使用Executors.newXXXThreadPool()快捷方法建立執行緒池,因為這種方式會使用無界的任務佇列,為避免OOM,我們應該使用ThreadPoolExecutor的構造方法手動指定佇列的最大長度:

ExecutorService executorService = new ThreadPoolExecutor(2, 2, 
                0, TimeUnit.SECONDS, 
                new ArrayBlockingQueue<>(512), // 使用有界佇列,避免OOM
                new ThreadPoolExecutor.DiscardPolicy());

明確拒絕任務時的行為

任務佇列總有佔滿的時候,這是再submit()提交新的任務會怎麼樣呢?RejectedExecutionHandler介面為我們提供了控制方式,介面定義如下:

public interface RejectedExecutionHandler {
    void rejectedExecution(Runnable r, ThreadPoolExecutor executor);
}

執行緒池給我們提供了幾種常見的拒絕策略:
undefined

拒絕策略 拒絕行為
AbortPolicy 丟擲RejectedExecutionException
DiscardPolicy 什麼也不做,直接忽略
DiscardOldestPolicy 丟棄執行佇列中最老的任務,嘗試為當前提交的任務騰出位置
CallerRunsPolicy 直接由提交任務者執行這個任務

執行緒池預設的拒絕行為是AbortPolicy,也就是丟擲RejectedExecutionHandler異常,該異常是非受檢異常,很容易忘記捕獲。如果不關心任務被拒絕的事件,可以將拒絕策略設定成DiscardPolicy,這樣多餘的任務會悄悄的被忽略。

ExecutorService executorService = new ThreadPoolExecutor(2, 2, 
                0, TimeUnit.SECONDS, 
                new ArrayBlockingQueue<>(512), 
                new ThreadPoolExecutor.DiscardPolicy());// 指定拒絕策略

獲取處理結果和異常

執行緒池的處理結果、以及處理過程中的異常都被包裝到Future中,並在呼叫Future.get()方法時獲取,執行過程中的異常會被包裝成ExecutionExceptionsubmit()方法本身不會傳遞結果和任務執行過程中的異常。獲取執行結果的程式碼可以這樣寫:

ExecutorService executorService = Executors.newFixedThreadPool(4);
Future<Object> future = executorService.submit(new Callable<Object>() {
        @Override
        public Object call() throws Exception {
            throw new RuntimeException("exception in call~");// 該異常會在呼叫Future.get()時傳遞給呼叫者
        }
    });
    
try {
  Object result = future.get();
} catch (InterruptedException e) {
  // interrupt
} catch (ExecutionException e) {
  // exception in Callable.call()
  e.printStackTrace();
}

上述程式碼輸出類似如下:
undefined

執行緒池的常用場景

正確構造執行緒池

int poolSize = Runtime.getRuntime().availableProcessors() * 2;
BlockingQueue<Runnable> queue = new ArrayBlockingQueue<>(512);
RejectedExecutionHandler policy = new ThreadPoolExecutor.DiscardPolicy();
executorService = new ThreadPoolExecutor(poolSize, poolSize,
    0, TimeUnit.SECONDS,
            queue,
            policy);

獲取單個結果

submit()向執行緒池提交任務後會返回一個Future,呼叫V Future.get()方法能夠阻塞等待執行結果,V get(long timeout, TimeUnit unit)方法可以指定等待的超時時間。

獲取多個結果

如果向執行緒池提交了多個任務,要獲取這些任務的執行結果,可以依次呼叫Future.get()獲得。但對於這種場景,我們更應該使用ExecutorCompletionService,該類的take()方法總是阻塞等待某一個任務完成,然後返回該任務的Future物件。向CompletionService批量提交任務後,只需呼叫相同次數的CompletionService.take()方法,就能獲取所有任務的執行結果,獲取順序是任意的,取決於任務的完成順序:

void solve(Executor executor, Collection<Callable<Result>> solvers)
   throws InterruptedException, ExecutionException {
   
   CompletionService<Result> ecs = new ExecutorCompletionService<Result>(executor);// 構造器
   
   for (Callable<Result> s : solvers)// 提交所有任務
       ecs.submit(s);
       
   int n = solvers.size();
   for (int i = 0; i < n; ++i) {// 獲取每一個完成的任務
       Result r = ecs.take().get();
       if (r != null)
           use(r);
   }
}

單個任務的超時時間

V Future.get(long timeout, TimeUnit unit)方法可以指定等待的超時時間,超時未完成會丟擲TimeoutException

多個任務的超時時間

等待多個任務完成,並設定最大等待時間,可以通過CountDownLatch完成:

public void testLatch(ExecutorService executorService, List<Runnable> tasks) 
    throws InterruptedException{
      
    CountDownLatch latch = new CountDownLatch(tasks.size());
      for(Runnable r : tasks){
          executorService.submit(new Runnable() {
              @Override
              public void run() {
                  try{
                      r.run();
                  }finally {
                      latch.countDown();// countDown
                  }
              }
          });
      }
      latch.await(10, TimeUnit.SECONDS); // 指定超時時間
  }

執行緒池和裝修公司

以運營一裝潢修公司做個比喻。公司在辦公地點等待客戶來提交裝修請求;公司有固定數量的正式工以維持運轉;旺季業務較多時,新來的客戶請求會被排期,比如接單後告訴使用者一個月後才能開始裝修;當排期太多時,為避免使用者等太久,公司會通過某些渠道(比如人才市場、熟人介紹等)僱傭一些臨時工(注意,招聘臨時工是在排期排滿之後);如果臨時工也忙不過來,公司將決定不再接收新的客戶,直接拒單。

執行緒池就是程式中的“裝修公司”,代勞各種髒活累活。上面的過程對應到執行緒池上:

// Java執行緒池的完整建構函式
public ThreadPoolExecutor(
  int corePoolSize, // 正式工數量
  int maximumPoolSize, // 工人數量上限,包括正式工和臨時工
  long keepAliveTime, TimeUnit unit, // 臨時工遊手好閒的最長時間,超過這個時間將被解僱
  BlockingQueue<Runnable> workQueue, // 排期佇列
  ThreadFactory threadFactory, // 招人渠道
  RejectedExecutionHandler handler) // 拒單方式

總結

Executors為我們提供了構造執行緒池的便捷方法,對於伺服器程式我們應該杜絕使用這些便捷方法,而是直接使用執行緒池ThreadPoolExecutor的構造方法,避免無界佇列可能導致的OOM以及執行緒個數限制不當導致的執行緒數耗盡等問題。ExecutorCompletionService提供了等待所有任務執行結束的有效方式,如果要設定等待的超時時間,則可以通過CountDownLatch完成。

參考

ThreadPoolExecutor API Doc

相關文章