我會手動建立執行緒,為什麼讓我使用執行緒池?

日拱一兵發表於2020-04-29

| 好看請贊,養成習慣

  • 你有一個思想,我有一個思想,我們交換後,一個人就有兩個思想
  • If you can NOT explain it simply, you do NOT understand it well enough

上一篇文章 面試問我,建立多少個執行緒合適?我該怎麼說 從定性到定量的分析瞭如何建立正確個數的執行緒來最大化利用系統資源(其實就是幾道小學數學題)。通常來講,有了個這個知識點傍身,按需手動建立相應個數的執行緒就好

但是現實中,你也許聽過或者被要求:

儘量避免手動建立執行緒,應使用執行緒池統一管理執行緒

為什麼會有這樣的要求?背後的道理又是怎樣的呢?順著這個經驗理論來推斷,那肯定是手動建立執行緒有缺點

手動建立執行緒有什麼缺點?

  1. 不受控風險
  2. 頻繁建立開銷大

不受控風險

這個缺點,相信你也可以說出一二

系統資源有限,每個人針對不同業務都可以手動建立執行緒,並且建立標準不一樣(比如執行緒沒有名字)。當系統執行起來,所有執行緒都在瘋狂搶佔資源,無組織無紀律,混亂場面可想而知(出現問題,自然也就不可能輕易的發現和解決)

如果有位神奇的小夥伴,為每個請求都建立一個執行緒,當大量請求鋪面而來的時候,這好比一個正規木馬程式,記憶體被無情榨乾耗盡(你無情,你冷酷,你無理取鬧)

另外,過多的執行緒自然也會引起上下文切換的開銷

總的來說,不受控風險很大

頻繁建立開銷大

面試問: 頻繁手動建立執行緒有什麼問題?

答: 開銷大

這貌似是一個不假思索就可以回答出來的正確答案。那我要繼續問了

面試官: 建立一個執行緒幹了什麼就開銷大了?和我們建立一個普通 Java 物件有什麼差別?

答: ... 嗯...啊

按照常規理解 new Thread() 建立一個執行緒和 new Object() 沒有什麼差別。Java中萬物接物件,因為 Thread 的老祖宗也是 Object

如果你真是這麼理解的,說明你對執行緒的生命週期還不是很理解,請回看之前的 Java執行緒生命週期這樣理解挺簡單的

在這篇文章中我們明確說明,new Thread() 在作業系統層面並沒有建立新的執行緒,這是程式語言特有的。真正轉換為作業系統層面建立一個執行緒,還要呼叫作業系統核心的API,然後作業系統要為該執行緒分配一系列的資源

廢話不多說,我們將二者做個對比:

new Object() 過程

Object obj = new Object();

當我需要【物件】時,我就會給自己 new 一個(不知你是否和我一樣),這個過程你應該很熟悉了:

  1. 分配一塊記憶體 M
  2. 在記憶體 M 上初始化該物件
  3. 將記憶體 M 的地址賦值給引用變數 obj

就是這麼簡單

建立一個執行緒的過程

上面已經提到了,建立一個執行緒還要呼叫作業系統核心API。為了更好的理解建立並啟動一個執行緒的開銷,我們需要看看 JVM 在背後幫我們做了哪些事情:

  1. 它為一個執行緒棧分配記憶體,該棧為每個執行緒方法呼叫儲存一個棧幀
  2. 每一棧幀由一個區域性變數陣列、返回值、運算元堆疊和常量池組成
  3. 一些支援本機方法的 jvm 也會分配一個本機堆疊
  4. 每個執行緒獲得一個程式計數器,告訴它當前處理器執行的指令是什麼
  5. 系統建立一個與Java執行緒對應的本機執行緒
  6. 將與執行緒相關的描述符新增到JVM內部資料結構中
  7. 執行緒共享堆和方法區域

這段描述稍稍有點抽象,用資料來說明建立一個執行緒(即便不幹什麼)需要多大空間呢?答案是大約 1M 左右

java -XX:+UnlockDiagnosticVMOptions -XX:NativeMemoryTracking=summary -XX:+PrintNMTStatistics -version

上圖是我用 Java8 的測試結果,19個執行緒,預留和提交的大概都是19000+KB,平均每個執行緒大概需要 1M 左右的大小(Java11的結果完全不同,這個大家自行測試吧)

相信到這裡你已經明白了,對於效能要求嚴苛的現在,頻繁手動建立/銷燬執行緒的代價是非常巨大的,解決方案自然也是你知道的執行緒池了

什麼是執行緒池?

你常見的資料庫連線池,例項池,還有XX池,OO池,各種池,都是一種池化(pooling)思想,簡而言之就是為了最大化收益,並最小化風險,將資源統一在一起管理的思想

Java 也提供了它自己實現的執行緒池模型—— ThreadPoolExecutor。套用上面池化的想象來說,Java執行緒池就是為了最大化高併發帶來的效能提升,並最小化手動建立執行緒的風險,將多個執行緒統一在一起管理的思想

為了瞭解這個管理思想,我們當前只需要關注 ThreadPoolExecutor 構造方法就可以了

public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) {
        if (corePoolSize < 0 ||
            maximumPoolSize <= 0 ||
            maximumPoolSize < corePoolSize ||
            keepAliveTime < 0)
            throw new IllegalArgumentException();
        if (workQueue == null || threadFactory == null || handler == null)
            throw new NullPointerException();
        this.acc = System.getSecurityManager() == null ?
                null :
                AccessController.getContext();
        this.corePoolSize = corePoolSize;
        this.maximumPoolSize = maximumPoolSize;
        this.workQueue = workQueue;
        this.keepAliveTime = unit.toNanos(keepAliveTime);
        this.threadFactory = threadFactory;
        this.handler = handler;
}

這麼複雜的構造方法在JDK中還真是不多見,為了個更形象化的讓大家理解這幾個核心引數,我們以多數人都經歷過的春運(北京——上海)來說明

序號 引數名稱 引數解釋 春運形象說明
1 corePoolSize 表示常駐核心執行緒數,如果大於0,即使本地任務執行完也不會被銷燬 日常固定的列車數輛(不管是不是春運,都要有固定這些車次執行)
2 maximumPoolSize 表示執行緒池能夠容納可同時執行的最大執行緒數 春運客流量大,臨時加車,加車後,總列車次數不能超過這個最大值,否則就會出現排程不開等問題 (結合workqueue)
3 keepAliveTime 表示執行緒池中執行緒空閒的時間,當空閒時間達到該值時,執行緒會被銷燬,只剩下 corePoolSize 個執行緒位置 春運壓力過後,臨時的加車(如果空閒時間超過keepAliveTime)就會被撤掉,只保留日常固定的列車車次數量用於日常運營
4 unit keepAliveTime 的時間單位,最終都會轉換成【納秒】,因為CPU的執行速度槓槓滴 keepAliveTime 的單位,春運以【天】為計算單位
5 workQueue 當請求的執行緒數大於 corePoolSize 時,執行緒進入該阻塞佇列 春運壓力異常大,(達到corePoolSize)也不能滿足要求,所有乘坐請求都會進入該阻塞佇列中排隊, 佇列滿,還有額外請求,就需要加車了
6 threadFactory 顧名思義,執行緒工廠,用來生產一組相同任務的執行緒,同時也可以通過它增加字首名,虛擬機器棧分析時更清晰 比如(北京——上海)就屬於該段列車所有字首,表明列車運輸職責
7 handler 執行拒絕策略,當 workQueue 達到上限,同時也達到 maximumPoolSize 就要通過這個來處理,比如拒絕,丟棄等,這是一種限流的保護措施 workQueue排隊也達到佇列最大上線,maximumPoolSize 就要提示無票等拒絕策略了,因為我們不能加車了,當前所有車次已經滿負載

整體來看就是這樣:

試想,如果有請求就新建一趟列車,請求結束就“銷燬”這趟列車,頻繁往復這樣操作,這樣的代價肯定是不能接受的。

可以看到,使用執行緒池不但能完成手動建立執行緒可以做到的工作,同時也填補了手動執行緒不能做到的空白。歸納起來說,執行緒池的作用包括:

  1. 利用執行緒池管理並服用執行緒,控制最大併發數(手動建立執行緒很難得到保證)
  2. 實現任務執行緒佇列快取策略和拒絕機制
  3. 實現某些與實踐相關的功能,如定時執行,週期執行等(比如列車指定時間執行)
  4. 隔離執行緒環境,比如,交易服務和搜尋服務在同一臺伺服器上,分別開啟兩個執行緒池,交易執行緒的資源消耗明顯要大。因此,通過配置獨立的執行緒池,將較慢的交易服務與搜尋服務個離開,避免個服務執行緒互相影響

相信到這裡,你已經瞭解執行緒池的基本思想了,在使用過程中還是有幾個注意事項要說明一下的

執行緒池使用思想/注意事項

不能忽略的執行緒池拒絕策略

我們很難準確的預測未來的最大併發量,所以定製合理的拒絕策略是必不可少的步驟。預設情況, ThreadPoolExecutor 提供了四種拒絕策略:

  1. AbortPolicy:預設的拒絕策略,會 throw RejectedExecutionException 拒絕
  2. CallerRunsPolicy:提交任務的執行緒自己去執行該任務
  3. DiscardOldestPolicy:丟棄最老的任務,其實就是把最早進入工作佇列的任務丟棄,然後把新任務加入到工作佇列
  4. DiscardPolicy:相當大膽的策略,直接丟棄任務,沒有任何異常丟擲

不同的框架(Netty,Dubbo)都有不同的拒絕策略,我們也可以通過實現 RejectedExecutionHandler 自定義的拒絕策略

對於採用何種策略,具體要看執行的任務重要程度。如果是一些不重要任務,可以選擇直接丟棄;如果是重要任務,可以採用降級(所謂降級就是在服務無法正常提供功能的情況下,採取的補救措施。具體採用何種降級手段,這也是要看具體場景)處理,例如將任務資訊插入資料庫或者訊息佇列,啟用一個專門用作補償的執行緒池去進行補償

沒有絕對的拒絕策略,只有適合那一個,但在設計過程中千萬不要忽略掉拒絕策略就可以

禁止使用Executors建立執行緒池

相信很多人都看到過這個問題(阿里巴巴Java開發手冊說明禁止使用 Executors 建立執行緒池),我把出處(P247)截圖在此:

Executors 大大的簡化了我們建立各種型別執行緒池的方式,為什麼還不讓使用呢?

其實,只要你開啟看看它的靜態方法引數就會明白了

public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
    }

傳入的workQueue 是一個邊界為 Integer.MAX_VALUE 佇列,我們也可以變相的稱之為無界佇列了,因為邊界太大了,這麼大的等待佇列也是非常消耗記憶體的

/**
 * Creates a {@code LinkedBlockingQueue} with a capacity of
 * {@link Integer#MAX_VALUE}.
 */
public LinkedBlockingQueue() {
  this(Integer.MAX_VALUE);
}

另外該 ThreadPoolExecutor方法使用的是預設拒絕策略(直接拒絕),但並不是所有業務場景都適合使用這個策略,當很重要的請求過來直接選擇拒絕顯然是不合適的

public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue) {
        this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
             Executors.defaultThreadFactory(), defaultHandler);
    }

總的來說,使用 Executors 建立的執行緒池太過於理想化,並不能滿足很多現實中的業務場景,所以要求我們通過 ThreadPoolExecutor來建立,並傳入合適的引數

總結

當我們需要頻繁的建立執行緒時,我們要考慮到通過執行緒池統一管理執行緒資源,避免不可控風險以及額外的開銷

瞭解了執行緒池的幾個核心引數概念後,我們也需要經過調優的過程來設定最佳執行緒引數值(這個過程時必不可少的)

執行緒池雖然彌補了手動建立執行緒的缺陷和空白,同時,合理的降級策略能大大增加系統的穩定性

阿里巴巴手冊都是前輩們無數填坑後總結的精華,你也應該遵守相應的指示,結合自己的實際業務場景,設定合適的引數來建立執行緒池

靈魂追問

  1. 我們說了這麼多執行緒池的好,那使用執行緒池有哪些缺點或限制呢?
  2. 為什麼不建議所有業務共用一個執行緒池?有什麼缺點?
  3. 給執行緒池設定指定字首,有哪些方式?

參考

感謝前輩們總結的精華,自己所寫的併發系列好多都參考了以下資料

  • Java 併發程式設計實戰
  • Java 併發程式設計之美
  • 碼出高效
  • Java 併發程式設計的藝術
  • ifeve
  • 美團技術團隊

日拱一兵 | 原創

相關文章