服務重啟了，如何保證執行緒池中的資料不丟失？

苏三说技术發表於2024-08-30

原文網址 : https://www.cnblogs.com/12lisu/p/18388411

大家好，我是蘇三，又跟大家見面了。

前言

最近有位小夥伴在我的技術群裡，問了我一個問題：服務down機了，執行緒池中如何保證不丟失資料？

這個問題挺有意思的，今天透過這篇文章，拿出來跟大家一起探討一下。

1 什麼是執行緒池？

之前沒有執行緒池的時候，我們在程式碼中，建立一個執行緒有兩種方式：

繼承Thread類
實現Runnable介面

雖說透過這兩種方式建立一個執行緒，非常方便。

但也帶來了下面的問題：

建立和銷燬一個執行緒，都是比較耗時，頻繁的建立和銷燬執行緒，非常影響系統的效能。
無限制的建立執行緒，會導致記憶體不足。
有新任務過來時，必須要先建立好執行緒才能執行，不能直接複用執行緒。

為了解決上面的這些問題，Java中引入了：執行緒池。

它相當於一個存放執行緒的池子。

使用執行緒池帶來了下面3個好處：

降低資源消耗。透過重複利用已建立的執行緒降低執行緒建立和銷燬造成的消耗。
提高響應速度。當任務到達時，可以直接使用已有空閒的執行緒，不需要的等到執行緒建立就能立即執行。
提高執行緒的可管理性。執行緒是稀缺資源，如果無限制的建立，不僅會消耗系統資源，還會降低系統的穩定性。而如果我們使用執行緒池，可以對執行緒進行統一的分配、管理和監控。

2 執行緒池原理

先看看執行緒池的構造器：

public ThreadPoolExecutor(
    int corePoolSize,
    int maximumPoolSize,
    long keepAliveTime,
    TimeUnit unit,
    BlockingQueue<Runnable> workQueue,
    ThreadFactory threadFactory,
    RejectedExecutionHandler handler)

corePoolSize：核心執行緒數，執行緒池維護的最少執行緒數。
maximumPoolSize：最大執行緒數，執行緒池允許建立的最大執行緒數。
keepAliveTime：執行緒存活時間，當執行緒數超過核心執行緒數時，多餘的空閒執行緒的存活時間。
unit：時間單位。
workQueue：任務佇列，用於儲存等待執行的任務。
threadFactory：執行緒工廠，用於建立新執行緒。
handler：拒絕策略，當任務無法執行時的處理策略。

執行緒池的核心流程圖如下：

服務重啟了，如何保證執行緒池中的資料不丟失？

執行緒池的工作過程如下：

執行緒池初始化：根據corePoolSize初始化核心執行緒。
任務提交：當任務提交到執行緒池時，根據當前執行緒數判斷：

若當前執行緒數小於corePoolSize，建立新的執行緒執行任務。
若當前執行緒數大於或等於corePoolSize，任務被加入workQueue佇列。

任務處理：當有空閒執行緒時，從workQueue中取出任務執行。
執行緒擴充套件：若佇列已滿且當前執行緒數小於maximumPoolSize，建立新的執行緒處理任務。
執行緒回收：當執行緒空閒時間超過keepAliveTime，多餘的執行緒會被回收，直到執行緒數不超過corePoolSize。
拒絕策略：若佇列已滿且當前執行緒數達到maximumPoolSize，則根據拒絕策略處理新任務。

說白了線上程池中，多餘的任務會被放到workQueue任務佇列中。

這個任務佇列的資料儲存在記憶體中。

這樣就會出現一些問題。

接下來，看看執行緒池有哪些問題。

3 執行緒池有哪些問題？

在JDK中為了方便大家建立執行緒池，專門提供了Executors這個工具類。

3.1 佇列過大

Executors.newFixedThreadPool，它可以建立固定執行緒數量的執行緒池，任務佇列使用的是LinkedBlockingQueue，預設最大容量是Integer.MAX_VALUE。

public static ExecutorService newFixedThreadPool(int nThreads, ThreadFactory threadFactory) {
    return new ThreadPoolExecutor(nThreads, 
                               nThreads,
                                     0L, 
                  TimeUnit.MILLISECONDS,
     new LinkedBlockingQueue<Runnable>(),
                          threadFactory);
}

如果向newFixedThreadPool執行緒池中提交的任務太多，可能會導致LinkedBlockingQueue非常大，從而出現OOM問題。

3.2 執行緒太多

Executors.newCachedThreadPool，它可以建立可緩衝的執行緒池，最大執行緒數量是Integer.MAX_VALUE，任務佇列使用的是SynchronousQueue。

public static ExecutorService newCachedThreadPool() {
  return new ThreadPoolExecutor(0, 
                Integer.MAX_VALUE,
                               60L, 
                  TimeUnit.SECONDS,
    new SynchronousQueue<Runnable>());
}

如果向newCachedThreadPool執行緒池中提交的任務太多，可能會導致建立大量的執行緒，也會出現OOM問題。

3.3 資料丟失

如果執行緒池在執行過程中，服務突然被重啟了，可能會導致執行緒池中的資料丟失。

上面的OOM問題，我們在日常開發中，可以透過自定義執行緒池的方式解決。

比如建立這樣的執行緒池：

new ThreadPoolExecutor(8, 
                       10,
                       30L, 
     TimeUnit.MILLISECONDS,
    new ArrayBlockingQueue<Runnable>(300),
            threadFactory);

自定義了一個最大執行緒數量和任務佇列都在可控範圍內執行緒池。

這樣做基本上不會出現OOM問題。

但執行緒池的資料丟失問題，光靠自身的功能很難解決。

4 如何保證資料不丟失？

執行緒池中的資料，是儲存到記憶體中的，一旦遇到伺服器重啟了，資料就會丟失。

之前的系統流程是這樣的：

服務重啟了，如何保證執行緒池中的資料不丟失？

使用者請求過來之後，先處理業務邏輯1，它是系統的核心功能。

然後再將任務提交到執行緒池，由它處理業務邏輯2，它是系統的非核心功能。

但如果執行緒池在處理的過程中，服務down機了，此時，業務邏輯2的資料就會丟失。

那麼，如何保證資料不丟失呢？

答：需要提前做持久化。

我們最佳化的系統流程如下：

服務重啟了，如何保證執行緒池中的資料不丟失？

使用者請求過來之後，先處理業務邏輯1，緊接著向DB中寫入一條任務資料，狀態是：待執行。

處理業務邏輯1和向DB寫任務資料，可以在同一個事務中，方便出現異常時回滾。

然後有一個專門的定時任務，每個一段時間，按新增時間升序，分頁查詢狀態是待執行的任務。

最早的任務，最先被查出來。

然後將查出的任務提交到執行緒池中，由它處理業務邏輯2。

處理成功之後，修改任務的待執行狀態為：已執行。

需要注意的是：業務邏輯2的處理過程，要做冪等性設計，同一個請求允許被執行多次，其結果不會有影響。

如果此時，執行緒池在處理的過程中，服務down機了，業務邏輯2的資料會丟失。

但此時DB中儲存了任務的資料，並且丟失那些任務的狀態還是：待執行。

在下一次定時任務週期開始執行時，又會將那些任務資料重新查詢出來，重新提交到執行緒池中。

業務邏輯2丟失的資料，又自動回來了。

如果要考慮失敗的情況，還需要在任務表中增加一個失敗次數欄位。

在定時任務的執行緒池中執行業務邏輯2失敗了，在下定時任務執行時可以自動重試。

但不可能無限制的一直重試下去。

當失敗超過了一定的次數，可以將任務狀態改成：失敗。

這樣後續可以人工處理。

最後說一句(求關注，別白嫖我)
如果這篇文章對您有所幫助，或者有所啟發的話，幫忙掃描下發二維碼關注一下，您的支援是我堅持寫作最大的動力。

求一鍵三連：點贊、轉發、在看。
關注公眾號：【蘇三說技術】，在公眾號中回覆：面試、程式碼神器、開發手冊、時間管理有超讚的粉絲福利，另外回覆：加群，可以跟很多BAT大廠的前輩交流和學習。

相關文章

Elasticsearch如何保證資料不丟失？
2021-01-31
Elasticsearch
在 Flink 運算元中使用多執行緒如何保證不丟資料？
2019-12-30
執行緒
Oracle Goldengate是如何保證資料有序和確保資料不丟失的？
2019-07-11
OracleGo
Redis能保證資料不丟失嗎？
2024-02-23
Redis
Elasticsearch 如何保證寫入過程中不丟失資料的
2024-03-12
Elasticsearch
Redis 中如何保證資料的不丟失，Redis 中的持久化是如何進行的
2022-02-09
Redis持久化
優步是如何用Kafka構建可靠的重試處理保證資料不丟失
2018-03-18
Kafka
RabbitMQ-如何保證訊息不丟失
2024-06-12
MQ
執行緒池中多餘的執行緒是如何回收的？
2020-10-31
執行緒
Java 執行緒池中的執行緒複用是如何實現的？
2020-07-11
Java執行緒
kafka 如何保證不重複消費又不丟失資料？
2024-06-20
Kafka
保證執行緒在主執行緒執行
2018-08-08
執行緒
Spark Streaming使用Kafka保證資料零丟失
2018-10-04
SparkKafka
Java中如何保證執行緒順序執行
2021-05-14
Java執行緒
RabbitMq如何確保訊息不丟失
2020-09-29
MQ
BigDecimal為什麼能保證精度不丟失?
2024-06-08
Decimal
關於MQ的幾件小事（四）如何保證訊息不丟失
2019-05-22
MQ
InheritableThreadLocal 線上程池中進行父子執行緒間訊息傳遞出現訊息丟失的解析
2022-06-29
thread執行緒
雲伺服器redis重啟資料丟失如何解決
2021-04-15
伺服器Redis
Java下如何保證多執行緒安全
2021-07-30
Java執行緒
詳解 JUC 執行緒池中的 ThreadPoolExecutor
2020-08-10
執行緒thread
Java執行緒池中的execute和submit
2023-02-01
Java執行緒MIT
Swoole 啟動一個服務，開啟了哪些程式和執行緒？
2019-06-24
執行緒
【Java進階面試系列之四】扎心！線上服務當機時，如何保證資料100%不丟失？【石杉的架構筆記】
2018-12-19
Java面試架構筆記
保證執行緒安全的技術
2023-05-08
執行緒
springboot的服務不需要連線資料庫，如何保證正常啟動
2024-05-20
Spring Boot資料庫
Java實現終止執行緒池中正在執行的定時任務
2019-03-04
Java執行緒
Java 執行緒池獲取池中所有執行緒列表的方法
2024-10-20
Java執行緒
RabbitMQ使用教程（四）如何通過持久化保證訊息99.99%不丟失？
2019-05-30
MQ持久化
執行緒池中的最大執行緒數、核心執行緒數和佇列大小的合理設定
2023-11-01
執行緒佇列
獲取雙非同步返回值時，如何保證主執行緒不阻塞？
2024-01-25
非同步執行緒
訊息推送平臺有沒有保證資料不丟？
2023-05-15
NetApp資料恢復—NetApp儲存池中劃分的卷丟失的資料恢復案例
2024-03-07
APP資料恢復
程式設計規範-父子執行緒必須放在不同的執行緒池中
2024-08-09
程式設計執行緒
Kafka如何保證訊息不丟之無訊息丟失配置
2020-11-26
Kafka
重組raid會丟失資料嗎
2024-07-12
AI
RabbitMQ-如何保證訊息在99.99%的情況下不丟失
2021-09-12
MQ
spring boot 併發請求，其他系統介面，丟失request的header資訊【多執行緒、執行緒池、@Async 】
2021-06-21
Spring BootHeader執行緒