給面試加點硬菜：延遲任務場景，該如何提高吞吐量和時效性！

小傅哥發表於2022-02-15

原文網址 : https://segmentfault.com/a/1190000041404709

作者：小傅哥
部落格：https://bugstack.cn

沉澱、分享、成長，讓自己和他人都能有所收穫！?

一、前言

不捲了，能用就行！

哈哈哈，說好的不捲了，能湊活用就行了。但每次接到新需求時都手癢，想結合著上一次的架構設計和落地經驗，在這一次需求上在迭代更新，或者找到完全顛覆之前的更優方案。卷完程式碼的那一刻總是神清氣爽

其實大部分喜歡寫程式碼的一類純粹碼農，都是比較卷的，就比如一個需求在實現上是能用大概是P5、如果這個做出來的功能不只是能用還非常好用是P6、除了好用還凝練共性需求開發成通用的元件服務是P7。每一個成長過來的碼農，都是在造輪子的路上一次次驗證自己的想法和加以實踐，絕對不是一篇篇的八股文就能累出來一個高階的技術大牛。

二、延遲任務場景

什麼是延遲任務？

當我們的實際業務需求場景中，有一些活動開始前的狀態變更、訂單結算後的T+1對賬、貸款單息費的產生，都是需要使用到延遲任務來進行觸達。實際的操作一般會有 Quartz、Schedule 來對你的庫表資料進行定時掃描和處理，當條件滿足後做資料狀態的變更或者產生新的資料插入到表中。

這樣一個簡單的需求就是延遲任務最初需求，如果需求前期內容較少、使用方不多，可能在實際開發中就只是一個單臺機器直接對著表一頓輪訓就完事了。但隨著業務需求的發展和功能的複雜度提升，往往反饋到研發設計和實現，就不那麼簡單了，比如：你需要保障儘可能低延遲完成較大規模的資料量掃描處理，否則就像貸款單息費的產生，已經到了第二天使用者還沒看到自己的息費資訊或者是還款後的重新對賬，可能就這個時候就要產生客訴了。

那麼，類似這樣的場景該如何設計呢？

三、延遲任務設計

通常的任務中心處理流程主要，主要是由定時任務掃描任務庫表，把即將達到超時時間的任務資訊掃描到處理佇列(記憶體/MQ訊息)，再由業務系統進行處理任務，處理完成後更新庫表中的任務狀態。

高延時任務排程

問題：

海量資料規模較大的任務列表資料，在分庫分表下該需要快速掃描。
任務掃描服務與業務邏輯處理，耦合在一起，不具有通用性和複用性。
細分任務體系有些是需要低延遲處理的，不能等待過長時間。

1. 任務表方式

除了一些較小的狀態變更場景，例如在各自業務的庫表中，就包含了一個狀態欄位，這個欄位一方面有程式邏輯處理變更的狀態，也有到達指定到期時間後由任務服務自動變更處理的操作，一般這類功能，直接設計到自己的庫表中即可。

那麼還有一些較大也較為頻繁使用的場景，如果都是在每個系統的各自所需的N多個表中，都新增這樣的欄位進行維護，就顯得非常冗餘了，也不那麼易於維護。所以針對這樣的場景就很適合做一個通用的任務延時系統，各業務系統把需要被延時執行的動作提交到延時系統中，再有延時系統在指定時間下進行回撥，回撥的動作可以是介面或者MQ訊息進行觸達。例如可以設計這樣一個任務排程表：

任務排程庫表設計

抽取的任務排程表，主要是拿到什麼任務，在什麼時間發起動作，具體的動作處理仍交給業務工程處理。
大批量的各自業務的任務進行集中處理，則需要設計一個分庫分表，滿足於後續業務體量的增長。
門牌號設計，針對一張表的掃描，如果資料量較大，又不希望只是一個任務掃描一個表，可以多個任務掃描一個表，加到掃描的體量。這個時候就需要一個門牌號來隔離不同任務掃描的範圍，避免掃描出重複的任務資料。

2. 低延遲方式

低延遲處理方案，是在任務表方式的基礎上，新增加的時間把控處理。它可以把即將到期的前一段時間的任務，放置到 Redis 叢集隊裡中，在消費的時候再從佇列中 pop 出來，這樣可以更快的接近任務的處理時效，避免因為掃庫間隔較大延遲任務執行。

任務處理流程

在接收業務系統提交進來的延遲任務時，按照執行時間的長短放置到任務庫或者也同步到 Redis 叢集中，一些執行時間較晚的任務則可以先放到任務庫，再通過掃描的方式新增到超時任務執行佇列中。
那麼關於這塊的設計核心在於 Redis 佇列的使用，以及為了保證消費的可靠性需要引入二階段消費、註冊 ZK 註冊中心至少保證一次消費的處理。本文重點主要放在 Redis 佇列的設計，其他更多的邏輯處理，可以按照業務需求進行擴充套件和完善

Redis 消費佇列

Redis 消費佇列

按照訊息體計算對應資料所屬的槽位 index = CRC32 & 7
StoreQueue 採用 Slot 按照 SlotKey = #{topic}_#{index} 和 Sorted Set 的資料結構按執行任務分數排序，存放任務執行資訊。定時訊息將時間戳作為分數，消費時每次彈出分數小於當前時間戳的一個訊息
為了保障每條訊息至少可消費一次，消費者不是直接 pop 有序集合中的元素，而是將元素從 StoreQueue 移動到 PrepareQueue 並返回訊息給消費者。消費成功後再從 PrepareQueue 從刪除，如果消費失敗則從PreapreQueue 重新移動到 StoreQueue，這樣二階段消費的方式進行處理。
參考文件：2021 阿里技術人的百寶黑皮書PDF文，低延遲的超時中心實現方式

簡單案例

@Test
public void test_delay_queue() throws InterruptedException {
    RBlockingQueue<Object> blockingQueue = redissonClient.getBlockingQueue("TASK");
    RDelayedQueue<Object> delayedQueue = redissonClient.getDelayedQueue(blockingQueue);
    new Thread(() -> {
        try {
            while (true){
                Object take = blockingQueue.take();
                System.out.println(take);
                Thread.sleep(10);
            }
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }).start();
    int i = 0;
    while (true){
        delayedQueue.offerAsync("測試" + ++i, 100L, TimeUnit.MILLISECONDS);
        Thread.sleep(1000L);
    }
}

測試資料

2022-02-13  WARN 204760 --- [      Finalizer] i.l.c.resource.DefaultClientResources    : io.lettuce.core.resource.DefaultClientResources was not shut down properly, shutdown() was not called before it's garbage-collected. Call shutdown() or shutdown(long,long,TimeUnit) 
測試1
測試2
測試3
測試4
測試5

Process finished with exit code -1

原始碼：https://github.com/fuzhengwei/TimeOutCenter
描述：使用 redisson 中的 DelayedQueue 作為訊息佇列，寫入後等待消費時間進行 POP 消費。

四、總結

排程任務的使用在實際的場景中非常頻繁，例如我們經常使用 xxl-job，也有一些大廠自研的分散式任務排程元件，這些可能原本都是很小很簡單的功能，但經過抽象、整合、提煉，變成了一個個核心通用的中介軟體服務。
當我們在考慮使用任務排程的時候，無論哪種方式的設計和實現，都需要考慮這個功能使用時候的以為迭代和維護性，如果僅僅是一個非常小的場景，又沒多少人使用的話，那麼在自己機器上折騰就可以。過渡的設計和使用有時候也會把研發資源代入泥潭
其實各項技術的知識點，都像是一個個工具，刀槍棍棒斧鉞鉤，那能怎麼結合各自的特點，把這些兵器用起來，才是一個程式設計師不斷成長的過程。如果你希望瞭解更多此類有深度的技術內容，可以加入 Lottery 分散式抽獎秒殺系統學習更有價值的更抗用的實戰手段。

五、系列推薦

go-zero 如何應對海量定時/延遲任務？
2020-10-09
Go
Android非同步、延遲和定時任務的簡易用法
2019-01-18
Android非同步
基於rabbitmq延遲外掛實現分散式延遲任務
2022-01-12
MQ分散式
Linux面試題-定時任務有哪些知識點？
2020-12-01
Linux面試題
邦芒攻略：面試遲到該如何補救
2023-11-06
面試
Node.js結合RabbitMQ延遲佇列實現定時任務
2021-09-09
Node.jsMQ佇列
Python中排隊理論：吞吐量與延遲
2024-06-07
Python
Linux系統中延時任務及定時任務
2020-12-15
Linux
如何提高餐廳點菜效率的思考
2018-03-28
直播短影片原始碼，延遲任務的解決方法
2024-09-21
原始碼
基於訊息佇列（RabbitMQ）實現延遲任務
2022-03-08
佇列MQ
如何利用網路延遲穿越時空
2019-06-13
面試應該知道的任務排程平臺
2019-07-26
面試
Java物件重用如何降低延遲並提高效能 - Minborg
2022-01-15
Java物件
基於REDIS實現延時任務
2019-04-12
Redis
分散式之延時任務方案解析
2018-06-29
分散式
面試中的 ThreadLocal 原理和使用場景
2019-07-27
面試thread
Apache Pulsar 與 Kafka 效能比較：延遲性（測試方法）
2021-11-24
ApacheKafka
5G機遇 | 如何解決在核心場景的高併發、超低延遲需求？
2021-02-02
大量索引場景下 Easysearch 和 Elasticsearch 的吞吐量差異
2023-11-25
索引Elasticsearch
【高併發】面試官：講講高併發場景下如何優化加鎖方式？
2020-10-15
面試優化
移動端300ms點選延遲和點選穿透
2018-07-04
穿透
面試官：你知道哪些事務失效的場景？
2020-04-19
面試
Linux定時任務內容有哪些知識點？linux學習面試題
2020-11-24
Linux面試題
使用交叉點觀察器延遲載入影象以提高效能【譯】
2018-03-30
Timestone：Netflix 的高吞吐量、低延遲優先佇列系統
2022-09-30
佇列
幾種實現延時任務的方式（一）
2019-03-04
優雅實現延時任務之Redis篇
2018-09-13
Redis
【c#】分享一個簡易的基於時間輪排程的延遲任務實現
2022-12-30
C#
實現簡單延遲佇列和分散式延遲佇列
2020-04-18
佇列分散式
定時任務應該這麼玩
2021-01-21
給DevOps加點料——融入安全性的DevSecOps
2020-09-07
dev
面試官問你：MYSQL事務和隔離級別，該如何回答
2019-06-25
面試MySql
超低延遲傳輸網路架構在元宇宙場景的應用
2022-05-11
架構元宇宙
打破延遲，實時同步不再難！
2024-12-05
goldengate抽取程式延遲90小時
2021-11-19
Go
前向渲染和延遲渲染
2024-04-12
如何建立 Laravel 延遲載入的服務提供者
2019-04-18
Laravel