分散式排程任務-ElasticJob

讓我發會呆發表於2021-06-08

原文網址 : https://www.cnblogs.com/yxy-ngu/p/14861358.html

一：問題的引出與復現

在一個風和日麗的工作日，公司運營發現系統的任務資料沒有推送執行，整個流程因此停住了。我立馬遠端登陸伺服器，檢視日誌，好傢伙，系統在瘋狂的列印相同的一段日誌：c.d.d.j.i.e.LeaderElectionService [traceId=] - Elastic job: leader node is electing, waiting for 100 ms at server '192.168.0.6'

第一反應就是基建出問題了，無奈和運營商量，準備重啟專案服務，重啟後，問題立刻解決，業務也正常執行了。

有句話說得好，你覺得可能再次出現的問題，一定會再次出現。忘記了多少天后(開發初期，業務很緊張，這個問題沒有時間及時去處理)，又有別的定時任務也不執行了，出現的問題也是一模一樣。

同一個問題在生產出現了兩次，已經必須要去解決了，首先去網上搜尋下，也有網友遇到過這種問題，但是下面的回覆卻是說：”Elastic job正在選舉主節點，等它選完就正常了。“

先說下當時生產正在用的就是 com.dangdang.elastic-job-core，是噹噹網開源的一個分散式排程的元件，在上家公司三個機器節點做的叢集用了很長時間也重來沒有遇到這個問題，

當時就納悶了，難道是有什麼配置設定的不對，導致它無法正常選主嗎？

然後花了點時間，自己搭了一個專案，準備去仔細分析debug下它的原始碼，在這兒就發現，每次遠端debug的時候，一兩分鐘後，專案日誌就會復現 c.d.d.j.i.e.LeaderElectionService [traceId=] - Elastic job: leader node is electing, waiting for 100 ms at server '192.168.0.6' 。

因此大膽猜測，因為debug導致Elastic job和註冊中心心跳連結超時了，而生產環境的系統也可能因為網路抖動或者IO的壓力，導致這個問題。

二：ElasticJob簡單使用

2020年6月，經過Apache ShardingSphere社群投票，接納ElasticJob為其子專案。目前ElasticJob的四個子專案已經正式遷入Apache倉庫。

http://shardingsphere.apache.org/elasticjob/index_zh.html 最新的3.x版本在開源社群的幫助下，相比之前已經有了很大的優化，當然經過測試，也完美解決了選主的問題。

大致翻閱一下官方文件，下面就準備接入測試下。

引入maven依賴

<dependency>
    <groupId>org.apache.shardingsphere.elasticjob</groupId>
    <artifactId>elasticjob-lite-core</artifactId>
    <version>${latest.release.version}</version>
</dependency>

# Spring 名稱空間，可以與 Spring 容器配合使用

<dependency>
    <groupId>org.apache.shardingsphere.elasticjob</groupId>
    <artifactId>elasticjob-lite-spring-namespace</artifactId>
    <version>3.0.0-beta</version>
</dependency>
# zk的版本要求3.6.0 以上
<dependency>
    <groupId>org.apache.zookeeper</groupId>
    <artifactId>zookeeper</artifactId>
    <version>3.6.2</version>
</dependency>

elasticjob.xml

<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
           xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
           xmlns:elasticjob="http://shardingsphere.apache.org/schema/elasticjob"
           xsi:schemaLocation="http://www.springframework.org/schema/beans
                        http://www.springframework.org/schema/beans/spring-beans.xsd
                        http://shardingsphere.apache.org/schema/elasticjob
                        http://shardingsphere.apache.org/schema/elasticjob/elasticjob.xsd
                        ">

    <elasticjob:zookeeper id="regCenter2" server-lists="${zkHost}" namespace="${elastic.job.namespace}"
                   base-sleep-time-milliseconds="${elastic.job.baseSleepTimeMilliseconds}"
                   max-sleep-time-milliseconds="${elastic.job.maxSleepTimeMilliseconds}" max-retries="${elastic.job.maxRetries}"/>

    <elasticjob:job id="apacheTestJob"
                job-ref="apacheTestJob"
                registry-center-ref="regCenter2" sharding-total-count="${apacheTestJob.shardingTotalCount}"
                cron="${apacheTestJob.cron}"
                failover="${apacheTestJob.failover}" description="${apacheTestJob.description}"
                disabled="${apacheTestJob.disabled}"
                overwrite="${apacheTestJob.overwrite}"
                job-executor-service-handler-type="SINGLE_THREAD"/>

    <bean id="apacheTestJob" class="com.yxy.nova.elastic.job.ApacheTestJob" />

</beans>

可配置屬性：

屬性名	是否必填
id	是
class	否
job-ref	否
registry-center-ref	是
tracing-ref	否
cron	是
sharding-total-count	是
sharding-item-parameters	否
job-parameter	否
monitor-execution	否
failover	否
misfire	否
max-time-diff-seconds	否
reconcile-interval-minutes	否
job-sharding-strategy-type	否
job-executor-service-handler-type	否
job-error-handler-type	否
job-listener-types	否
description	否
props	否
disabled	否
overwrite	否

1：cron 定時執行的表示式

2：sharding-total-count 總的分片數

3：job-sharding-strategy-type 分片策略

可以看它內建的三種策略，說明比較詳細，預設的是平均分片策略。

下面再說說如何自定義分片策略，ElasticJob載入分片策略使用的是JDK的spi (Service Provider Interface)載入的。

要使用SPI比較簡單，只需要按照以下幾個步驟操作即可：

在META-INF/services目錄下建立一個以"介面全限定名"為命名的檔案，內容為實現類的全限定名
介面實現類所在的jar包在classpath下
主程式通過java.util.ServiceLoader動態狀態實現模組，它通過掃描META-INF/services目錄下的配置檔案找到實現類的全限定名，把類載入到JVM
SPI的實現類必須帶一個無參構造方法

首先自定義一個策略類MyJobShardingStrategy，實現 JobShardingStrategy

package com.nova.elastic.job;

import org.apache.shardingsphere.elasticjob.infra.handler.sharding.JobInstance;
import org.apache.shardingsphere.elasticjob.infra.handler.sharding.JobShardingStrategy;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

public class MyJobShardingStrategy implements JobShardingStrategy {

    /**
     * Sharding job.
     *
     * @param jobInstances       all job instances which participate in sharding
     * @param jobName            job name
     * @param shardingTotalCount sharding total count
     * @return sharding result
     */
    @Override
    public Map<JobInstance, List<Integer>> sharding(List<JobInstance> jobInstances, String jobName, int shardingTotalCount) {

        Map<JobInstance, List<Integer>> result = new HashMap<>();
        List<Integer> shardingItems = new ArrayList<>(shardingTotalCount + 1);
        for (int i=0; i<shardingTotalCount; i++) {
            shardingItems.add(i);
        }
        result.put(jobInstances.get(0), shardingItems);
        return result;
    }

    /**
     * Get type.
     *
     * @return type
     */
    @Override
    public String getType() {
        return "MY_TEST";
    }
}

然後我們只需要在自己專案的resources下，建一個META-INF/services的資料夾，再建立以 a介面的全限定名（org.apache.shardingsphere.elasticjob.infra.handler.sharding.JobShardingStrategy），內容則為”com.nova.elastic.job.MyJobShardingStrategy“

這樣ElasticJob的主程式通過java.util.ServiceLoader就可以把我們自定義的策略類載入好。

最後就可以在xml中，job-sharding-strategy-type="MY_TEST"，配置使用自定義的分片策略。

三：存在的問題

我模擬了 1 臺作業伺服器且分片總數為2，則分片結果為：1=[0,1]，然後我再自己的排程任務中列印了 shardingContext，

2021-06-08 16:33:35.029 [] INFO  c.y.n.e.j.ApacheTestJob [traceId=] - ShardingContext(jobName=apacheTestJob-no-repeat, taskId=apacheTestJob-no-repeat@-@0,1@-@READY@-@172.16.0.4@-@23146, shardingTotalCount=2, jobParameter=, shardingItem=0, shardingParameter=null)
2021-06-08 16:33:35.029 [] INFO  c.y.n.e.j.ApacheTestJob [traceId=] - ShardingContext(jobName=apacheTestJob-no-repeat, taskId=apacheTestJob-no-repeat@-@0,1@-@READY@-@172.16.0.4@-@23146, shardingTotalCount=2, jobParameter=, shardingItem=1, shardingParameter=null)

可以看到，在這種配置條件下，ApacheTestJob 是同時執行兩次，只有 shardingItem 有區別，那麼這樣就會存在一個問題，我job的程式碼邏輯就會執行兩次，只不過每次的shardingItem不同而已。

如果業務邏輯需要查詢資料庫，那麼這樣就select了多次，在資料庫有瓶頸的系統下，效率肯定低。

反之，如果在這個配置下，排程任務只被排程一次，但是 ShardingContext 可以儲存一個 shardingItem的列表，這樣就可以解決多次查詢資料庫的問題。

這也是用了這兩種ElasticJob後，感受到的最大的區別。

不知道有沒有正在使用 shardingsphere.elasticjob的小夥伴，你們的系統是如何使用的？有沒有存在相同的疑惑？又是如何解決這個問題的？

分散式任務排程
2019-03-04
分散式
LTS分散式任務排程部署
2019-03-09
分散式
Aloha：一個分散式任務排程框架
2019-03-23
分散式框架
中介軟體---分散式任務排程---Celery
2019-02-17
分散式
micro-job分散式任務排程框架更新
2019-02-22
分散式框架
分散式任務排程平臺XXL-JOB
2019-10-02
分散式
新一代分散式任務排程框架
2023-04-11
分散式框架
分散式任務排程系統設計小結
2022-04-27
分散式
Spring Boot Quartz 分散式叢集任務排程實現
2019-06-21
Spring Bootquartz分散式
開源分散式任務排程系統就選：DolphinScheduler
2023-02-28
分散式
分散式任務排程平臺XXL-JOB快速搭建教程
2020-07-12
分散式
SpringBoot自定義starter開發分散式任務排程實踐
2022-07-08
Spring Boot分散式
任務排程
2018-11-24
帶有分散式鎖的Go計劃任務排程器- DEV
2021-08-04
分散式Godev
整合了這個分散式任務排程平臺，真的很爽~~
2022-03-18
分散式
分散式任務排程內的 MySQL 分頁查詢最佳化
2024-05-24
分散式MySql
Java 分散式任務排程平臺：PowerJob 快速開始+配置詳解
2020-07-15
Java分散式
分散式系統架構之構建你的任務排程中心
2020-07-16
分散式架構
Easy Scheduler 1.0.2 釋出，分散式工作流任務排程系統
2019-04-26
分散式
基於任務排程的企業級分散式批處理方案
2022-06-08
分散式
Airflow 任務排程
2024-04-24
AI
Laravel 任務排程
2019-11-26
Laravel
LiteOS-任務篇-原始碼分析-任務排程函式
2020-10-13
原始碼函式
淺談分散式任務排程系統Celery的設計與實現
2024-03-25
分散式
一個輕量級的分散式定時任務排程平臺-Cloudtask
2018-03-23
分散式Cloud
SchedulerX 如何幫助使用者解決分散式任務排程難題？
2022-02-15
分散式
Spring 指南（排程任務）
2019-01-19
Spring
Spark中資源排程和任務排程
2021-11-12
Spark
SpringBoot專案接入分散式任務排程平臺xxl-job（2.0.2）說明
2024-05-30
Spring Boot分散式
Timer和TimerTask 任務排程
2018-07-09
聊聊PowerJob的任務排程
2024-02-15
Linux 定時任務排程
2021-08-17
Linux
LeetCode 621 任務排程器
2020-12-05
LeetCode
在spring boot中3分鐘上手分散式任務排程系統xxl-job
2019-04-28
Spring Boot分散式
laravel框架任務排程（定時執行任務）
2019-05-11
Laravel框架
Python任務排程模組APScheduler
2019-02-16
Python
分散式任務排程平臺XXL-JOB本地配置可能遇到的問題和解決方案
2020-10-26
分散式
一個簡單的基於 Redis 的分散式任務排程器 —— Java 語言實現
2019-05-29
Redis分散式Java

分散式排程任務-ElasticJob

一：問題的引出與復現

二：ElasticJob簡單使用

三：存在的問題

相關文章