Java後端開發中的任務排程：使用Spring Batch實現批處理

省赚客开发者团队發表於2024-09-21

原文網址 : https://www.cnblogs.com/szk123456/p/18424592

Java後端開發中的任務排程：使用Spring Batch實現批處理

大家好，我是微賺淘客返利系統3.0的小編，是個冬天不穿秋褲，天冷也要風度的程式猿！在現代企業應用中，批處理是處理大規模資料的重要方式。Spring Batch為我們提供了強大的工具來實現批處理任務。本文將詳細介紹如何使用Spring Batch進行任務排程，並實現批處理的完整流程。

一、Spring Batch概述

Spring Batch是一個輕量級的批處理框架，它提供了建立和執行批處理作業的功能。其主要特點包括：

分塊處理：將大資料集拆分為較小的塊進行處理。
事務管理：確保批處理中的每個步驟都具有原子性。
重試機制：在處理失敗時能夠自動重試。

二、專案搭建

首先，在pom.xml中新增Spring Batch和相關依賴：

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-batch</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-jpa</artifactId>
</dependency>
<dependency>
    <groupId>mysql</groupId>
    <artifactId>mysql-connector-java</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-web</artifactId>
</dependency>

接下來，在application.yml中配置資料來源和Spring Batch的基本屬性：

spring:
  datasource:
    url: jdbc:mysql://localhost:3306/batch_db
    username: root
    password: password
  batch:
    job:
      enabled: true

三、建立實體類

在這個示例中，我們將處理使用者資料。建立一個使用者實體類：

package cn.juwatech.entity;

import javax.persistence.Entity;
import javax.persistence.GeneratedValue;
import javax.persistence.GenerationType;
import javax.persistence.Id;

@Entity
public class User {

    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;
    private String name;
    private String email;

    // Getters and Setters
}

四、建立ItemReader、ItemProcessor和ItemWriter

Spring Batch的核心元件是ItemReader、ItemProcessor和ItemWriter。首先，建立一個使用者讀取器：

package cn.juwatech.batch;

import cn.juwatech.entity.User;
import org.springframework.batch.item.ItemReader;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;

import java.util.Iterator;
import java.util.List;

@Component
public class UserItemReader implements ItemReader<User> {

    private Iterator<User> userIterator;

    @Autowired
    private UserRepository userRepository;

    @Override
    public User read() throws Exception {
        if (userIterator == null) {
            List<User> users = userRepository.findAll();
            userIterator = users.iterator();
        }
        return userIterator.hasNext() ? userIterator.next() : null;
    }
}

然後，建立一個使用者處理器：

package cn.juwatech.batch;

import cn.juwatech.entity.User;
import org.springframework.batch.item.ItemProcessor;
import org.springframework.stereotype.Component;

@Component
public class UserItemProcessor implements ItemProcessor<User, User> {

    @Override
    public User process(User user) throws Exception {
        // 在這裡進行資料轉換或處理
        user.setEmail(user.getEmail().toLowerCase());
        return user;
    }
}

最後，建立一個使用者寫入器：

package cn.juwatech.batch;

import cn.juwatech.entity.User;
import cn.juwatech.repository.UserRepository;
import org.springframework.batch.item.ItemWriter;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;

import java.util.List;

@Component
public class UserItemWriter implements ItemWriter<User> {

    @Autowired
    private UserRepository userRepository;

    @Override
    public void write(List<? extends User> users) throws Exception {
        userRepository.saveAll(users);
    }
}

五、配置Job和Step

接下來，配置Spring Batch的Job和Step：

package cn.juwatech.batch;

import org.springframework.batch.core.Step;
import org.springframework.batch.core.configuration.annotation.EnableBatchProcessing;
import org.springframework.batch.core.configuration.annotation.JobBuilderFactory;
import org.springframework.batch.core.configuration.annotation.StepBuilderFactory;
import org.springframework.batch.core.launch.support.RunIdIncrementer;
import org.springframework.batch.core.scope.context.ChunkContext;
import org.springframework.batch.core.step.tasklet.Tasklet;
import org.springframework.batch.core.Job;
import org.springframework.context.annotation.Bean;
import org.springframework.stereotype.Component;

@Component
@EnableBatchProcessing
public class BatchConfig {

    @Autowired
    private JobBuilderFactory jobBuilderFactory;

    @Autowired
    private StepBuilderFactory stepBuilderFactory;

    @Autowired
    private UserItemReader userItemReader;

    @Autowired
    private UserItemProcessor userItemProcessor;

    @Autowired
    private UserItemWriter userItemWriter;

    @Bean
    public Job importUserJob() {
        return jobBuilderFactory.get("importUserJob")
                .incrementer(new RunIdIncrementer())
                .flow(step1())
                .end()
                .build();
    }

    @Bean
    public Step step1() {
        return stepBuilderFactory.get("step1")
                .<User, User>chunk(10)
                .reader(userItemReader)
                .processor(userItemProcessor)
                .writer(userItemWriter)
                .listener(new StepExecutionListener() {
                    @Override
                    public ExitStatus afterStep(StepExecution stepExecution) {
                        // 執行後的邏輯
                        return null;
                    }
                })
                .build();
    }
}

六、建立Job啟動控制器

我們可以建立一個控制器來啟動Job：

package cn.juwatech.controller;

import org.springframework.batch.core.Job;
import org.springframework.batch.core.launch.JobLauncher;
import org.springframework.batch.core.launch.support.RunIdIncrementer;
import org.springframework.batch.core.repository.JobRepository;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
public class JobController {

    @Autowired
    private JobLauncher jobLauncher;

    @Autowired
    private Job job;

    @PostMapping("/runJob")
    public String runJob() {
        try {
            jobLauncher.run(job, new JobParametersBuilder().addLong("time", System.currentTimeMillis()).toJobParameters());
            return "Job executed successfully";
        } catch (Exception e) {
            e.printStackTrace();
            return "Job execution failed";
        }
    }
}

七、測試批處理

在應用執行後，可以使用Postman向/runJob傳送POST請求，觸發批處理任務。批處理將從資料庫中讀取使用者資料，進行處理，並寫入回資料庫。

八、常見問題及最佳化

在實際使用中，可能會遇到一些問題，比如：

效能問題：可以透過調整chunk大小來最佳化效能。
錯誤處理：可以在ItemProcessor中新增異常處理機制。
任務排程：結合Spring Scheduler，可以定時執行批處理任務。

總結

透過Spring Batch，我們可以輕鬆地實現任務排程與批處理，處理大規模資料集。本文詳細介紹瞭如何配置、實現和排程批處理任務，希望能為您的開發提供參考與幫助。

本文著作權歸聚娃科技微賺淘客系統開發者團隊，轉載請註明出處！

使用Kafka分割槽擴充套件Spring Batch大資料排程批處理 – Arnold
2022-03-31
Kafka套件SpringBAT大資料
Spring Boot 之 Spring Batch 批處理實踐
2020-05-16
Spring BootBAT
使用Java實現定時任務排程
2024-07-15
Java
如何在Java中實現非同步任務排程？
2024-07-09
Java非同步
基於任務排程的企業級分散式批處理方案
2022-06-08
分散式
《Spring Batch 權威指南》之“批處理和 Spring”
2021-02-02
SpringBAT
Spring Batch 基本的批處理指導原則
2019-01-13
SpringBAT
Spring 指南（排程任務）
2019-01-19
Spring
Spring Boot Quartz 分散式叢集任務排程實現
2019-06-21
Spring Bootquartz分散式
如何使用Rust的gaffer實現優先順序的微批處理排程器 - njk
2021-12-02
Rust
Spring排程定時任務的方式
2019-01-13
Spring
深入 Java Timer 定時任務排程器實現原理
2018-12-17
Java
Spring Boot應用中進行任務排程
2019-04-04
Spring Boot
一文輕鬆搞定批處理框架 Spring Batch
2018-07-06
框架SpringBAT
配置 Spring Batch 批處理失敗重試機制
2020-12-11
SpringBAT
Java中的任務超時處理
2024-10-07
Java
任務排程並行演算法的Java簡單實現
2018-04-08
並行演算法Java
使用FUTURE 中的訊息避免計劃排程的批處理作業 - CodeOpinion
2022-07-05
Spring中實現面向寫入的批次和批處理API
2024-06-14
SpringAPI
Spark中資源排程和任務排程
2021-11-12
Spark
批處理作業排程-分支界限法
2021-09-09
基於Hyperf開發的任務排程系統.支援任務投遞,DAG任務編排(多個任務使用同一個事務).
2021-03-29
Java多執行緒並行處理任務的實現
2019-04-20
Java執行緒並行
任務排程
2018-11-24
關於使用 go cron 庫（任務排程）平滑關閉的實現
2021-11-13
Go
celery 與 flask 實現非同步任務排程
2021-03-08
Flask非同步
Spring Boot整合Spring Cloud Task實現批處理操作
2024-08-16
Spring BootCloud
Android 中的定時任務排程
2019-03-04
Android
SpringBoot自定義starter開發分散式任務排程實踐
2022-07-08
Spring Boot分散式
java當中的批處理
2020-04-06
Java
Dynamics 365 Web API 批處理(batch requests)
2018-06-11
WebAPIBAT
Java中的定時任務最佳化：從Cron表示式到高精度排程的實現
2024-09-08
Java
實戰Spring Boot 2.0系列(四) – 使用WebAsyncTask處理非同步任務
2019-03-02
Spring BootWeb非同步
實戰Spring Boot 2.0系列(四) - 使用WebAsyncTask處理非同步任務
2018-06-18
Spring BootWeb非同步
Airflow 任務排程
2024-04-24
AI
Laravel 任務排程
2019-11-26
Laravel
使用RestCloud ETL Shell元件實現定時排程DataX離線任務
2022-06-22
RESTCloud元件
聊聊PowerJob的任務排程
2024-02-15

Java後端開發中的任務排程：使用Spring Batch實現批處理

相關文章