背景

接上篇文章,继续来辨析一下这些技术概念:

  1. Spring Task,任务调度
  2. Quartz,任务调度框架
  3. Spring Cloud Task,短周期任务管理框架
  4. Spring Batch ,批处理应用构建框架
  5. Spring Cloud Data Flow,构建数据集成和实时数据处理流水线的工具包

任务调度框架

Spring Task 和 Quartz 是两个任务调度框架,都支持 Cron 表达式方式执行周期性的任务,对比如下:

框架名称

厂商

使用方式

集群支持能力

Spring Task

Spring 框架

@Scheduled


Quartz

OpenSymphony开源组织

API


对于包含周期性任务调度的需求,可以选择用这两个框架。

Spring Cloud Task

Spring Cloud Task可以在平台环境中执行短生命周期的应用,并记录这些应用的结果,经由通过消息通知的机制来集成各个tasks。该特性可以让短生命周期的应用像长生命周期的应用一样,组成微服务架构。

本质就是通过 @EnableTask 标签,让某个 SpringBoot 应用的运行过程被记录下来。

Spring Batch

批处理应用构建框架,它不是一个任务调度框架,而是一个定义批处理流程的框架。任务的触发方式有两种,一种是手动触发,另一种定时任务触发。

Spring Batch 与 Spring Cloud Task 一起使用时,可以将批处理任务作为一个短运行期的应用被监控起来。

Spring Batch + Spring Cloud Task ,监控批处理任务。

Spring Batch + 任务调度框架,定期触发批处理任务,这是比较常见的使用组合,因为批处理任务的本质就是基于时间消息驱动应用。

Spring Cloud Data Flow

Spring Cloud Task 是 Spring Cloud Data Flow 的一个基础模块。构建数据流应用时,
Spring Cloud Data Flow 的数据处理有两种模式,分别是 Streaming 流式处理和 Batch 批次处理。

Streaming 处理模块是基于消息驱动的、长时间一直存在,数据来了就处理,没来就等着。

Batch 是处理时间较短应用,启动一次处理一次,处理完就退出任务,需要手动或自动触发任务,这类应用可以用 Spring Batch 或 Spring Cloud Task 构建。

启示录

这几个技术直接可能会组合使用,仔细辨析一下,还是比较容易区分的。

再次总结一下各自的用法:

  1. 定时任务调度框架:Spring Task ,Quartz。
  2. 可监控的短运行期的应用构建框架:Spring Cloud Task。
  3. 批处理流程定义框架:Spring Batch,集成任务调度框架可以实现定时批处理任务运行;集成 Spring Cloud Task ,实现可监控的批处理应用。
  4. 实时数据流应用构建框架: Spring Cloud Data Flow,它可以集成 Spring Cloud Task 和 Spring Batch 的应用。