关于Kettle版本信息同第三弹,这里我就不再说明。

对于在作业中,大家所经常使用到的是组件如“START”、“Truncate tables”、“Job”、“Transformation”、“Success”、“Mail”、“SQL”等。本弹就不一一详细讲解。如有需要了解更多,详见【Kettle学习手册】。

 

开始(Start)

屏幕截图

kettle REST client 数组 kettle常用组件_kettle从零开始

图标

kettle REST client 数组 kettle常用组件_kettle_02

功能说明

Start 是任务执行的入口,首先必须是任务可以执行。只有无条件的任务条目可以从Start入口连接。注:大家在开始过程当中最好只把它当成一个入口组件,不要使用它来做定时任务计划之类的工作,如果做定时任务有产生JAVA JVM内存溢出,这是一个BUG,在Kettle官网也说明不提倡使用此组件来做定时任务。


裁剪表(Truncate tables)

屏幕截图

kettle REST client 数组 kettle常用组件_kettle_03

图标

kettle REST client 数组 kettle常用组件_kettle从零开始_04

功能说明

用来清空指定表中所有数据组件,类似与Oracle中Truncate语法。

组件说明

选项

描述

Job entry name

步骤的名称,在单一的步骤中,名称必需唯一

数据库连接

读取数据的数据库连接

Previous results to args

通过上一步骤参数传递到此步骤使用

Tables name

填写需要清空的表名

Schema name

表名的模式名


转换(Transformation)

屏幕截图

kettle REST client 数组 kettle常用组件_入门_05

图标

kettle REST client 数组 kettle常用组件_入门_06

功能说明

此转换组件是用来执行已经定义好的转换。

组件说明

选项

描述

Job名称

任务条目的名称,在单个任务中,必须唯一

转换名称

需要运行的转换的名称

资源库路径

指定资源库目录中的文件名

转换文件名

如果你不是使用资源库工作,就指定转换运行的 XML文件名

指定文件日志

检查是否为转换指定一个单独的日志文件

Apped logfile

是否以追加的方式写入日志文件

日志文件名

日志文件的目录和名称

日志文件后缀名

文件名扩展(例如:log或者 txt)

日志文件包含日期

文件名中添加系统日期

日志文件包含时间

文件名中添加系统时间

日志级别

日志级别

复制以前结果到参数

复制以前结果到参数

Copy previous  results to parameters

上一次的转换结果复制到参数中

执行每一行输入行

支持循环,根据参数结果集执行每一行参数

在执行之前清除结果行列表

在转换运行之前,检查确保列表或结果行已经被清除

在执行之前清除结果文件列表

在转换运行之前,检查确保列表或结果文件已经被清除

在集群模式下运行这个转换

是否使用集群模式运行转换

Remote save  server

执行集群节点服务器

 

执行SQL脚本(Execute SQL scripts)

屏幕截图

kettle REST client 数组 kettle常用组件_日志文件_07

图标

kettle REST client 数组 kettle常用组件_入门_08

功能说明

使用 SQL任务条目执行 SQL 脚本,多行脚本之前用“;”隔开。

组件说明

选项

描述

作业项名称

任务条目的名称,在单个任务中,必须唯一

数据库连接

数据库连接名称

从文件中得到的

是否指定以文件形式执行SQL

SQL文件名

指定SQL文件完整路径

使用变量替换

如果SQL脚本中有使用到变量需要勾选

SQL脚本

要执行的 SQL 脚本

 

作业(Job)

屏幕截图

kettle REST client 数组 kettle常用组件_kettle从零开始_09

图标

kettle REST client 数组 kettle常用组件_日志文件_10

功能说明

此作业组件是用来执行已经定义好的作业,切勿设计死循环。

组件说明

选项

描述

作业项名称

作业名称,在单个任务中,必须唯一

作业名称

需要运行的作业的名称

资源库路径

指定资源库目录中的文件名

作业文件名

如果你不是使用资源库工作,就指定作业运行的 XML文件名

指定文件日志

检查是否为转换指定一个单独的日志文件

Apped logfile

是否以追加的方式写入日志文件

日志文件名

日志文件的目录和名称

日志文件后缀名

文件名扩展(例如:log或者 txt)

日志文件包含日期

文件名中添加系统日期

日志文件包含时间

文件名中添加系统时间

日志级别

日志级别

将上一结果作为参数

上一次结果作为参数使用

Copy previous  results to parameters

上一次的转换结果复制到参数中

执行每一行输入行

支持循环,根据参数结果集执行每一行参数

Remote save  server

执行集群节点服务器

 

成功(Success)

屏幕截图

kettle REST client 数组 kettle常用组件_日志文件_11

图标

kettle REST client 数组 kettle常用组件_组件介绍_12

功能说明

此组件用来标识当前作业执行状态,在一个作业中可以有0个或者多个“Success”组件。

 

邮件(Mail)

屏幕截图

kettle REST client 数组 kettle常用组件_kettle_13

图标

kettle REST client 数组 kettle常用组件_入门_14

功能说明

可以使用 Mail任务条目来发送 e-Mail。

组件说明

选项

描述

地址标签

邮件作业名称

邮件作业名称,在单个任务中,必须唯一

目的地址

填写需要发送指定的邮箱地址

抄送

需要抄送人邮箱地址

暗送

需要暗送人邮箱地址

回复名称

邮件回复名称

回复地址

邮件回复地址

Reply to

回复

联系人

在发送邮件内容中显示联系人

联系电话

在发送邮件内容中显示联系人电话

服务器标签

SMTP服务器

SMTP服务器,如163(smtp.163.com)

端口

端口,则是SMTP服务器,如163(25)

用户验证

是否需要用户验证

用户名

RotKang

密码

RotKang

使用安全证

是否需要安全验证

安全连接类型

默认为SSL

邮件消息标签

信息里带日期

在邮箱内容中显示服务器日期

只发邮件注释

在发送邮件内容里只显示注释里的内容

使用HTML邮件格

使用HTML邮件格,目前测试不准确

编码

字符集编码

管理优先级

默认

优先级

默认

重要

默认

主题

邮件主题名称

注释

邮件内容说明

附件标签

带附件

目前测试有问题,勾选无效

文件类型

目前测试有问题

压缩成文件统一格式

目前测试有问题

压缩文件名称

目前测试有问题

注:Mail组件总体来说还是能发送邮件的,但目前还存在一些小问题,估计后续版本会完善。