关于Kettle版本信息同第三弹,这里我就不再说明。
对于在作业中,大家所经常使用到的是组件如“START”、“Truncate tables”、“Job”、“Transformation”、“Success”、“Mail”、“SQL”等。本弹就不一一详细讲解。如有需要了解更多,详见【Kettle学习手册】。
开始(Start)
屏幕截图
图标
功能说明
Start 是任务执行的入口,首先必须是任务可以执行。只有无条件的任务条目可以从Start入口连接。注:大家在开始过程当中最好只把它当成一个入口组件,不要使用它来做定时任务计划之类的工作,如果做定时任务有产生JAVA JVM内存溢出,这是一个BUG,在Kettle官网也说明不提倡使用此组件来做定时任务。
裁剪表(Truncate tables)
屏幕截图
图标
功能说明
用来清空指定表中所有数据组件,类似与Oracle中Truncate语法。
组件说明
选项 | 描述 |
Job entry name | 步骤的名称,在单一的步骤中,名称必需唯一 |
数据库连接 | 读取数据的数据库连接 |
Previous results to args | 通过上一步骤参数传递到此步骤使用 |
Tables name | 填写需要清空的表名 |
Schema name | 表名的模式名 |
转换(Transformation)
屏幕截图
图标
功能说明
此转换组件是用来执行已经定义好的转换。
组件说明
选项 | 描述 |
Job名称 | 任务条目的名称,在单个任务中,必须唯一 |
转换名称 | 需要运行的转换的名称 |
资源库路径 | 指定资源库目录中的文件名 |
转换文件名 | 如果你不是使用资源库工作,就指定转换运行的 XML文件名 |
指定文件日志 | 检查是否为转换指定一个单独的日志文件 |
Apped logfile | 是否以追加的方式写入日志文件 |
日志文件名 | 日志文件的目录和名称 |
日志文件后缀名 | 文件名扩展(例如:log或者 txt) |
日志文件包含日期 | 文件名中添加系统日期 |
日志文件包含时间 | 文件名中添加系统时间 |
日志级别 | 日志级别 |
复制以前结果到参数 | 复制以前结果到参数 |
Copy previous results to parameters | 上一次的转换结果复制到参数中 |
执行每一行输入行 | 支持循环,根据参数结果集执行每一行参数 |
在执行之前清除结果行列表 | 在转换运行之前,检查确保列表或结果行已经被清除 |
在执行之前清除结果文件列表 | 在转换运行之前,检查确保列表或结果文件已经被清除 |
在集群模式下运行这个转换 | 是否使用集群模式运行转换 |
Remote save server | 执行集群节点服务器 |
执行SQL脚本(Execute SQL scripts)
屏幕截图
图标
功能说明
使用 SQL任务条目执行 SQL 脚本,多行脚本之前用“;”隔开。
组件说明
选项 | 描述 |
作业项名称 | 任务条目的名称,在单个任务中,必须唯一 |
数据库连接 | 数据库连接名称 |
从文件中得到的 | 是否指定以文件形式执行SQL |
SQL文件名 | 指定SQL文件完整路径 |
使用变量替换 | 如果SQL脚本中有使用到变量需要勾选 |
SQL脚本 | 要执行的 SQL 脚本 |
作业(Job)
屏幕截图
图标
功能说明
此作业组件是用来执行已经定义好的作业,切勿设计死循环。
组件说明
选项 | 描述 |
作业项名称 | 作业名称,在单个任务中,必须唯一 |
作业名称 | 需要运行的作业的名称 |
资源库路径 | 指定资源库目录中的文件名 |
作业文件名 | 如果你不是使用资源库工作,就指定作业运行的 XML文件名 |
指定文件日志 | 检查是否为转换指定一个单独的日志文件 |
Apped logfile | 是否以追加的方式写入日志文件 |
日志文件名 | 日志文件的目录和名称 |
日志文件后缀名 | 文件名扩展(例如:log或者 txt) |
日志文件包含日期 | 文件名中添加系统日期 |
日志文件包含时间 | 文件名中添加系统时间 |
日志级别 | 日志级别 |
将上一结果作为参数 | 上一次结果作为参数使用 |
Copy previous results to parameters | 上一次的转换结果复制到参数中 |
执行每一行输入行 | 支持循环,根据参数结果集执行每一行参数 |
Remote save server | 执行集群节点服务器 |
成功(Success)
屏幕截图
图标
功能说明
此组件用来标识当前作业执行状态,在一个作业中可以有0个或者多个“Success”组件。
邮件(Mail)
屏幕截图
图标
功能说明
可以使用 Mail任务条目来发送 e-Mail。
组件说明
选项 | 描述 |
地址标签 | |
邮件作业名称 | 邮件作业名称,在单个任务中,必须唯一 |
目的地址 | 填写需要发送指定的邮箱地址 |
抄送 | 需要抄送人邮箱地址 |
暗送 | 需要暗送人邮箱地址 |
回复名称 | 邮件回复名称 |
回复地址 | 邮件回复地址 |
Reply to | 回复 |
联系人 | 在发送邮件内容中显示联系人 |
联系电话 | 在发送邮件内容中显示联系人电话 |
服务器标签 | |
SMTP服务器 | SMTP服务器,如163(smtp.163.com) |
端口 | 端口,则是SMTP服务器,如163(25) |
用户验证 | 是否需要用户验证 |
用户名 | RotKang |
密码 | RotKang |
使用安全证 | 是否需要安全验证 |
安全连接类型 | 默认为SSL |
邮件消息标签 | |
信息里带日期 | 在邮箱内容中显示服务器日期 |
只发邮件注释 | 在发送邮件内容里只显示注释里的内容 |
使用HTML邮件格 | 使用HTML邮件格,目前测试不准确 |
编码 | 字符集编码 |
管理优先级 | 默认 |
优先级 | 默认 |
重要 | 默认 |
主题 | 邮件主题名称 |
注释 | 邮件内容说明 |
附件标签 | |
带附件 | 目前测试有问题,勾选无效 |
文件类型 | 目前测试有问题 |
压缩成文件统一格式 | 目前测试有问题 |
压缩文件名称 | 目前测试有问题 |
注:Mail组件总体来说还是能发送邮件的,但目前还存在一些小问题,估计后续版本会完善。