kettle中转换和作业的执行顺序:
1、一个作业内的转换,是顺序执行的。
2、一个转换内的步骤是并行执行的。
3、作业内不支持事务,转换内支持事务。
根据业务需要,通常需要在转换内顺序执行,小技巧如下:
1、执行SQL是优先于所有步骤。
2、使用“阻塞数据直到步骤都完成”,确保其他数据步骤都完成再进行下一步骤。
事务:
1、设置转换只使用一个事务。转换设置-->夹项-->使用唯一连接。
2、设置转换内的表插入等数据库的操作不进行批量提交。"提交记录数量"-->0
I 当前步骤生成的记录数(从表输出、文件读入) O 当前步骤输出的记录数(输出的文件和表) R 当前步骤从前一步骤读取的记录数 W 当前步骤向后面步骤抛出的记录数 U 当前步骤更新过的记录数 E 当前步骤处理的记录数