Kettle简介:Kettle 是 PDI 以前的名称,PDI 的全称是Pentaho Data Integeration,Kettle 本意是水壶的意思,表达了数据流的含义。Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。

Kettle下载和安装:
1、官网各个版本下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/ 2、Kettle是纯JAVA编程的开源软件,本地环境配置JDK1.7以上即可运行,解压后直接使用无需安装。

需准备的其他东西:
数据库驱动,如笔者连接的是mysql则需将mysql的驱动放在kettle根目录的bin下面,然后到服务中启动mysql,重启kettle。

教程步骤:

1、运行spoon.bat,打开spoon图形工具

kettle解压包目录




服务器docker版kettle安装教程 kettle docker_linux


 启动spoon.bat


服务器docker版kettle安装教程 kettle docker_数据库_02


kettle打开页面

服务器docker版kettle安装教程 kettle docker_mysql_03



注意:红圈处没有connect按钮,原因为资源库配置文件乱码造成
解决方法:打开系统盘用户目录下的repositories.xml配置文件,将乱码内容删除,并删除.spoonrc文件,重启kettle


服务器docker版kettle安装教程 kettle docker_数据库_04


2、创建或连接资源库

选择创建数据库资源库


创建资源库


 

服务器docker版kettle安装教程 kettle docker_mysql_05


选择创建数据库资源库


服务器docker版kettle安装教程 kettle docker_java_06


输入资源库名称(自定义) 点击Database Connection创建数据库连接


 

服务器docker版kettle安装教程 kettle docker_java_07


选择Create New Connection


服务器docker版kettle安装教程 kettle docker_数据库_08


3、创建数据库连接

输入连接名称、选择类型(根据自身所需选择,这里连接的是mysql数据库,如连接其他数据库,需将数据库驱动放在kettle根目录中的lib下面,然后启动数据库重启kettle)
确认输入无误后点击测试,测试是否连接成功,失败多为lib下找不到数据库驱动


服务器docker版kettle安装教程 kettle docker_数据库_09


选择finish


服务器docker版kettle安装教程 kettle docker_java_10


创建成功,选择Connect连接到数据库


服务器docker版kettle安装教程 kettle docker_python_11


登陆,默认有个admin用户,密码也为admin启动后可以修改用户密码或添加其他用户


服务器docker版kettle安装教程 kettle docker_mysql_12


创建成功


服务器docker版kettle安装教程 kettle docker_linux_13


连接数据库查看可以发现该数据库自动创建了使用kettle所需要的表结构


服务器docker版kettle安装教程 kettle docker_java_14


更新一、如何添加新用户

点击工具=》资源库=》探索资源
选择【安全】=》添加用户=》填写账号密码保存


服务器docker版kettle安装教程 kettle docker_数据库_15