安装教程
1、下载(官网:https://community.hitachivantara.com/s/article/data-integration-kettle)
稍后跳转5秒后就会自动下载
2、下载数据库链接驱动
mysql:https://dev.mysql.com/downloads/connector/j/
解压后将相应jdk版本的驱动放入根目录下的lib文件夹即可。
kettle基础
1、双击启动程序【Spoon.bat】
2、创建DB,创建完后可点击【测试】验证是否创建成功
3、创建转换
在【输入】中选择【表输入】,在输出中选择【插入/更新】
连线操作:单击表输入节点后,按住shift即可拖拉。单击连线会变灰,即取消该操作。
先选择数据库连接,sql语句可以自己写,也可以点击【获取sql查询语句】自动生成,写完后可点击【预览】查看查询数据,最后点击【确定】。
【插入/更新】操作差不多。唯一提一点就是如果你偷懒点了【获取字段】,它将自动按输入的内容,加载所有字段,如果两个表字段名不一致,你还得手动重新选择
4、保存本地后运行;
5、转换没问题后可新建【作业】
【start】双击后可设置循环周期参数,双击【转换】后选择之前运行时保存在本地的转换
kettle进阶
1、DB连接共享
作用:创建一次DB后,后面可直接拿来用,无需再次创建。
2、资源库
点击右上角的【connect】就会进入资源库选择页面。首先打开的是Pentaho自己的服务器,企业一般不会去使用,当然你也可以用。点击【other repositories】后有两个选择,第一个是数据库资源库,第二个是文件资源库。
区别:数据库会在库内创建40几张表(建议单独弄个库),需要用户名密码(admin/admin),库内DB连接与作业共享,方便多人合作;
文件资源库会默认本地一个目录,再次打开时会直接访问该目录,本地操作,不需要网络,只能共享作业,DB还得额外点共享;
相同点:连接资源库之后,选打开作业只能选择资源库目录下的文件,无法访问整个硬盘。
注:创建资源库时,千万不要有任何中文字符!!!
3、web管理
a.打开服务:用管理员身份运行dos命令框,并进入kettle安装目录,接着运行命令
carte.bat 127.0.0.1 8022
注:端口随便写,只要不冲突即可
b.配置子服务器
c.新增运行配置
d、作业运行配置
e、打开网页 127.0.0.1:8022
用户名密码看
常见错误
1、创建资源库中含有中文,导致无法显示connet或者管理操作;
下图中【repositories.xml】是资源库文件,打开后将中文内容去掉或者删除整个文件,重新创建资源库都行。
2、Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.
编辑安装根目录下的【Spoon.bat】,打开后在如图位置上添加内容:-Dfile.encoding=UTF-8
Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.