1.安装软件准备

pdi-ce-8.2.0.0-342.zip,jdk-8u161-windows-x64.exe

不同kettle需要不同版本的jdk支持,kettle8必须使用jdk8以上版本

pdi-ce-8.2.0.0-342.zip下载 

https://sourceforge.net/projects/pentaho/files/Pentaho%208.2/client-tools/

pentaho旗下的软件都可以在这个网站上可以找到,但是没有vpn的话下载速度可能是几十kb/s,所以尽量弄各vpn。

jdk下载

https://www.oracle.com/technetwork/java/javase/downloads/java-archive-javase8-2177648.html

2.安装java环境

先新建两个目录例如:D:\02Java\Java\jdk1.8.0_161,D:\02Java\Java\jre1.8.0_161

运行jdk-8u161-windows-x64.exe,安装过程中会有两次选择目录,第一次选择是存放jdk,第二次选择是存放jre,分别放到刚刚新建的目录

安装完毕后配置环境java环境变量,这三个环境变量再用户级别环境变量添加就行

JAVA_HOME=D:\02Java\Java\jdk1.8.0_161

CLASSPATH=.;%JAVA_HOME%\lib;

PATH=%JAVA_HOME%\bin;

三个环境变量原本没有就新建,PATH原本有的话就再后面添加;%JAVAHOME%\bin;一定要注意多个变量一定要用分号隔开

打开cmd,输入java -version,如下显示

java version "1.8.0_161"
Java(TM) SE Runtime Environment (build 1.8.0_161-b12)
Java HotSpot(TM) 64-Bit Server VM (build 25.161-b12, mixed mode)

再输入javac,出现帮助信息则安装成功

3.安装kettle

直接解压pdi-ce-8.2.0.0-342.zip,解压出来是一个data-integration文件夹,进入这个文件夹找到Spoon.bat这个脚本

发送快捷方式到桌面,然后这个图标不好看,data-integration这个文件夹下有个图标文件spoon.ico,更换下就行

最后配置一下kettle环境变量

KETTLE_HOME=D:\02ETL\kettle8\data-integration

这个环境变量的作用是:kettle启动后会生成一个.kettle的文件夹,我们来指定下这个目录的生成位置,这个文件夹包含了各中配置文件,后期使用会经常进到这个目录,如果没有配置这个环境变量,.kettle这个文件夹会跑到用户的家目录比如Windows下C:\Users\zgh

最后双击Spoon.bat运行软件,第一次加载会比较慢

kettle最好把language修改成英文,在找文档的时候搜索组件很方便就可以找到

4.可能遇到问题

    4.1 启动的时候闪退

          检查jdk版本是否符合要求

          检查jdk是否安装成功

          尝试修改kettle所使用的jvm启动内存和最大内存,Spoon.bat里面的这个变量PENTAHO_DI_JAVA_OPTIONS="-  Xms1024m" "-Xmx6144m",-Xms1024m启动时初始化内存大小,-Xmx6144m最大使用内存大小,这两个参数可以尝试增大或者缩小

         尝试更换kettle版本,可能你的电脑太次了,使用低版本kettle,可以先不更换jdk版本,挨个试一下

     4.2使用资源库时,kjb和ktr文件中文乱码,貌似使用mysql数据库存储元数据存在这种情况,oracle的好像没有,所以还是尽量使用英文命名吧

     4.3使用excel-output或者excel-writer时报错file close

          这种情况是有个同事使用kettle5版本和jdk9时候发生的,更换kettle8.2后没有报错

     4.4...