在开始之前,你需要做一些事情。
验证支持
检查组件引用,以验证您的Kettle7.1版本支持您的MAPR集群版本。
建立MAPR集群
Kettle7.1可以连接到安全的和不安全的MAPR集群。
配置MAPR集群。如果需要帮助,请参阅MapR的文档。
安装任何必需的服务和服务客户端工具。
测试群集。
设置MapR客户端
安装MapR客户机,然后进行测试,以确保它正确地安装在计算机上,并且能够连接到MapR集群并浏览该集群。有关如何做到这一点的更多信息,请访问MAPR站点。
将MPRALHOST环境变量设置为MAPR客户端的安装位置。
如果在Windows上安装MAPR 4.0.1,请使用版本4.0.1.31009GA或更高版本作为MAPR客户端。如果使用MAPR 4.1.0,则使用MAPR客户端的4.1.0.31、175GA版本。该软件可以从MAPR获得。
复习特定版本的注释部分
阅读特定版本的注释部分,查看您的MAPR版本的特殊配置说明。
如果您连接到一个安全的MAPR集群,还有一些额外的事情需要做。
用Kerberos保护MAPR集群
TunaHo支持Kerberos身份验证。你将需要:
在集群上配置Kerberos安全性,包括Kerberos域、Kerberos KDC和Kerberos管理服务器。
配置名称、数据、辅助名称、作业跟踪器和任务跟踪器节点以接受远程连接请求。
设置Kerberos名称、数据、辅助名称,工作跟踪,和任务跟踪节点如果你已经部署了Hadoop的使用企业级程序。
将每个应该访问Hadoop集群的PudiaHo用户的用户帐户凭据添加到Kerberos数据库中。确保每个用户的Hadoop集群要添加到Kerberos数据库在每个节点上的操作系统的用户帐户。如有必要,添加操作系统用户帐户。请注意,用户帐户UID必须大于最小用户ID值(M.U.S.ID)。通常,最小用户ID值设置为1000。
在你的五音计算机上设置Kerberos
如何在您的PATHAO计算机上设置Kerberos出现了这样的指令。
设置模拟
如果您将使用模拟,您还需要完成MAPR模拟文章中的步骤。
如果你计划使用欺骗或伪装与MAPR客户,指定适当的用户标识(UID),组ID(GID),和名称在MAPR文档说明。(注意:确保您用于欺骗的帐户是由客户端和每个节点创建的。每个“欺骗”帐户应该具有与客户端相同的UID和GID。
在群集上不需要对*-Test.xml配置文件进行编辑。
配置五边形组件垫片
必须为要连接到MAPR集群的下列每个配置配置垫片:
Spoon (PDI Client)
Pentaho Server
Pentaho Report Designer (PRD)
Pentaho Metadata Editor (PME)
作为最佳实践,首先在调羹中配置垫片。Spoon 具有帮助您测试配置的功能。然后将测试的Spoon 配置文件复制到其他组件,必要时进行更改。
您还可以选择通过每个Pentaho 组件的这些指令,而不是从Spoon 复制垫片文件。如果不打算从Spoon 连接到群集,则可以先在另一个组件中配置垫片。
如果不打算从Spoon 连接到群集,则可以先将连接配置为另一个组件。