在开始之前,你需要做一些事情。

验证支持

检查组件引用,以验证您的Kettle7.1版本支持您的MAPR集群版本。

建立MAPR集群

Kettle7.1可以连接到安全的和不安全的MAPR集群。

配置MAPR集群。如果需要帮助,请参阅MapR的文档。

安装任何必需的服务和服务客户端工具。

测试群集。

设置MapR客户端

安装MapR客户机,然后进行测试,以确保它正确地安装在计算机上,并且能够连接到MapR集群并浏览该集群。有关如何做到这一点的更多信息,请访问MAPR站点。

将MPRALHOST环境变量设置为MAPR客户端的安装位置。

 

如果在Windows上安装MAPR 4.0.1,请使用版本4.0.1.31009GA或更高版本作为MAPR客户端。如果使用MAPR 4.1.0,则使用MAPR客户端的4.1.0.31、175GA版本。该软件可以从MAPR获得。

复习特定版本的注释部分

阅读特定版本的注释部分,查看您的MAPR版本的特殊配置说明。

如果您连接到一个安全的MAPR集群,还有一些额外的事情需要做。

用Kerberos保护MAPR集群

TunaHo支持Kerberos身份验证。你将需要:

在集群上配置Kerberos安全性,包括Kerberos域、Kerberos KDC和Kerberos管理服务器。

配置名称、数据、辅助名称、作业跟踪器和任务跟踪器节点以接受远程连接请求。

设置Kerberos名称、数据、辅助名称,工作跟踪,和任务跟踪节点如果你已经部署了Hadoop的使用企业级程序。

将每个应该访问Hadoop集群的PudiaHo用户的用户帐户凭据添加到Kerberos数据库中。确保每个用户的Hadoop集群要添加到Kerberos数据库在每个节点上的操作系统的用户帐户。如有必要,添加操作系统用户帐户。请注意,用户帐户UID必须大于最小用户ID值(M.U.S.ID)。通常,最小用户ID值设置为1000。

在你的五音计算机上设置Kerberos

如何在您的PATHAO计算机上设置Kerberos出现了这样的指令。

设置模拟

如果您将使用模拟,您还需要完成MAPR模拟文章中的步骤。

如果你计划使用欺骗或伪装与MAPR客户,指定适当的用户标识(UID),组ID(GID),和名称在MAPR文档说明。(注意:确保您用于欺骗的帐户是由客户端和每个节点创建的。每个“欺骗”帐户应该具有与客户端相同的UID和GID。

在群集上不需要对*-Test.xml配置文件进行编辑。

配置五边形组件垫片

必须为要连接到MAPR集群的下列每个配置配置垫片:

Spoon (PDI Client)
     Pentaho Server
     Pentaho Report Designer (PRD)
     Pentaho Metadata Editor (PME)

作为最佳实践,首先在调羹中配置垫片。Spoon 具有帮助您测试配置的功能。然后将测试的Spoon 配置文件复制到其他组件,必要时进行更改。

您还可以选择通过每个Pentaho 组件的这些指令,而不是从Spoon 复制垫片文件。如果不打算从Spoon 连接到群集,则可以先在另一个组件中配置垫片。

如果不打算从Spoon 连接到群集,则可以先将连接配置为另一个组件。