1.文档编写目的

Gateway节点又称为客户端节点,通常用作访问Hadoop集群的接口机。它主要会部署一些客户端的配置,脚本命令,比如HDFS的core-site.xml,hdfs-site.xml以及hadoop的操作命令。

如果你使用的是Apache Hadoop,你只需要将hadoop相关服务的配置和脚本命令拷贝到客户端机器即可,但一旦集群的配置有所修改,你需要注意也同步到客户端机器。如果是CDH集群,客户端节点也会是Cloudera Manager管理的一台机器,它会被安装cloudera-scm-agent服务,以及CDH的Parcel,部署客户端配置Cloudera Manager会统一做,另外如果客户端机器出现异常,Cloudera Manager也会告警。

增加一台Gateway节点,与安装CDH非常类似,你必须要注意一定要做好客户端机器的前置条件准备,参考《CDH安装前置准备》,否则会增加失败。前面Fayson介绍过在非Kerberos环境下部署Gateway节点,参考《如何给CDH集群增加Gateway节点》。本文则主要是介绍如何在Kerberos环境下给CDH集群增加Gateway节点。

内容概述
1.创建Gateway节点的主机模板
2.Gateway节点的前置准备
3.增加Gateway节点到集群并应用主机模板
4.GateWay节点命令测试

测试环境
1.CDH5.13
2.采用root用户操作
3.CentOS6.5

前置条件
1.CDH5.13集群运行正常
2.Gateway节点已准备,并准备好前置

2.创建Gateway节点的主机模板

1.从Cloudera Manager进入“主机模板”页面

CDH Spark2 Gateway是什么模块_hadoop


2.点击“创建”

CDH Spark2 Gateway是什么模块_hadoop_02

3.给模板命名,点击各个服务勾选相应的GateWay角色

CDH Spark2 Gateway是什么模块_客户端_03

4.点击“创建”,确认创建成功.

CDH Spark2 Gateway是什么模块_运维_04

3.Gateway节点的前置准备

前置准备请参考Fayson之前的文章《CDH安装前置准备》,主要包括以下步骤:
1.确保OS的yum源可以正常使用,通过yum repolist命令可以查看到匹配的OS的所有包
2.确保Cloudera Manager的yum源运行正常
3.hosts文件配置,需要将Gateway节点的IP和hostname加入到CDH集群节点的hosts文件中,并同步到所有机器包括Gateway节点
4.禁用SELinux
5.关闭防火墙
6.设置swap为10
7.关闭透明大页面
8.配置时钟同步
请务必确保以上操作都已完成,并成功配置,否则接下来的增加节点操作会失败!

4.安装Kerberos客户端

由于集群启用了Kerberos服务,所以需要在Gateway节点安装Kerberos客户端。
1.在Gateway节点上执行如下命令

[ec2-user@ip-172-31-31-212opt]$ sudo yum -y install krb5-libskrb5-workstation

安装成功后查看安装的RPM包

[ec2-user@ip-172-31-31-212opt]$ rpm -qa |grep krb
krb5-workstation-1.15.1-8.el7.x86_64
krb5-libs-1.15.1-8.el7.x86_64
krb5-devel-1.15.1-8.el7.x86_64
[ec2-user@ip-172-31-31-212 opt]$

CDH Spark2 Gateway是什么模块_客户端_05

2.将CM集群中的krb5.conf文件拷贝至该Gateway节点

[ec2-user@ip-172-31-22-86 ~]$ scp -i fayson.pem.txt /etc/krb5.conf ip-172-31-31-212:/home/ec2-user/

CDH Spark2 Gateway是什么模块_大数据_06

3.在Gateway节点将krb5.conf文件拷贝至/etc目录下

[ec2-user@ip-172-31-31-212 ~]$ sudo cp krb5.conf /etc/
[ec2-user@ip-172-31-31-212 ~]$ sudo chown root. /etc/krb5.conf
[ec2-user@ip-172-31-31-212 ~]$ ll /etc/krb5.conf
-rw-r--r-- 1 root root 837 Dec  9 00:28 /etc/krb5.conf
[ec2-user@ip-172-31-31-212 ~]$

CDH Spark2 Gateway是什么模块_运维_07


4.在GateWay节点测试Kerberos客户端是否部署成功

[ec2-user@ip-172-31-31-212 ~]$ kinit -kt fayson.keytab fayson
[ec2-user@ip-172-31-31-212 ~]$ klist
Ticket cache: FILE:/tmp/krb5cc_1000
Default principal: fayson@CLOUDERA.COM

Valid starting       Expires              Service principal
12/09/2017 00:31:53  12/10/2017 00:31:53  krbtgt/CLOUDERA.COM@CLOUDERA.COM
        renew until 12/16/2017 00:31:53
[ec2-user@ip-172-31-31-212 ~]$

CDH Spark2 Gateway是什么模块_运维_08


有如上图所示则表示Kerberos客户端安装成功。

5.增加Gateway节点的集群并应用主机模板

1.进入“所有主机”页面

CDH Spark2 Gateway是什么模块_大数据_09


2.点击“向群集添加主机”

CDH Spark2 Gateway是什么模块_客户端_10


3.选择“经典向导”

CDH Spark2 Gateway是什么模块_大数据_11


4.继续

CDH Spark2 Gateway是什么模块_大数据_12


5.输入Gateway节点的IP或者hostname,点击搜索

CDH Spark2 Gateway是什么模块_运维_13


CDH Spark2 Gateway是什么模块_客户端_14


6.点击“继续”,选择“自定义存储库”,并输入Cloudera Manager的yum源http地址

CDH Spark2 Gateway是什么模块_大数据_15


7.点击“继续”,勾选Java的两个选项

CDH Spark2 Gateway是什么模块_java_16


8.点击“继续”,输入Gateway节点的ec2-user密码

CDH Spark2 Gateway是什么模块_hadoop_17


9.点击“继续”,等待cloudera-scm-agent在Gateway节点上安装

CDH Spark2 Gateway是什么模块_java_18


安装完成点击“继续”

CDH Spark2 Gateway是什么模块_客户端_19


10.点击“继续”,等待分发Parcel包并激活

CDH Spark2 Gateway是什么模块_客户端_20


完成后,点击“继续”

CDH Spark2 Gateway是什么模块_hadoop_21


11.点击“继续”,进行主机检查

CDH Spark2 Gateway是什么模块_大数据_22


12.完成主机检查,点击“继续”,选择主机模板

CDH Spark2 Gateway是什么模块_大数据_23


13.点击“继续”,启动主机上的角色

CDH Spark2 Gateway是什么模块_hadoop_24


等待执行成功

CDH Spark2 Gateway是什么模块_java_25


14.点击“继续”,部署客户端配置

CDH Spark2 Gateway是什么模块_大数据_26


15.点击完成,查看主机列表GateWay节点的角色信息

CDH Spark2 Gateway是什么模块_客户端_27


至此,给Kerberos环境下CDH集群增加新的Gateway节点完成。

6.Gateway节点测试

1.HDFS命令测试

[ec2-user@ip-172-31-31-212 ~]$ hadoop fs -ls /

CDH Spark2 Gateway是什么模块_大数据_28


2.HBase命令测试

[ec2-user@ip-172-31-31-212 ~]$ hbase shell

CDH Spark2 Gateway是什么模块_大数据_29


3.Hive命令测试

[ec2-user@ip-172-31-31-212 ~]$ hive

CDH Spark2 Gateway是什么模块_java_30


4.hadoop命令向集群提交作业

[ec2-user@ip-172-31-31-212 ~]$ hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 5 5

CDH Spark2 Gateway是什么模块_java_31

为天地立心,为生民立命,为往圣继绝学,为万世开太平。