温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。


Fayson的github:

​https://github.com/fayson/cdhproject​


提示:代码块部分可以左右滑动查看噢


1

安装前置


确认满足以下前置:


1.CM/CDH5.1.0或以上。

2.如果需要配置Sentry高可用,需要使用CM/CDH5.13.0以上。

3.如果需要配置Sentry高可用,需要准备一个关系型数据库用以保存Sentry的权限信息,而不是一个平面文件(flat file)。

4.使用的Java必须已经修复JDK-8055949。


https://bugs.openjdk.java.net/browse/JDK-8055949

5.HiveServer2和Hive Metastore(HMS)必须以强认证的方式运行。对于HiveServer2,强认证你可以选择Kerberos或者LDAP。对于Hive Metastore,只有Kerberos才是强认证的方式。

6.如果你需要将Impala与Sentry一起集成使用。Impala必须是1.4.0或更高版本,并且以强认证的方式运行。对于Impala,强认证你可以选择Kerberos或者LDAP。

7.如果你需要将Solr与Sentry一起集成使用,Sentry服务必须配置数据库。从CDH5.1.0开始才支持Solr,以下是不同版本的一些不同的特性:

    a)CDH5.1.0开始支持基于策略文件的Sentry使用。注意你不能使用策略文件来配置Sentry的高可用,因为Sentry的高可用需要使用数据库。

    b)CDH5.5.0开始支持基于配置的Sentry使用。

    c)从CDH5.8.0开始支持基于关系型数据库的Sentry服务安装与使用。

8.集群已经启用Kerberos。


2

性能指南


使用以下指南可获得最佳性能:


1.在Sentry中创建大量角色可能会从各方面降低Sentry性能。使用5,000个或更少的角色以获得最佳性能。


2.HMS的heap size至少配置为10GB。默认需要这么多,因为Sentry需要使用12个连接与HMS进行通信。要检查HMS的heap size,从CM打开Hive服务,点击Configuration选项卡,然后搜索Java Heap Size of Hive Metastore Server in Bytes属性。


3.Cloudera建议对于每个Sentry主机,Hive数据库中每一百万个对象需要为Sentry服务配置2.25 GB内存。Hive对象包括server,数据库,表,分区,列,URI和视图。


确保将JVM的heap size设置为适合内存要求的值。你可以在Cloudera Manager中检查heap size。进入Sentry服务,单击Configuration选项卡,然后搜索Java Heap Size of Sentry Server in Bytes属性。将该属性设置为合适的值。


随着Hive数据库中对象数量的增加,Sentry所需的内存会线性增加。下图显示了基于Hive对象数量的Sentry所需的内存。

0634-6.2.0-如何在CDH中安装Sentry服务_cloudera


4.您可以配置Sentry一次从HMS提取的notification数量,以减少一次性获取所有HMS notification的开销。这在运行大型DDL作业时特别有用。要配置notification的数量,请在Cloudera Manager中打开Sentry服务,然后查看Configuration选项卡。搜索Sentry Service Advanced Configuration Snippet (Safety Valve) for sentry-site.xml属性。点击+号增加一个新参数。在Name字段中输入sentry.hms.fetch.size。在Value字段中,输入您希望Sentry一次获取的事件数。例如,如果Sentry需要获取1000个事件,则可以在Value字段中输入100,这样Sentry会分10次每次获取100个事件,而不是一次性获取1000个事件。


3

使用Cloudera Manager安装Sentry服务


3.1

在MariaDB中创建数据库


create database sentry default character set utf8;  
CREATE USER 'sentry'@'%' IDENTIFIED BY 'password';
GRANT ALL PRIVILEGES ON sentry. * TO 'sentry'@'%';
FLUSH PRIVILEGES;


0634-6.2.0-如何在CDH中安装Sentry服务_hive_02


3.2

安装Sentry服务


1.进入Cloudera Manager主页点击“添加服务”。


0634-6.2.0-如何在CDH中安装Sentry服务_cloudera_03


2.在向导页面选择Sentry服务,点击“继续”。


0634-6.2.0-如何在CDH中安装Sentry服务_h5_04


3.选择一台节点作为Sentry Server,Gateway可以选择集群内所有主机,点击“继续”。



注意:您只能为Sentry Server选择一个主机。添加Sentry服务完成后,可以在启用高可用性时添加其他主机。


0634-6.2.0-如何在CDH中安装Sentry服务_h5_05


4.输入前面在MariaDB中创建的Sentry数据库名字与用户/密码,点击“测试连接”。


0634-6.2.0-如何在CDH中安装Sentry服务_cloudera_06


测试连接数据库成功后,点击“Continue”。


0634-6.2.0-如何在CDH中安装Sentry服务_h5_07


5.等待Sentry服务第一次运行并启动成功。


0634-6.2.0-如何在CDH中安装Sentry服务_hive_08


等待运行成功后,点击“继续”。


0634-6.2.0-如何在CDH中安装Sentry服务_hive_09


6.点击“完成”。


0634-6.2.0-如何在CDH中安装Sentry服务_hive_10


7.回到Cloudera Manager主页发现Sentry服务运行正常,显示为绿色。


0634-6.2.0-如何在CDH中安装Sentry服务_hive_11


自此Sentry服务安装完毕。


参考:

​https://www.cloudera.com/documentation/enterprise/latest/topics/sg_sentry_before_you_install.html​

​https://www.cloudera.com/documentation/enterprise/latest/topics/sg_sentry_service_install.html​


提示:代码块部分可以左右滑动查看噢


为天地立心,为生民立命,为往圣继绝学,为万世开太平。

温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。



推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

0634-6.2.0-如何在CDH中安装Sentry服务_cloudera_12

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操