一、搭建之前的准备

1.安装包下载

1.1 cm6.2.1下载

https://archive.cloudera.com/cm6/6.2.1/redhat7/yum/RPMS/x86_64/

cdh在哪查看配置文件找到mysql用户名密码_mysql

1.2 cdh6.2.1下载

https://archive.cloudera.com/cdh6/6.2.1/parcels/

cdh在哪查看配置文件找到mysql用户名密码_大数据_02

如果不会下载json文件和sha1文件,建议使用wget命令下载,很方便!

1.3 mysql下载

https://dev.mysql.com/downloads/mysql/

cdh在哪查看配置文件找到mysql用户名密码_数据仓库_03

1.4 jdk下载

历史版本:https://www.oracle.com/java/technologies/javase/javase8u211-later-archive-downloads.html

最新版本:https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html

1.5 网盘下载地址

有个老哥留言cloudera的镜像官网现在需要用户名密码,下载不到,所以我分享一下网盘的地址吧,永久有效的哦!
链接:https://pan.baidu.com/s/1pS7VFxK985lIz8ZI4an89g
提取码:aaaa

2 集群初步规划

2.1 服务器配置(centos7)

arturo.cdh.dn01 IP(10.0.10.1) 初步角色分配(cm,agent,nn) 内存6G 磁盘40G
arturo.cdh.dn02 IP(10.0.10.2) 初步角色分配(agent,datanode) 内存2G 磁盘30G
arturo.cdh.dn03 IP(10.0.10.3) 初步角色分配(agent,datanode) 内存2G 磁盘30G
arturo.cdh.dn04 IP(10.0.10.4) 初步角色分配(agent,datanode) 内存2G 磁盘30G

3 环境准备

3.1 修改主机名
hostnamectl set-hostname arturo.cdh.dn01
echo hostname=arturo.cdh.dn01 > /etc/sysconfig/network
其余节点参照修改
3.2 配置服务器hosts
vi /etc/hosts
10.0.10.1	arturo.cdh.dn01
10.0.10.2	arturo.cdh.dn02
10.0.10.3	arturo.cdh.dn03
10.0.10.4	arturo.cdh.dn04
3.3 关闭NetworkManager
systemctl stop NetworkManager 
systemctl disable NetworkManager
3.4 关闭防火墙
systemctl stop firewalld 
systemctl disable firewalld
3.5 关闭selinux和设置swap交换空间使用
1) 关闭selinux
setenforce 0
sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
2) 设置禁止使用交换内存
echo 'vm.swappiness=0' >> /etc/sysctl.conf 
sysctl -p
3) 查看密码文件是否上锁
lsattr /etc/passwd /etc/shadow
如果存在上锁的话需要解锁,安装完成后再重新上锁(一般数仓客户的服务器环境都需要解锁,装完上锁)
chattr +i /etc/passwd /etc/shadow	#上锁命令
chattr -i /etc/passwd /etc/shadow	#解锁命令

cdh在哪查看配置文件找到mysql用户名密码_mysql_04

3.6 禁用透明大页面
1) 执行命令
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled
chmod +x /etc/rc.d/rc.local
2) 设置开机自动关闭
echo "if test -f /sys/kernel/mm/transparent_hugepage/enabled; then echo never >
/sys/kernel/mm/transparent_hugepage/enabled fi if test -f
/sys/kernel/mm/transparent_hugepage/defrag; then echo never >
/sys/kernel/mm/transparent_hugepage/defrag fi " >> /etc/rc.d/rc.local
3.7 搭建本地私服
1) 创建目录
mkdir /media/iso 
将镜像文件挂在到iso目录下(这里的镜像文件需要调整为现场的文件)
mount -o loop -t iso9660 /media/CentOS-7-x86_64-DVD-1908.iso /media/iso/
备份或者直接删除原有的操作系统repo
mkdir -p /etc/yum.repos.d/bak
cd /etc/yum.repos.d/
mv *.repo bak 
rm -rf *.repo

2) 创建新的操作系统repo
vi /etc/yum.repos.d/cdrom.repo 
[cdrom] 
name=isofile 
baseurl=file:///media/iso
enabled=1 
gpgcheck=1 
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-7

3) 清除yum缓存
yum clean all
从新加载yum缓存
yum makecache

配置httpd服务器,并且使用本地私服的镜像文件

1) 主节点安装httpd
yum -y install httpd
修改/etc/httpd/conf/httpd.conf配置⽂件,在<IfModulemime_module>中修改以下内容 
vi /etc/httpd/conf/httpd.conf
AddType application/x-gzip .gz .tgz .parcel
启动 httpd 服务并设置开机自启动: 
systemctl start httpd 
systemctl enable httpd 
2) 主节点复制镜像源文件到私服下:
cp -r /media/iso /var/www/html
删除服务器可能存在的原有repo文件,创建本地服务器repo
vi /etc/yum.repos.d/cdrom.repo 
[cdrom] 
name=isofile 
baseurl=http://172.16.39.2/iso
enabled=1 
gpgcheck=1 
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-7

3) 其他服务器删除可能存在的原有repo文件(所有节点执行)
rm -rf /etc/yum.repos.d/*.repo
分发主节点cdrom.repo到其他服务器/etc/yum.repos.d/目录(所有datanode节点执行)
scp -r /etc/yum.repos.d/cdrom.repo arturo.hdp.dn02:/etc/yum.repos.d/
4) 所有服务器执行重新加载yum源命令
yum clean all
yum makecache
3.8 配置ntp时间同步

主节点配置时钟主机

1) 修正主节点时间,输入 date 命令,查看时间是否是当前时间 
修改时区的命令: 
ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
2) 修改时间为当前时间  date -s "2020-07-24 11:09:27" 
修改其他机器时区
ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
3) 安装ntpd
yum -y install ntp

4) 增加配置:(配置本地同步 )
server 127.127.1.0 # local clock 
fudge 127.127.1.0 stratum 10 
5) 注释不需要的 server (加#号注释)
#restrict 127.0.0.1
#restrict ::1

#server 0.centos.pool.ntp.org iburst 
#server 1.centos.pool.ntp.org iburst 
#server 2.centos.pool.ntp.org iburst 
#server 3.centos.pool.ntp.org iburst 
6) 给指定的客户机访问 ntp server 的权限(restrict 后面的 arturo.hdp.dn01就是我 们的 ip 的前三个数字) 删除#号修改即可。
restrict arturo.hdp.dn01 mask 255.255.255.0 nomodify notrap
(允许那些机器可以和我同步)
7) 启动 ntpd 服务,并且设置 ntpd 开机自启动 
systemctl start ntpd 
systemctl enable ntpd

其他节点配置与主机同步

其他机器作为 ntpd 客户端,分别其它机器上执行如下的命令来配置 ntpd: 
vi /etc/ntp.conf 
1) 增加配置: 
server arturo.hdp.dn01
2)注释不需要的 server 
#server 0.rhel.pool.ntp.org iburst
#server 1.rhel.pool.ntp.org iburst
#server 2.rhel.pool.ntp.org iburst
#server 3.rhel.pool.ntp.org iburst
3) 启动 ntpd 服务,并且设置 ntpd 开机自启动
systemctl start ntpd 
systemctl enable ntpd
4) 查看时间同步进度 
使用命令 ntpq -p 来查看时间同步进度(时间同步 cdh-master 需要大概 10 分钟左右才能同步好) 
查看同步状态 ntpstat
查看和谁同步ntpq -p 
如果时间越差的太多,可以采用
date -s "2020-07-24 13:30:00" 和ntpd -u arturo.hdp.dn01
手动来尽快同步。
3.9 设置主节点与其他节点的免密登录
在 arturo.hdp.dn01 节点上在 worker 节点启动相关的组件服务的时候需要无密钥的登陆 worker 节点,所以我们需要配置 ajxt.hdp.dn01 到 worker 节点无密钥登陆。
1)生成密钥
ssh-keygen -t rsa
连续回车3下
2)将自己的公钥发给每一台机器,包括自己
ssh-copy-id arturo.hdp.dn01
ssh-copy-id arturo.hdp.dn02
ssh-copy-id arturo.hdp.dn03
ssh-copy-id arturo.hdp.dn04
3)分发完成过后,ssh hostname  不输入密码跳转成就可以了。
3.10 JDK的安装
1) 卸载CentOS自带的openJDK:
查看openJDK命令:rpm -qa|grep java
卸载openJDK相关
   执行命令:rpm -e --nodeps 文件名
2) 在所有节点创建 JDK 目录: 
mkdir -p /usr/java 
将上传的 jdk1.8.0_212.tar.gz 解压至/usr/java 目录 
cd /usr/java 
tar -xvf jdk1.8.0_212.tar.gz 
3) 将 JDK 复制到所有节点,在所有节点创建目录: 
scp -r /usr/java/jdk1.8.0_212 arturo.hdp.dn01:/usr/java/ 
scp -r /usr/java/jdk1.8.0_212 arturo.hdp.dn02:/usr/java/ 
scp -r /usr/java/jdk1.8.0_212 arturo.hdp.dn03:/usr/java/ 
scp -r /usr/java/jdk1.8.0_212 arturo.hdp.dn04:/usr/java/ 
在所有节点执行创建 JDK 目录的软链接(CDH 默认识别/usr/java/default 目录) 
ln -s /usr/java/jdk1.8.0_212 /usr/java/default 
所有节点添加环境变量 
vi /etc/profile 
JAVA_HOME=/usr/java/jdk1.8.0_231 
JRE_HOME=/usr/java/jdk1.8.0_231/jre 
CLASS_PATH=:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib 
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin 
export JAVA_HOME JRE_HOME CLASS_PATH PATH 
退出保存/etc/profile,执行命令命令使环境变量生效 
source /etc/profile 
4) 执行查看版本命令,出现下面的界面则表示成功 
java -version

PS:生产环境出现搭建JDK环境后,cloudera-manager-agent依然无法找到java_home的情况,所以需要用yum的方式安装或者选择不卸载系统自带的1.8 oracle版本的jdk,不会影响系统的运行,具体看情况再定 。

3.11 MySQL的安装
1)在arturo.hdp.dn01节点上安装Mysql,卸载已有的mysql
rpm -qa | grep mysql
rpm -e --nodeps【包名】
卸载CentOS自带的mariadb,不然mysql装不进去
查看mariadb命令:rpm -qa|grep mariadb
 卸载mariadb相关
执行命令:rpm -e --nodeps 文件名
检查是否安装libaio
如果没有的话执行安装
yum install -y libaio
执行安装mysql:
rpm -ivh mysql-community-common-5.7.15-1.el6.x86_64.rpm --force --nodeps 
rpm -ivh mysql-community-libs-5.7.15-1.el6.x86_64.rpm --force --nodeps 
rpm -ivh mysql-community-libs-comp-5.7.15-1.el6.x86_64.rpm --force --nodeps 
rpm -ivh mysql-community-client-5.7.15-1.el6.x86_64.rpm --force --nodeps 
rpm -ivh mysql-community-server-5.7.15-1.el6.x86_64.rpm --force --nodeps 
2)修改my.cnf的配置
vim /etc/my.cnf
[client]
default-character-set=utf8
[mysqld]
skip-grant-tables
character_set_server=utf8
init_connect='SET NAMES utf8'
max_connections=2000
使用root用户免密登录mysql
3)修改 root 密码 
systemctl restart mysqld
mysql -uroot
use mysql ;
update user set Authentication_string=PASSWORD('datanode01') where USER='root';
flush privileges;
退出mysql
quit;
注释掉skip-grant-tables免密登录
重启mysqld
systemctl restart mysqld
设置开机启动 
systemctl enable mysqld
或者
	chkconfig mysqld on 
启动 mysql: 
systemctl status mysqld 
systemctl start mysqld 
查看 mysql 日志: 
tail -f /var/log/mysqld.log
4)设置mysql可远程访问权限(可按需求选配置)
set global validate_password_policy=0;
set global validate_password_length=0;
ALTER USER USER() IDENTIFIED BY 'datanode01';
GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'datanode01' WITH GRANT OPTION;
flush privileges;
5)手工创建目录,并权限归属于 Mysql 
mkdir -p /var/run/mysqld 
chown -R mysql:mysql /var/run/mysqld

放置mysql的jdbc驱动jar包

1)在所有机器上创建目录: 
mkdir -p /usr/share/java 
将 mysql 的 jdbc 的驱动 mysql-connector-java-5.1.47.jar 复制至/user/share/java 目录 下,然后执行: 
 cp /appinstall/cdh6/mysql-connector-java-5.1.47.jar /usr/share/java
设置软连接 
ln -s mysql-connector-java-5.1.47.jar mysql-connector-java.jar
切换目录
cd /usr/share/java
2)复制至其他节点: 
scp -r mysql-connector-java.jar ajxt.hdp.dn01:/usr/share/java
scp -r mysql-connector-java.jar ajxt.hdp.dn02:/usr/share/java
scp -r mysql-connector-java.jar ajxt.hdp.dn03:/usr/share/java
scp -r mysql-connector-java.jar ajxt.hdp.dn04:/usr/share/java

4 安装cm6.2.1

4.1 cm节点创建本地源
1)安装createrepo 
yum -y install createrepo 
上传 cdh6.2.1 至服务器/var/www/html/ 目录下,进入 cdh6.2.0 目录如下:
创建 /var/www/html/primary.ajxt.com.cn/cm6目录
2)进入目录 cm6 目录生成 RPM 元数据: 
cd /var/www/html/cm6 
createrepo . 
创建 /var/www/html/parcels目录
进入目录 parcels 目录生成 RPM 元数据: 
cd parcels 
createrepo . 
确保可以通过浏览器查看到这些 RPM 包
3)创建cm.repo
vi /etc/yum.repos.d/cm.repo
[cm.repo]
baseurl=http://10.0.10.1/cloudera/cm6/
gpgcheck=0
enabled=1
4) 复制cm.repo到其它数据节点
scp -r /etc/yum.repos.d/cm.repo arturo.cdh.dn02:/etc/yum.repos.d/
cm.repo
scp -r /etc/yum.repos.d/cm.repo arturo.cdh.dn03:/etc/yum.repos.d/
cm.repo
scp -r /etc/yum.repos.d/cm.repo arturo.cdh.dn04:/etc/yum.repos.d/
cm.repo
4.2 安装cloudera-manager-server
1)安装server客户端
yum -y install cloudera-manager-server
2) 初始化数据库到mysql中,打开mysql执行sql(用户名密码自定,记住从属关系就行)
set global validate_password_length=6;
set global validate_password_policy=0;

CREATE DATABASE scm DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
CREATE DATABASE amon DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
CREATE DATABASE rman DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
CREATE DATABASE hive DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
CREATE DATABASE hue DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
CREATE DATABASE sentry DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
CREATE DATABASE nav DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
CREATE DATABASE navms DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
CREATE DATABASE oozie DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 

GRANT ALL ON scm.* TO 'scm'@'%' IDENTIFIED BY 'cdh_scm'; 
GRANT ALL ON amon.* TO 'amon'@'%' IDENTIFIED BY 'cdh_amon'; 
GRANT ALL ON rman.* TO 'rman'@'%' IDENTIFIED BY 'cdh_rman'; 
GRANT ALL ON hive.* TO 'hive'@'%' IDENTIFIED BY 'cdh_hive'; 
GRANT ALL ON hue.* TO 'hue'@'%' IDENTIFIED BY 'cdh_hue'; 
GRANT ALL ON sentry.* TO 'sentry'@'%' IDENTIFIED BY 'cdh_sentry'; 
GRANT ALL ON nav.* TO 'nav'@'%' IDENTIFIED BY 'cdh_nav'; 
GRANT ALL ON navms.* TO 'navms'@'%' IDENTIFIED BY 'cdh_navms'; 
GRANT ALL ON oozie.* TO 'oozie'@'%' IDENTIFIED BY 'cdh_oozie'; 
flush privileges;
3)初始化cm6的配置库
/opt/cloudera/cm/schema/scm_prepare_database.sh mysql -harturo.cdh.dn01 --scm-host arturo.cdh.dn01 scm root arturo@2020

cdh在哪查看配置文件找到mysql用户名密码_数据仓库_05

4)启动cloudera-manager-server
systemctl start cloudera-scm-server
systemctl status cloudera-scm-server
5) 过一分钟左右监听7180端口是否启用,Cloudera Manager Server 启动,需要稍微等待,可以通过命令查看启动状态: 
tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log

cdh在哪查看配置文件找到mysql用户名密码_java_06

4.3 手动安装cloudera-manager-agent
1) 安装agent(所有节点执行)
yum -y install cloudera-manager-agent.x86_64
2) 修改配置文件,使所有agent指向cm节点(所有节点修改)
vi /etc/cloudera-scm-agent/config.ini

cdh在哪查看配置文件找到mysql用户名密码_mysql_07

3) 启动agent
systemctl start cloudera-scm-server
systemctl status cloudera-scm-server
systemctl enable cloudera-scm-server

5 安装CDH6.2.1

1 配置安装文件
1) 上传CDH的parcel包到本地http服务器目录下,上传到/var/www/html/cloudera/cdh6目录即可
查看sha串
sha1sum CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel
对比官方下载下来的串是否正确
cat CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel.sha1
修改sha文件
mv CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.pa4-el7.parcel.sha1 CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel.sha
2 开始安装CDH

使用chrome进入10.0.10.1:7180页面,初始账户密码admin/admin

cdh在哪查看配置文件找到mysql用户名密码_hadoop_08


按操作一顿下一步,选择免费版

来到安装界面

cdh在哪查看配置文件找到mysql用户名密码_java_09


设置一个集群名字(随意!)

cdh在哪查看配置文件找到mysql用户名密码_大数据_10


因为已经手动安装过agent,所以只需要添加已经管理的机器即可

cdh在哪查看配置文件找到mysql用户名密码_大数据_11


添加http服务器的parcel地址

cdh在哪查看配置文件找到mysql用户名密码_数据仓库_12


这里“远程Parel存储库URL”,其余的删除,选择本地http服务器的cdh包目录

cdh在哪查看配置文件找到mysql用户名密码_大数据_13


点击继续开始安装CDH

cdh在哪查看配置文件找到mysql用户名密码_hadoop_14


一般配置没什么问题,这里安装也不会出什么岔子

cdh在哪查看配置文件找到mysql用户名密码_hadoop_15


勾选一下配置

cdh在哪查看配置文件找到mysql用户名密码_java_16


选择需要添加的组件,由于我做数仓,所以选择包含impala内核的组件

cdh在哪查看配置文件找到mysql用户名密码_hadoop_17


自定义角色分配,这些组件和角色后续都可以调整,不用太过纠结

cdh在哪查看配置文件找到mysql用户名密码_数据仓库_18


测试通过后继续往下安装

分配路径都默认就行,后续可以调整,点击继续直接开始运行

cdh在哪查看配置文件找到mysql用户名密码_mysql_19


PS:如果遇到创建某个库下的表失败的话,删除用户名和表重建即可(由于我是自己虚拟机的原因造成)

cdh在哪查看配置文件找到mysql用户名密码_hadoop_20

drop database hive;
drop user 'hive'@'%';
FLUSH PRIVILEGES;
CREATE DATABASE hive DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; 
GRANT ALL ON hive.* TO 'hive'@'%' IDENTIFIED BY 'cdh_hive'; 
FLUSH PRIVILEGES;

Resume继续安装

cdh在哪查看配置文件找到mysql用户名密码_大数据_21


cdh在哪查看配置文件找到mysql用户名密码_数据仓库_22


运行完成,进入cloudera-manager-service界面

cdh在哪查看配置文件找到mysql用户名密码_java_23

3 集群配置的调整
3.1 解决hive注解中文乱码问题
--1.表字段注解和表注解
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
--2.分区字段注解
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8 ;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;
--3.索引注解:
alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

至此,CDH6.2.1就安装完成了!第一次写博客,遇到了很多图片显示不出来,还有当时写的时候记录有误的,如果你在阅读中发现问题,麻烦留言或者私信说一下.