调度节点和数据节点都为多节点,联邦架构
安装要求
1. coordinator 不得超过64台
- 建议为单数 3、5、7...
- 过多调度节点增加同步开销,以满足客户端并发查询请求为标准
2. coordinator 必须再同一网段,Data Node 无此要求。
3. 各节点安装相同版本(包括小版本)操作系统
4. 开启SSH服务,GBase 8a依赖ssh协议实现集群节点间通讯
systemctl status sshd
5. 关闭防火墙和SElinux,或开放对应端口
systemctl status firewalld
sestatus
安装建议
1. /opt 为默认安装目录,建议挂载为逻辑卷方便扩容。元数据和用户数据都在该目录。
2. 建议硬盘使用RAID技术
3. 建议各节点时钟同步(安装不做要求,但便于排查故障)
安装准备
root:
1. 获取并解压缩软件包(主节点)
GBase8a_MPP_Cluster-License-9.5.2.39-redhat7.3-x86_64.tar.bz2
- License 安装需要License注册
- 9.5.2.39 GCluster 版本
- redhat7.3 系统版本
2. 复制环境设置脚本到所有节点
3. 运行脚本配置安装环境(所有节点)
python SetSysEnv.py --dbaUser=gbase --installPrefix=/opt/gbase --cgroup
- dbaUser DBA用户,即集群安装用户,需同demo.options中dbaUser设置一致
- installPrefix 数据库安装目录,需同demo.options中installPrefix设置一致
- cgroup 可选参数,建议配置,用于修改资源管理配置文件
3. 创建DBA用户(所有节点)
4. 创建安装目录并授权(所有节点)
集群安装
1. 软件安装(主节点)
su - gbase
cd /opt/gcinstall/
vi demo.options
installPrefix= /opt/gbase
coordinateHost = 192.168.10.81,192.168.10.82,192.168.10.83
coordinateHostNodeID = 81,82,83 #非必须,不是关键信息
dataHost = 192.168.10.81,192.168.10.82,192.168.10.83
#existCoordinateHost = #用于扩容
#existDataHost = #用于扩容
dbaUser = gbase
dbaGroup = gbase
dbaPwd = 'gbase'
rootPwd = 'root'
#rootPwdFile = rootPwd.json #不常用
./gcinstall.py --silent=demo.options --passwordInputMode=Mode
- Mode
- file(默认),从文件或命令行参数获取,密码明文
- pwdsame 终端用户输入,所有节点密码相同
- pwddiff 终端用户输入,每个节点提示输入密码
2.注册License(主节点)+ 启用个节点服务
2.1 获取指纹信息
./gethostsid -n 192.168.10.81,192.168.10.82,192.168.10.83 -u root -p 密码 -f /tmp/finger.txt
用于采集少数节点指纹信息
./gethostsid --hosts=demo.hosts -u root -p 密码 -f /tmp/finger.txt
用于采集多节点指纹信息
-u 使用root用户采集指纹信息,若无root权限也可用DBA用户采集
-hosts 指定节点列表文件,内容如:Hosts=192.168.10.81,192.168.10.82,192.168.10.83
-f 指定指纹信息保存文件名
2.2 将指纹信息发送gbase邮箱
mail to : license@gbase.cn
客户名称:公司名称
项目名称:测试学习、2021年8月认证学习
申请人:XXX
申请原因:初次申请/已到有效期/硬件变更License失效/测试学习
有效期:最长到合同到期,培训或测试有效期3个月
操作系统:cat /etc/redhat-release
附件:指纹信息
8a集群版本: GBase8a_MPP_Cluster-License-9.5.2.39-redhat7.3-x86_64.tar.bz2
2.3 导入License
./License -n 192.168.10.81,192.168.10.82,192.168.10.83 -f /tmp/20210608.lic -u gbase -p gbase
或
./License --hosts=demo.hosts -f /tmp/20210608.lic -u gbase -p gbase
导入License 使用DBA用户
2.4 检查License状态
./chkLicense -n 192.168.10.81,192.168.10.82,192.168.10.83 -u gbase -p gbase
或
./chkLicense --hosts=demo.hosts -u gbase -p gbase -f check.resoult
2.5 所有节点重启数据库服务
su - gbase
gcluster_services all start
gcadmin
3.设置分片信息(Coordinator节点)
设置集群分片信息,生成分片信息表gcadmin distribution <gcChangeinfo.xml> <p number> [d number] [pattern 1|2]
gcChangeinfo.xml 描述集群内节点和rack(机柜)对应关系的文件,默认在gcinstall目录
p 每个数据节点存放的`主`分片数。pattern 1 模式下,1<=p<rack 内节点数
d 每个主分片的副本数,取值0,1,2 默认1.最大2
pattern 描述分片规则的模板。1为rack高可用,机架间互备;2为节点高可用,节点间互备。默认1.
1 还有一种用法:所有节点都在一个机架内,实现分片各副本负载均衡高可用。
gcChangeInfo.xml自动包含了前面提供的所有节点IP,但默认在一个rack内,如果要修改需手工编辑。
查看分布表ID为1 的状态信息gcadmin showdistribution node
分片信息表生成后,没有生效,需要初始化生效。
4.数据库初始化(Coordinator节点)
gccli -uroot -p #默认密码为空,可直接用 gccli 登录
gbase> show databases
gbase> create database test # 没有初始化节点映射信息,只能查看不能建库。
gbase> initnodedatamap; #初始化节点数据映射,初始化命令只需对distribution表执行一次即可。会创建一个gclusterdb库。
安装失败日志 gcinstall/gcinstall.log
集群卸载
注意: 卸载后,所有数据将丢失。如有必要,请先备份。
1. 手动停止所有节点集群服务
2. 验证卸载配置文件,应正确描述集群节点状态
3. 执行卸载操作
1.检查集群服务状态
[gbase@gbase81 gcinstall]$ gcmonit --status
+--------------------------------------------------------------------------------+
|SEG_NAME PROG_NAME STATUS PID |
+--------------------------------------------------------------------------------+
|gcluster gclusterd Running 8563 |
|gcware gcware Running 2639 |
|gcrecover gcrecover Running 2787 |
|gcmmonit gcmmonit Running 2964 |
|gbase gbased Running 8621 |
|syncserver gc_sync_server Running 2957 |
+--------------------------------------------------------------------------------+
2.停止所有节点集群服务
gcluster_services <gbase|gluster|gcrecover|syncserver|all> <start| stop [--force] | restart [--force]|info>
--force 不能正常停止服务时,内部用kill -9杀进程
3.验证卸载配置文件
检查demo.options文件是否正确,描述正确则再卸载时可调用该文件
4.卸载
./unInstall.py --silent=demo.options [passwordInputMode]
附默认端口
组件 | 默认端口 | 协议 | 说明 |
---|---|---|---|
Gcluster | 5258 | TCP | Coordinator集群节点对外提供服务端口 |
Gnode | 5050 | TCP | Data 集群节点对外提供服务端口 |
Gcware | 5918 | TCP/UDP | gcware节点间通讯端口 |
gcware | 5919 | TCP | 外部连接gcware节点端口 |
Recover_monit_port | 6268 | TCP | 监控收集信息端口 |
syncServer | 5288 | TCP | syncServer 服务端口 |
GcrecoverMonit | 6268 | TCP | Gcrecover 服务端口 |
数据远程导出端口 | 16066-16166 | TCP | 数据远程导出端口 |