经过前一篇文章《zookeeper伪集群一》的阅读,相信大家对zookeeper集群已经有一定的了解了,接下来我们再谈谈zookeeper真集群。其实真集群和伪集群还是有很多相似的部分的,我将模拟3台集群服务并且对其中一台集群服务的配置进行讲解,接下来两台操作基本一模一样。
铺垫:
1、 本人创建3台虚拟机,Linux版本为CentOS7,工具为vmware12
2、外部链接虚拟机的工具为小xmanager5,这个工具只是方便一些,你也可以不用
3、需要提前在虚拟机上装好jdk1.7及以上版本,我使用的是1.8版本的,如果不会装jdk,可以参照我的另一篇文章《Linux下的jdk安装》
4、本人将3台虚拟机创建好,获取到的外网地址分别为192.168.0.124,192.168.0.129,192.168.0.127,我分别取别名为CentOS1,CentOS3,CentOS4
5、接下来的说明中,如果有关联关系的地方,我会加粗并且用相同颜色进行标注
搭建:
1、修改zookeeper下的zoo.cfg文件,具体内容如下:
tickTime=2000
syncLimit=10
initLimit=5
dataDir=/home/d5000/zk/data
clientPort=3001
dataLogDir=/home/d5000/zk/log
server.1 = 192.168.0.124:2887:3887
server.2 = 192.168.0.129:2887:3887
server.3 = 192.168.0.127:2887:3887
因为是集群,所以3台机器的端口号可以完全一致,可以共用一个zoo.cfg文件
dataDir配置的映射文件;接下来将zookeeper也传到zk目录下,这一点与伪集群一致
3、在CentOS1机器的/home/d5000/zk/data下创建myid文件,内容是1;
在CentOS3机器的/home/d5000/zk/data下创建myid文件,内容是2;
在CentOS4机器的/home/d5000/zk/data下创建myid文件,内容是3;
4、分别给3台机器zookeeper权限,否则如何启动呢?可以先给zookeeper一个启动权限,进入/home/d5000/zk/zookeeper/bin,执行chmod 777 zkServer.sh
至此,集群创建完毕,真叫那个简单呀,开开心心的进行测试,分别进行启动, ./ zkServer.sh start ,第一台报错,第二台报错,第三台还是报错,而且错误信息一致,都是zookeeper no route to host,上网一查发现,有2个可能导致这个问题的出现,一个是防火墙,另一个是hostname。
排查问题:
1、分别查看3台机器防火墙是否关闭:firewall-cmd --state,发现防火墙确实没有关闭,果断执行关闭systemctl stop firewalld.service
2、修改CentOS1机器,执行hostname server.1 命令
修改CentOS3机器,执行hostname server.2 命令
修改CentOS4机器,执行hostname server.3 命令
3、重启虚拟机,init 6 接下来重启服务
4,结果还是报一样的错误 zookeeper no route to host,瞬间懵逼
-----------------------------------------------------------------------以下都是心碎,省略一万字-------------------------------------------------------------------------
经过多方努力,最终在掌握一定的虚拟机知识后才发现,systemctl stop firewalld.service关闭的防火墙是暂时的,只要服务一重启防火墙立马又生效,还有那个hostname也一样:
最终修改
1、彻底禁用防火墙:systemctl disable firewalld.service
2、修改CentOS1机器/etc/hostname文件,内容为server.1
修改CentOS3机器/etc/hostname文件,内容为server.2
修改CentOS4机器/etc/hostname文件,内容为server.3(永久修改)
3、启动第一台、第二台发现还是有错误信息,但是现在的错误信息意见转变为connect refuesd(拒绝链接),继续启动第三台服务器,发现没有报错信息,而且测试后发现集群服务正常,第一 台报错是因为第二第三台服务器没有启动导致,第二台报错是因为第三台集群服务没启动导致。这些错误完全不妨碍集群
下面提供一下最简单的测试,在192.168.0.124执行 telent 192.168.0.127 3001 telent 192.168.0.129 3001 如果都能链接成功,说明各自的服务已经能够正常运行,并且可以进行通信,接下来可以通过代码进行更加完善的测试。
效果如图:
完毕