相关的总结不错的文章:ZooKeeper安装部署:

一。安装:

ookeeper 是一个分布式开源框架,提供了协调分布式应用的基本服务,它向外部应用暴露一组通用服务——分布式同步(Distributed Synchronization)、命名服务(Naming Service)、集群维护(Group Maintenance)等,简化分布式应用协调及其管理的难度,提供高性能的分布式服务。ZooKeeper本身可以以单机模式安装运行,不过它的长处 在于通过分布式ZooKeeper集群(一个Leader,多个Follower),基于一定的策略来保证ZooKeeper集群的稳定性和可用性,从而 实现分布式应用的可靠性。

本文将向大家主要介绍Zookeeper的安装与配置。
众所周知,Zookeeper有三种不同的运行环境,包括:单机环境、集群环境和集群伪分布式环境。

  1. 单机环境 直接解压,重命名配置文件为zoo.cfg
  2. 集群环境 a. 载后解压至安装目录下,本文我们解压到目录:/home/haduser/zookeeper
$:tar -xzvf zookeeper-3.4.5.tar.gz

         b.zookeeper的环境变量的配置:
            为了今后操作方便,我们需要对Zookeeper的环境变量进行配置,方法如下:
            在/etc/profile文件中加入如下的内容:
            set zookeeper environment

export ZOOKEEPER_HOME=/home/haduser/zookeeper/zookeeper-3.4.5 
     export PATH=$PATH:$ZOOKEEPER_HOME/bin:$ZOOKEEPER_HOME/conf

 

3.集群部署:

在Zookeeper集群环境下只要一半以上的机器正常启动了,那么Zookeeper服务将是可用的。因此,集群上部署Zookeeper最好使用奇数台机器,

这样如果有5台机器,只要3台正常工作则服务将正常使用。

下面我们将对Zookeeper的配置文件的参数进行设置:

进入zookeeper-3.4.5/conf:

$:cp zoo_sample.cfg zoo.cfg 
$:vim zoo.cfg

注意上图的配置中master,slave1分别为主机名,具体的对应的主机可参见之前的Hadoop的安装与配置的博文。

在上面的配置文件中”server.id=host:port:port”中的第一个port是从机器(follower)连接到主机器(leader)的端口号,第二个port是进行leadership选举的端口号。

接下来在dataDir所指定的目录下创建一个文件名为myid的文件,文件中的内容只有一行,为本主机对应的id值,也就是上图中server.id中的id。例如:在服务器1中的myid的内容应该写入1。

4.远程复制分发安装文件

接下来将上面的安装文件拷贝到集群中的其他机器上对应的目录下:

haduser@master:~/zookeeper$ scp -r zookeeper-3.4.5/ slave1:/home/haduser/zookeeper/zookeeper-3.4.5 
haduser@master:~/zookeeper$ scp -r zookeeper-3.4.5/ slave2:/home/haduser/zookeeper/zookeeper-3.4.5

拷贝完成后修改对应的机器上的myid。例如修改slave1中的myid如下:

haduser@slave1:~/zookeeper/zookeeper-3.4.5$ echo "2" > data/myid 
haduser@slave1:~/zookeeper/zookeeper-3.4.5$ cat data/myid

5.启动ZooKeeper集群
在ZooKeeper集群的每个结点上,执行启动ZooKeeper服务的脚本,如下所示:

$ bin/zkServer.sh start 
$ bin/zkServer.sh start 
$ bin/zkServer.sh start 
$ jps 
24466 NodeManager 
24230 SecondaryNameNode 
20357 QuorumPeerMain 
22010 Jstatd 
20396 Jps 
23962 DataNode

其中,QuorumPeerMain是zookeeper进程,启动正常。
如上依次启动了所有机器上的Zookeeper之后可以通过ZooKeeper的脚本来查看启动状态,包括集群中各个结点的角色(或是Leader,或是Follower),如下所示,是在ZooKeeper集群中的每个结点上查询的结果:

hadoop@gdc-dn01-test:~/zookeeper$ bin/zkServer.sh status 
JMX enabled by default 
Using config: /home/hadoop/zookeeper/bin/../conf/zoo.cfg 
Mode: leader

 通过上面状态查询结果可见,slave1是集群的Leader,其余的两个结点是Follower。

另外,可以通过客户端脚本,连接到ZooKeeper集群上。对于客户端来说,ZooKeeper是一个整体(ensemble),连接到ZooKeeper集群实际上感觉在独享整个集群的服务,所以,你可以在任何一个结点上建立到服务集群的连接,例如:

$ bin/zkCli.sh 
$ ls /

 

二,基本操作

  1. 启动、关闭zookeeper
bin/zkServer.sh start 
bin/zkServer.sh stop

      2. 查看基本状态

bin/zkServer status -su: 
bin/zkServer: No such file or directory 
hadoop@gdc-dn48-formal:~/zookeeper$ 
bin/zkServer.sh status JMX enabled by default Using config: /home/hadoop/zookeeper/bin/../conf/zoo.cfg 
Mode: follower

      3. 日志清理

        zk在运行过程中会产生大量的日志,zk提供了脚本运行清理

bin/zkCleanup.sh -n 20

        只保留最新的20个日志文件

 

      4. 常用操作命令

      

[zk: localhost:2181(CONNECTED) 0] help 
ZooKeeper -server host:port cmd args 
connect host:port 
get path [watch] 
ls path [watch] 
set path data [version] 
rmr path delquota [-n|-b] path 
quit 
printwatches on|off 
create [-s] [-e] path data acl 
stat path [watch] 
close ls2 path [watch] 
history listquota path 
setAcl path acl 
getAcl path sync path 
redo cmdno 
addauth scheme auth 
delete path [version] 
setquota -n|-b val path

 

学习,总结,沉淀,提高。