系统要求
支持的平台
ZooKeeper由多个组件组成。某些组件得到广泛支持,其他组件仅在较小的平台上受支持。
- 客户端是Java客户端库,应用程序使用它连接到ZooKeeper集合。
- Server是在ZooKeeper集合节点上运行的Java服务器。
- Native Client是一个用C实现的客户端,类似于Java客户端,应用程序使用它连接到ZooKeeper集合。
- Contrib是指多个可选的附加组件。
以下矩阵描述了为在不同操作系统平台上运行每个组件而提交的支持级别。
支持矩阵
操作系统 | 客户 | 服务器 | 原生客户端 | 的Contrib |
GNU / Linux的 | 开发和生产 | 开发和生产 | 开发和生产 | 开发和生产 |
的Solaris | 开发和生产 | 开发和生产 | 不支持 | 不支持 |
FreeBSD的 | 开发和生产 | 开发和生产 | 不支持 | 不支持 |
视窗 | 开发和生产 | 开发和生产 | 不支持 | 不支持 |
Mac OS X. | 仅限发展 | 仅限发展 | 不支持 | 不支持 |
对于矩阵中未明确提及的任何操作系统,组件可能有效,也可能无效。ZooKeeper社区将修复针对其他平台报告的明显错误,但没有完全支持。
必备软件
ZooKeeper在Java中运行,1.7或更高版本(JDK 7或更高版本,FreeBSD支持需要openjdk7)。它作为ZooKeeper服务器的集合运行。三个ZooKeeper服务器是整体的最小建议大小,我们还建议它们在不同的机器上运行。在Yahoo!,ZooKeeper通常部署在专用的RHEL盒子上,具有双核处理器,2GB RAM和80GB IDE硬盘。
独立操作(单机)
在独立模式下设置ZooKeeper服务器非常简单。服务器包含在单个JAR文件中,因此安装包括创建配置。
下载完一个稳定的ZooKeeper版本后,将其解压缩并cd到root
要启动ZooKeeper,您需要一个配置文件。这是一个示例,在conf / zoo.cfg中创建它:
tickTime=2000
dataDir=/var/lib/zookeeper
clientPort=2181
这个文件可以直接被引用,但为了这个目的,请将其命名为conf / zoo.cfg。更改dataDir的值以指定现有(从空开始)目录。以下是每个字段的含义:
- tickTime:ZooKeeper使用的基本时间单位(以毫秒为单位)。它用于做心跳,最小会话超时将是tickTime的两倍。
- dataDir:存储内存数据库快照的位置,除非另有说明,否则为数据库更新的事务日志。
- clientPort:侦听客户端连接的端口
现在您已创建配置文件,您可以启动ZooKeeper:
bin/zkServer.sh start
ZooKeeper使用log4j记录消息 - 更多详细信息,请参阅Programmer's Guide 的Logging部分。您将看到日志消息进入控制台(默认)和/或日志文件,具体取决于log4j配置。
此处列出的步骤在独立模式下运行ZooKeeper。没有复制,因此如果ZooKeeper进程失败,服务将关闭。这适用于大多数开发情况,但要在复制模式下运行ZooKeeper,请参阅运行Replicated ZooKeeper。
管理ZooKeeper存储
对于长期运行的生产系统,必须在外部管理ZooKeeper存储(dataDir和logs)。有关详细信息,请参阅维护部分。
连接到ZooKeeper
$ bin/zkCli.sh -server 127.0.0.1:2181
这使您可以执行简单的文件操作。
连接后,您应该看到类似的内容:
Connecting to localhost:2181
log4j:WARN No appenders could be found for logger (org.apache.zookeeper.ZooKeeper).
log4j:WARN Please initialize the log4j system properly.
Welcome to ZooKeeper!
JLine support is enabled
[zkshell: 0]
在shell中,键入help
以获取可从客户端执行的命令列表,如:
[zkshell: 0] help
ZooKeeper host:port cmd args
get path [watch]
ls path [watch]
set path data [version]
delquota [-n|-b] path
quit
printwatches on|off
create path data acl
stat path [watch]
listquota path
history
setAcl path acl
getAcl path
sync path
redo cmdno
addauth scheme auth
delete path [version]
deleteall path
setquota -n|-b val path
从这里,您可以尝试一些简单的命令来感受这个简单的命令行界面。首先,从发出list命令开始,如ls
:,产生:
[zkshell: 8] ls /
[zookeeper]
接下来,通过运行创建一个新的znode create /zk_test my_data
。这将创建一个新的znode并将字符串“my_data”与节点相关联。你应该看到:
[zkshell: 9] create /zk_test my_data
Created /zk_test
发出另一个ls /
命令以查看目录的外观:
[zkshell: 11] ls /
[zookeeper, zk_test]
请注意,现在已创建zk_test目录。
接下来,通过运行get
命令验证数据是否与znode相关联,如下所示:
[zkshell: 12] get /zk_test
my_data
cZxid = 5
ctime = Fri Jun 05 13:57:06 PDT 2009
mZxid = 5
mtime = Fri Jun 05 13:57:06 PDT 2009
pZxid = 5
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0
dataLength = 7
numChildren = 0
我们可以通过发出set
命令来更改与zk_test关联的数据,如下所示:
[zkshell: 14] set /zk_test junk
cZxid = 5
ctime = Fri Jun 05 13:57:06 PDT 2009
mZxid = 6
mtime = Fri Jun 05 14:01:52 PDT 2009
pZxid = 5
cversion = 0
dataVersion = 1
aclVersion = 0
ephemeralOwner = 0
dataLength = 4
numChildren = 0
[zkshell: 15] get /zk_test
junk
cZxid = 5
ctime = Fri Jun 05 13:57:06 PDT 2009
mZxid = 6
mtime = Fri Jun 05 14:01:52 PDT 2009
pZxid = 5
cversion = 0
dataVersion = 1
aclVersion = 0
ephemeralOwner = 0
dataLength = 4
numChildren = 0
(注意我们get
在设置数据之后做了一次,确实改变了。
最后,让我们delete
通过发出以下节点:
[zkshell: 16] delete /zk_test
[zkshell: 17] ls /
[zookeeper]
[zkshell: 18]
这就是现在。要了解更多信息,请继续阅读本文档的其余部分,并参阅“ 程序员指南”。
编程到ZooKeeper
ZooKeeper具有Java绑定和C绑定。它们在功能上是等价的。C绑定有两种变体:单线程和多线程。这些仅在消息传递循环的完成方式上有所不同。有关更多信息,请参阅ZooKeeper程序员指南中的编程示例,了解使用不同API的示例代码。
运行复制的ZooKeeper(集群)
在独立模式下运行ZooKeeper便于评估,开发和测试。但在生产中,您应该以复制模式运行ZooKeeper。同一应用程序中的复制服务器组称为仲裁,在复制模式下,仲裁中的所有服务器都具有相同配置文件的副本。
注意
对于复制模式,至少需要三台服务器,强烈建议您使用奇数个服务器。如果您只有两台服务器,那么您处于这样的情况:如果其中一台服务器出现故障,则没有足够的机器来构成多数仲裁。两台服务器本质上不如单一服务器稳定,因为有两个单点故障。
复制模式所需的conf / zoo.cfg文件类似于独立模式中使用的文件,但有一些差异。这是一个例子:
tickTime=2000
dataDir=/var/lib/zookeeper
clientPort=2181
initLimit=5
syncLimit=2
server.1=zoo1:2888:3888
server.2=zoo2:2888:3888
server.3=zoo3:2888:3888
新条目initLimit是暂停ZooKeeper用于限制仲裁中ZooKeeper服务器连接到领导者的时间长度。条目syncLimit限制服务器与领导者的过期时间。
使用这两个超时,您可以使用tickTime指定时间单位。在这个例子中,initLimit的超时是2000个milleseconds(滴答)或10秒的5个滴答。
表单server.X的条目列出构成ZooKeeper服务的服务器。当服务器启动时,它通过在数据目录中查找文件myid来知道它是哪个服务器。该文件包含服务器编号,ASCII格式。
最后,记下每个服务器名称后面的两个端口号:“2888”和“3888”。对等方使用以前的端口连接到其他对等方。这种连接是必要的,以便对等方可以进行通信,例如,就更新的顺序达成一致。更具体地说,ZooKeeper服务器使用此端口将关注者连接到领导者。当新的领导者出现时,跟随者使用此端口打开与领导者的TCP连接。由于默认的领导者选举也使用TCP,我们目前需要另一个端口进行领导者选举。这是服务器条目中的第二个端口。
设置日志路径
修改 bin/zkEnv.sh 文件
依次启动后通过查看状态可见
注意
如果要在一台计算机上测试多个服务器,请将servername指定为localhost,并为该服务器中的每个server.X 指定唯一的仲裁和领导者选举端口(即上例中的2888:3888,2889:3889,2890:3890)。配置文件。当然,单独的_dataDir_s和distinct _clientPort_s也是必需的(在上面复制的例子中,在单个localhost上运行,你仍然会有三个配置文件)。
请注意,在一台计算机上设置多台服务器不会产生任何冗余。如果发生导致机器死亡的事情,所有zookeeper服务器都将脱机。完全冗余要求每台服务器都有自己的机器。它必须是完全独立的物理服务器。同一物理主机上的多个虚拟机仍然容易受到该主机的完全故障的影响。
其他优化
还有一些其他配置参数可以大大提高性能:
- 要在更新时获得较低的延迟,请务必拥有专用的事务日志目录。默认情况下,事务日志与数据快照和myid文件放在同一目录中。dataLogDir参数指示用于事务日志的不同目录。
安装zkui
1.下载项目https://github.com/DeemOpen/zkui
2.使用maven编译jar包
3.上传生成的两个jar包中的 zkui-2.0-SNAPSHOT-jar-with-dependencies.jar,和最外层目录下的文件 config.cfg 到服务器,这两个文件要放在一起。(或者直接在linux上打包需要安装maven环境)
4.直接正常启动 java -jar zkui-2.0-SNAPSHOT-jar-with-dependencies.jar
5.修改config.cfg文件
6.启动完成后,直接通过浏览器 ip:9090 查看对应ip下的zk情况
效果图