一.zookeeper 的使用场景如下

  • 分布式协调
  • 分布式锁
  • 元数据/配置信息管理
  • HA高可用性

二.zookeeper有哪些特点:

  1. 顺序一致性:所有请求全部有序
  2. 原子性:要么全部机器都成功,要么全部机器都别成功
  3. 数据一致性:无论连接到哪台ZK上去,看到的都是一样的数据,不能有数据不一致
  4. 高可用:如果某台机器宕机,要保证数据绝对不能丢失
  5. 实时性:一旦数据发生变更,其他人要实时感知到

三.分布式协调

这个其实是 zookeeper 很经典的一个用法,简单来说,就好比,你 A 系统发送个请求到 mq,然后 B 系统消息消费之后处理了。那 A 系统如何知道 B 系统的处理结果?用 zookeeper 就可以实现分布式系统之间的协调工作。A 系统发送请求之后可以在 zookeeper 上对某个节点的值注册个监听器,一旦 B 系统处理完了就修改 zookeeper 那个节点的值,A 系统立马就可以收到通知,完美解决

zookeeper做系统高可用 zookeeper如何实现高可用_分布式

四.分布式锁

举个栗子。对某一个数据连续发出两个修改操作,两台机器同时收到了请求,但是只能一台机器先执行完另外一个机器再执行。那么此时就可以使用 zookeeper 分布式锁,一个机器接收到了请求之后先获取 zookeeper 上的一把分布式锁,就是可以去创建一个 znode,接着执行操作;然后另外一个机器也尝试去创建那个 znode,结果发现自己创建不了,因为被别人创建了,那只能等着,等第一个机器执行完了自己再执行。

zookeeper做系统高可用 zookeeper如何实现高可用_zookeeper做系统高可用_02

五.元数据/配置信息管理

zookeeper 可以用作很多系统的配置信息的管理,比如 kafka、storm 等等很多分布式系统都会选用 zookeeper 来做一些元数据、配置信息的管理,包括 dubbo 注册中心不也支持 zookeeper 么

zookeeper做系统高可用 zookeeper如何实现高可用_分布式_03

六.HA高可用性

这个应该是很常见的,比如 hadoop、hdfs、yarn 等很多大数据系统,都选择基于 zookeeper 来开发 HA 高可用机制,就是一个重要进程一般会做主备两个,主进程挂了立马通过 zookeeper 感知到切换到备用进程

zookeeper做系统高可用 zookeeper如何实现高可用_zookeeper_04

七. 客户端和zookeeper之间的长连和会话是什么?

zk集群启动之后,自己分配好角色,然后客户端就会跟zk建立连接,是TCP长连接,也就建立了一个会话,就是session,可以通过心跳感知到会话是否存在,有一个sessionTimeout,意思就是如果连接断开了,只要客户端在指定时间内重新连接zk一台机器,就能继续保持session,否则session就超时了。

八. zookeeper的Watcher监听机制

客户端可以对znode进行Watcher监听,然后znode改变的时候回调通知你的这个客户端。

九.zookeeper集群的数据同步是用什么协议做的,保证数据一致性;

ZAB协议