首先介绍一下两个关键的指标
zxid myid zk的选举主要根据这两个指标的大小来确定leader
【zxid】
zxid为64位且 初始化是 0,也就是这样
例如,此时你写入了zk一次,就会变成下图这样
前32位变化有以下两种情况
1 选举一次前32位加1,后32位重置为0
2 除了选举以外,当后 32 位彻底用完也会让前 32 位增加 1,因为无地可记。
如下图情况,计数器再加一
# 00000000000000000000000000000000 11111111111111111111111111111111
【myid】
集群中 每个节点自己的id 外显为:
创建myid文件,并写入自己的id 必须在zoo.cfg当中的一个 ,比如我启动为2,那么我的myid文件里要写2
myid的值是zoo.cfg文件里定义的server.A项A的值,Zookeeper 启动时会读取这个文件,拿到里面的数据与 zoo.cfg 里面的配置信息比较从而判断到底是那个server,只是一个标识作用。
如果配置了zookeeper.extendedTypesEnabled=true那当前节点的最大 myid 是 254
【选举过程】
zxid和myid的大小,优先比较zxid,zxid大的当选leader
举例:
服务刚启动
- 每个服务器发出一个投票
服务器1 和 服务器2都将自己作为Leader服务器进行投票,投票的基本元素包括:服务器的myid和ZXID,我们以(myid,ZXID)形式表示。初始阶段,服务器1和服务器2都会投给自己,即服务器1的投票为(1,0),服务器2的投票为(2,0),然后各自将这个投票发给集群中的其他所有机器。 - 接受来自各个服务器的投票
每个服务器都会接受来自其他服务器的投票。同时,服务器会校验投票的有效性,是否本轮投票、是否来自LOOKING状态的服务器。 - 处理投票
收到其他服务器的投票,会将被人的投票跟自己的投票PK,PK规则如下:
优先检查ZXID。ZXID比较大的服务器优先作为leader。
-
如果ZXID相同的话,就比较myid,myid比较大的服务器作为leader。
服务器1的投票是(1,0),它收到投票是(2,0),两者zxid都是0,因为收到的myid=2,大于自己的myid=1,所以它更新自己的投票为(2,0),然后重新将投票发出去。对于服务器2呢,即不再需要更新自己的投票,把上一次的投票信息发出即可。
- 统计投票
每次投票后,服务器会统计所有投票,判断是否有过半的机器接受到相同的投票信息。服务器2收到两票,少于3(n/2+1,n为总服务器),所以继续保持LOOKING状态
- 服务器3(myid=3)启动,继续进入Leader选举阶段
跟前面流程一致,服务器1和2先投自己一票,因为服务器3的myid最大,所以大家把票改投给它。此时,服务器为3票(大于等于n/2+1),所以服务器3当选为Leader。 服务器1,2更改状态为FOLLOWING,服务器3更改状态为LEADING; - 服务器4启动,发起一次选举。
此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。选票信息结果:服务器3为4票,服务器4为1票。服务器4并更改状态为FOLLOWING; - 服务器5启动,发起一次选举。
同理,服务器也是把票投给服务器3,服务器5并更改状态为FOLLOWING; - 投票结束,服务器3当选为Leader
服务稳定运行期间
- 1.变更状态
Leader 服务器挂了之后,余下的非Observer服务器都会把自己的服务器状态更改为LOOKING,然后开始进入Leader选举流程。 - 2.每个服务器发起投票
每个服务器都把票投给自己,因为是运行期间,所以每台服务器的ZXID可能不相同。假设服务1,2,4,5的zxid分别为333,666,999,888,则分别产生投票(1,333),(2,666),(4,999)和(5,888),然后各自将这个投票发给集群中的其他所有机器。 - 3.接受来自各个服务器的投票
- 4.处理投票
投票规则是跟Zookeeper集群启动期间一致的,优先检查ZXID,大的优先作为Leader,所以显然服务器zxid=999具有优先权。 - 5.统计投票
- 6.改变服务器状态
资料参考:
https://xw.qq.com/cmsid/20210311A02CW400
https://www.jianshu.com/p/4937798d16b3