前言

分布式锁就是在多个进程之间达到互斥的目的,常见的方案包括:基于DB的唯一索引、Zookeeper的临时有序节点、Redis的SETNX来实现;Redis因为其高性能被广泛使用,本文通过一问一答的方式来了解Redis如何去实现分布式锁的。

1.Redis怎么实现分布式锁

使用Redis提供的SETNX命令保证只有一次能写入成功

SETNX key value

当且仅当key不存在,则给key设值为value;若给定的key已经存在,则什么也不做;

127.0.0.1:6379> setnx lock 001
(integer) 1
127.0.0.1:6379> setnx lock 002
(integer) 0

当然也可以使用SET命令,并使用NX关键字

set <key> <value> NX

2.如果获取锁的节点挂了怎么办

如果仅仅使用SETNX命令,当某个节点抢占到锁,如果这时候当前节点挂了,那么导致这个锁无法释放,最终会导致死锁出现;这时候想到的是给key设置一个过期时间,这样就是节点挂了也会自动删除;

127.0.0.1:6379> expire lock 5
(integer) 1

以上使用expire命令设置过期时间;

3.如果Set执行完Expire未执行节点挂了

以上问题的原因是因为SETNX命令和Expire不是原子操作,所有有可能在执行完SETNX命令之后节点就挂了,这时候Expire还没来得及执行,同样会导致锁无法释放,出现死锁现象;

127.0.0.1:6379> set lock 001 ex 5 nx
OK

如上命令将SETNXExpire命令整合成一个原子操作,保证了同时成功同时失败;

4.没有获取锁的节点如何阻塞处理

没有获取到锁的节点需要处于阻塞状态,并且定时去重试,保证第一时间能获取锁;

while(true){
   set lock uuid ex 5 nx;   ## 抢占锁
   if(获取锁){
      break;
   }
   ......
   sleep(1);                ## 防止一直消耗CPU 
}

如果想功能更强大一点可以指定阻塞时间,超过指定阻塞时间就直接获取锁失败;

5.如果解决锁的可重入问题

可重入就是如果某个线程获取了锁,那么当前线程再次获取锁的时候,应该还是可以进入锁中的,每重入一次数量加一,出来时减一;本地可以使用threadId或者直接使用ThreadLocal来实现;当然最好是直接把相关信息保存在Redis中,Redisson使用lua脚本来记录threadId信息:

if (redis.call('exists', KEYS[1]) == 0) then            ## 如果锁不存在
redis.call('hincrby', KEYS[1], ARGV[2], 1);             ## 保存锁,同时设置threadId
redis.call('pexpire', KEYS[1], ARGV[1]);                ## 设置过期时间
return nil; 
end; 
if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then  ## 如果锁存在并且threadId就是当前线程id
redis.call('hincrby', KEYS[1], ARGV[2], 1);             ## 给threadId自增
redis.call('pexpire', KEYS[1], ARGV[1]);                ## 设置过期时间
return nil; 
end; " 
return redis.call('pttl', KEYS[1]);

6.如果过期时间到了,任务刚好执行完会怎么样

正常来说我们预估的过期时间相对来说都比执行任务的时间长一些,所以当任务执行完之后会做删除操作

127.0.0.1:6379> del lock
(integer) 1

有没有可能A节点获取的锁过期时间到了,锁被删除,这时候B节点获取到锁,又重新执行了set ex nx命令;而刚好A节点任务执行完成,并且执行删除锁命令,把B节点的锁给删掉,出现锁被误删的情况;

这种情况就需要我们在删除锁的时候,检查当前被删除的锁是否就是我们之前获取的锁,可以在set的时候执行一个唯一的value,比如直接使用uuid;这样在删除的时候我们需要先获取锁对应的value值,然后和当前节点对象的value做比较,一致才可以删除;

string uuid = gen();     ## 生成一个唯一value
set lock uuid ex 5 nx;   ## 抢占锁
......                   ## 执行业务   
string value = get lock; ## 获取当前锁对应的value值
if(value == uuid) {      ## 对比获取的value值和uuid是否一致
   del lock              ## 一致执行删除操作
} else {
   return;               ## 否则不执行删除操作
}

7.如果过期时间到了,任务还没执行完怎么办

过期时间是一个预估的时间,如果真有某个任务执行的时间很长,而这时候刚好过期时间到了,锁就会被删除,导致其他节点又可以获取锁了,这样就出现了多个节点同时获取锁的情况;

这种情况一般会这么解决:

  • 过期时间设置的足够长,确保任务可以执行完;
  • 启动一个守护线程,为将要过期但未释放的锁增加时间,就是给锁续命;

我们常用的工具包Redisson,内部提供了一个监控锁的看门狗,它的作用是在Redisson实例被关闭前,不断的延长锁的有效期;内部使用HashedWheelTimer作为定时器定期检查;

8.Redis主节点宕机,还未同步从节点怎么办

我们知道Redis主从同步是异步的,如果某个节点获取了锁,这时候锁信息还未同步到从节点,主节点宕机了,从节点升级为主节点,导致锁丢失;这种情况Redis作者提出了redlock算法,大致含义如下:

在Redis的分布式环境中,假设我们有N个Redis主机;这些节点是完全独立的,因此我们不使用复制或任何其他隐式协调系统;

当且仅当从大多数(N/2+1,这里是3个节点)的Redis节点都取到锁,并且使用的时间小于锁失效时间时,锁才算获取成功。

Redisson提供了RedLock的支持,使用也很简单:

RLock lock1 = redissonClient1.getLock(resourceName); 
RLock lock2 = redissonClient2.getLock(resourceName); 
RLock lock3 = redissonClient3.getLock(resourceName); 
// 向3个redis实例尝试加锁 
RedissonRedLock redLock = new RedissonRedLock(lock1, lock2, lock3);

更多:redlock

9.Redis出现集群脑裂会怎么样

集群脑裂指因为网络问题,导致主节点、从节点以及sentinel处于不同的网络分区,因为sentinel的存在会因为某些主节点不存在,而提升从节点为主节点,这时候就存在了不同的主节点,此时不同的客户端可能连接不同的主节点,两个客户端可以同时拥有同一把锁;

Redis 提供了两个配置项来限制主库的请求处理,分别是 min-slaves-to-writemin-slaves-max-lag

  • min-slaves-to-write:设置了主库能进行数据同步的最少从库数量
  • min-slaves-max-lag:设置了主从库间进行数据复制时,从库给主库发送ACK消息的最大延迟(以秒为单位)

配置项组合后要求主库连接的从库中至少有 N 个从库、主库进行数据复制时的 ACK 消息延迟不能超过N秒,否则主库就不会再接收客户端的请求。

10.如何实现一个公平锁

我们知道ReentrantLock通过AQS来公平锁,AQS内部通过双向队列来实现,Redis本身提供了多种数据结构包括列表、有序集合等;Redisson实现公平锁正是通过Redis内置的数据结构来实现的:

  • 使用列表作为线程的等待队列,新的等待队列添加到列表的尾部;
  • 使用有序集合存放等待线程的顺序,分数score是等待线程的超时时间戳;

总结

不管使用哪种方式去实现分布式锁,我们前提需要保证锁的功能包括:互斥性、可重入性、阻塞性;同时因为分布式的存在我们需要保证系统的高可用、高性能、杜绝一切出现死锁和同时获得锁的情况。