并发编程从零开始(十二)-Lock与Condition

8 Lock与Condition

8.1 互斥锁

8.1.1 锁的可重入性

“可重入锁”是指当一个线程调用 object.lock()获取到锁,进入临界区后,再次调用object.lock(),仍然可以获取到该锁。显然,通常的锁都要设计成可重入的,否则就会发生死锁。

synchronized关键字,就是可重入锁。在一个synchronized方法method1()里面调用另外一个synchronized方法method2()。如果synchronized关键字不可重入,那么在method2()处就会发生阻塞,这显然不可行。

8.1.2 类继承层次

在正式介绍锁的实现原理之前,先看一下 Concurrent 包中的与互斥锁(ReentrantLock)相关类之间的继承层次,如下图所示:

并发编程从零开始(十二)-Lock与Condition_阻塞队列

Lock是一个接口,其定义如下:

并发编程从零开始(十二)-Lock与Condition_阻塞队列_02

常用的方法是lock()/unlock()。lock()不能被中断,对应的lockInterruptibly()可以被中断。

ReentrantLock本身没有代码逻辑,实现都在其内部类Sync中:

并发编程从零开始(十二)-Lock与Condition_读写锁_03

8.1.3 锁的公平性VS非公平性

Sync是一个抽象类,它有两个子类FairSync与NonfairSync,分别对应公平锁和非公平锁。从下面的ReentrantLock构造方法可以看出,会传入一个布尔类型的变量fair指定锁是公平的还是非公平的,默认为非公平的。

并发编程从零开始(十二)-Lock与Condition_juc_04

什么叫公平锁和非公平锁呢?先举个现实生活中的例子,一个人去火车站售票窗口买票,发现现场有人排队,于是他排在队伍末尾,遵循先到者优先服务的规则,这叫公平;如果他去了不排队,直接冲到窗口买票,这叫作不公平。

对应到锁的例子,一个新的线程来了之后,看到有很多线程在排队,自己排到队伍末尾,这叫公平;线程来了之后直接去抢锁,这叫作不公平。默认设置的是非公平锁,其实是为了提高效率,减少线程切换。

锁实现的基本原理

Sync的父类AbstractQueuedSynchronizer经常被称作队列同步器(AQS),这个类非常重要,该类的父类是AbstractOwnableSynchronizer。

此处的锁具备synchronized功能,即可以阻塞一个线程。为了实现一把具有阻塞或唤醒功能的锁,需要几个核心要素:

  1. 需要一个state变量,标记该锁的状态。state变量至少有两个值:0、1。对state变量的操作,使用CAS保证线程安全。
  2. 需要记录当前是哪个线程持有锁。
  3. 需要底层支持对一个线程进行阻塞唤醒操作。
  4. 需要有一个队列维护所有阻塞的线程。这个队列也必须是线程安全的无锁队列,也需要使用CAS。

针对要素1和2,在上面两个类中有对应的体现:

并发编程从零开始(十二)-Lock与Condition_读锁_05

state取值不仅可以是0、1,还可以大于1,就是为了支持锁的可重入性。例如,同样一个线程,调用5次lock,state会变成5;然后调用5次unlock,state减为0。

当state=0时,没有线程持有锁,exclusiveOwnerThread=null;

当state=1时,有一个线程持有锁,exclusiveOwnerThread=该线程;

当state > 1时,说明该线程重入了该锁。

对于要素3,Unsafe类提供了阻塞或唤醒线程的一对操作原语,也就是park/unpark。

并发编程从零开始(十二)-Lock与Condition_并发编程_06

有一个LockSupport的工具类,对这一对原语做了简单封装:

并发编程从零开始(十二)-Lock与Condition_读写锁_07

在当前线程中调用park(),该线程就会被阻塞;在另外一个线程中,调用unpark(Thread thread),传入一个被阻塞的线程,就可以唤醒阻塞在park()地方的线程。

unpark(Thread thread),它实现了一个线程对另外一个线程的“精准唤醒”。notify也只是唤醒某一个线程,但无法指定具体唤醒哪个线程。

针对要素4,在AQS中利用双向链表和CAS实现了一个阻塞队列。如下所示:

并发编程从零开始(十二)-Lock与Condition_读写锁_08

阻塞队列是整个AQS核心中的核心。如下图所示,head指向双向链表头部,tail指向双向链表尾部。入队就是把新的Node加到tail后面,然后对tail进行CAS操作;出队就是对head进行CAS操作,把head向后移一个位置。

并发编程从零开始(十二)-Lock与Condition_读写锁_09

初始的时候,head=tail=NULL;然后,在往队列中加入阻塞的线程时,会新建一个空的Node,让head和tail都指向这个空Node;之后,在后面加入被阻塞的线程对象。所以,当head=tail的时候,说明队列为空。

8.1.4 公平与非公平的lock()实现差异

下面分析基于AQS,ReentrantLock在公平性和非公平性上的实现差异。

并发编程从零开始(十二)-Lock与Condition_并发编程_10

并发编程从零开始(十二)-Lock与Condition_juc_11

并发编程从零开始(十二)-Lock与Condition_读写锁_12

并发编程从零开始(十二)-Lock与Condition_并发编程_13

8.1.5 阻塞队列与唤醒机制

下面进入锁的最为关键的部分,即acquireQueued(...)方法内部一探究竟。

并发编程从零开始(十二)-Lock与Condition_阻塞队列_14

先说addWaiter(...)方法,就是为当前线程生成一个Node,然后把Node放入双向链表的尾部。要注意的是,这只是把Thread对象放入了一个队列中而已,线程本身并未阻塞。

并发编程从零开始(十二)-Lock与Condition_读写锁_15

创建节点,尝试将节点追加到队列尾部。获取tail节点,将tail节点的next设置为当前节点。

如果tail不存在,就初始化队列。

在addWaiter(...)方法把Thread对象加入阻塞队列之后的工作就要靠acquireQueued(...)方法完成。线程一旦进入acquireQueued(...)就会被无限期阻塞,即使有其他线程调用interrupt()方法也不能将其唤醒,除非有其他线程释放了锁,并且该线程拿到了锁,才会从accquireQueued(...)返回。

进入acquireQueued(...),该线程被阻塞。在该方法返回的一刻,就是拿到锁的那一刻,也就是被唤醒的那一刻,此时会删除队列的第一个元素(head指针前移1个节点)。

并发编程从零开始(十二)-Lock与Condition_阻塞队列_16

首先,acquireQueued(...)方法有一个返回值,表示什么意思呢?虽然该方法不会中断响应,但它会记录被阻塞期间有没有其他线程向它发送过中断信号。如果有,则该方法会返回true;否则,返回false。

基于这个返回值,才有了下面的代码:

并发编程从零开始(十二)-Lock与Condition_读锁_17

并发编程从零开始(十二)-Lock与Condition_并发编程_18

当 acquireQueued(...)返回 true 时,会调用 selfInterrupt(),自己给自己发送中断信号,也就是自己把自己的中断标志位设为true。之所以要这么做,是因为自己在阻塞期间,收到其他线程中断信号没有及时响应,现在要进行补偿。这样一来,如果该线程在lock代码块内部有调用sleep()之类的阻塞方法,就可以抛出异常,响应该中断信号。

阻塞就发生在下面这个方法中:

并发编程从零开始(十二)-Lock与Condition_读锁_19

线程调用 park()方法,自己把自己阻塞起来,直到被其他线程唤醒,该方法返回。

park()方法返回有两种情况。

  1. 其他线程调用了unpark(Thread t)。
  2. 其他线程调用了t.interrupt()。这里要注意的是,lock()不能响应中断,但LockSupport.park()会响应中断。

也正因为LockSupport.park()可能被中断唤醒,acquireQueued(...)方法才写了一个for死循环。唤醒之后,如果发现自己排在队列头部,就去拿锁;如果拿不到锁,则再次自己阻塞自己。不断重复此过程,直到拿到锁。

被唤醒之后,通过Thread.interrupted()来判断是否被中断唤醒。如果是情况1,会返回false;如果是情况2,则返回true。

8.1.6 unlock()实现分析

说完了lock,下面分析unlock的实现。unlock不区分公平还是非公平。

并发编程从零开始(十二)-Lock与Condition_juc_20

并发编程从零开始(十二)-Lock与Condition_读锁_21

上图中,当前线程要释放锁,先调用tryRelease(arg)方法,如果返回true,则取出head,让head获取锁。

对于tryRelease方法:

并发编程从零开始(十二)-Lock与Condition_juc_22

首先计算当前线程释放锁后的state值。

如果当前线程不是排他线程,则抛异常,因为只有获取锁的线程才可以进行释放锁的操作。

此时设置state,没有使用CAS,因为是单线程操作。

再看unparkSuccessor方法:

并发编程从零开始(十二)-Lock与Condition_juc_23

并发编程从零开始(十二)-Lock与Condition_并发编程_24

release()里面做了两件事:tryRelease(...)方法释放锁;unparkSuccessor(...)方法唤醒队列中的后继者。

8.1.7 lockInterruptibly()实现分析

上面的 lock 不能被中断,这里的 lockInterruptibly()可以被中断:

并发编程从零开始(十二)-Lock与Condition_并发编程_25

并发编程从零开始(十二)-Lock与Condition_读锁_26

这里的 acquireInterruptibly(...)也是 AQS 的模板方法,里面的 tryAcquire(...)分别被 FairSync和NonfairSync实现。

主要看doAcquireInterruptibly(...)方法:

并发编程从零开始(十二)-Lock与Condition_读锁_27

当parkAndCheckInterrupt()返回true的时候,说明有其他线程发送中断信号,直接抛出InterruptedException,跳出for循环,整个方法返回。

8.1.8 tryLock()实现分析

并发编程从零开始(十二)-Lock与Condition_读锁_28

tryLock()实现基于调用非公平锁的tryAcquire(...),对state进行CAS操作,如果操作成功就拿到锁;

如果操作不成功则直接返回false,也不阻塞。



8.2 读写锁

和互斥锁相比,读写锁(ReentrantReadWriteLock)就是读线程和读线程之间不互斥。

读读不互斥,读写互斥,写写互斥

8.2.1 类继承层次

ReadWriteLock是一个接口,内部由两个Lock接口组成。

并发编程从零开始(十二)-Lock与Condition_读锁_29

并发编程从零开始(十二)-Lock与Condition_读写锁_30

ReentrantReadWriteLock实现了该接口,使用方式如下:

并发编程从零开始(十二)-Lock与Condition_阻塞队列_31

也就是说,当使用 ReadWriteLock 的时候,并不是直接使用,而是获得其内部的读锁和写锁,然后分别调用lock/unlock。

8.2.2 读写锁实现的基本原理

个视图呢?可以理解为是一把锁,线程分成两类:读线程和写线程。读线程和写线程之间不互斥(可以同时拿到这把锁),读线程之间不互斥,写线程之间互斥。

从下面的构造方法也可以看出,readerLock和writerLock实际共用同一个sync对象。sync对象同互斥锁一样,分为非公平和公平两种策略,并继承自AQS。

并发编程从零开始(十二)-Lock与Condition_阻塞队列_32

同互斥锁一样,读写锁也是用state变量来表示锁状态的。只是state变量在这里的含义和互斥锁完全不同。在内部类Sync中,对state变量进行了重新定义,如下所示:

并发编程从零开始(十二)-Lock与Condition_juc_33

也就是把 state 变量拆成两半,低16位,用来记录写锁。但同一时间既然只能有一个线程写,为什么还需要16位呢?这是因为一个写线程可能多次重入。例如,低16位的值等于5,表示一个写线程重入了5次。

高16位,用来“读”锁。例如,高16位的值等于5,既可以表示5个读线程都拿到了该锁;也可以表示一个读线程重入了5次。

为什么要把一个int类型变量拆成两半,而不是用两个int型变量分别表示读锁和写锁的状态呢?

这是因为无法用一次CAS 同时操作两个int变量,所以用了一个int型的高16位和低16位分别表示读锁和写锁的状态。

当state=0时,说明既没有线程持有读锁,也没有线程持有写锁;当state != 0时,要么有线程持有读锁,要么有线程持有写锁,两者不能同时成立,因为读和写互斥。这时再进一步通过sharedCount(state)和exclusiveCount(state)判断到底是读线程还是写线程持有了该锁。

8.2.3 AQS的两对模板方法

下面介绍在ReentrantReadWriteLock的两个内部类ReadLock和WriteLock中,是如何使用state变量的。

并发编程从零开始(十二)-Lock与Condition_并发编程_34

acquire/release、acquireShared/releaseShared 是AQS里面的两对模板方法。互斥锁和读写锁的写锁都是基于acquire/release模板方法来实现的。读写锁的读锁是基于acquireShared/releaseShared这对模板方法来实现的。这两对模板方法的代码如下:

并发编程从零开始(十二)-Lock与Condition_阻塞队列_35

并发编程从零开始(十二)-Lock与Condition_juc_36

将读/写、公平/非公平进行排列组合,就有4种组合。如下图所示,上面的两个方法都是在Sync中实现的。Sync中的两个方法又是模板方法,在NonfairSync和FairSync中分别有实现。最终的对应关系如下:

  1. 读锁的公平实现:Sync.tryAccquireShared()+FairSync中的两个重写的子方法。
  2. 读锁的非公平实现:Sync.tryAccquireShared()+NonfairSync中的两个重写的子方法。
  3. 写锁的公平实现:Sync.tryAccquire()+FairSync中的两个重写的子方法。
  4. 写锁的非公平实现:Sync.tryAccquire()+NonfairSync中的两个重写的子方法。

并发编程从零开始(十二)-Lock与Condition_读锁_37

并发编程从零开始(十二)-Lock与Condition_读写锁_38

对于公平,比较容易理解,不论是读锁,还是写锁,只要队列中有其他线程在排队(排队等读锁,或者排队等写锁),就不能直接去抢锁,要排在队列尾部。

对于非公平,读锁和写锁的实现策略略有差异。

写线程能抢锁,前提是state=0,只有在没有其他线程持有读锁或写锁的情况下,它才有机会去抢锁。或者state != 0,但那个持有写锁的线程是它自己,再次重入。写线程是非公平的,即writerShouldBlock()方法一直返回false。

对于读线程,假设当前线程被读线程持有,然后其他读线程还非公平地一直去抢,可能导致写线程永远拿不到锁,所以对于读线程的非公平,要做一些“约束”。当发现队列的第1个元素是写线程的时候,读线程也要阻塞,不能直接去抢。即偏向写线程。

8.2.4 WriteLock公平vs非公平实现

写锁是排他锁,实现策略类似于互斥锁。

1.tryLock()实现分析

并发编程从零开始(十二)-Lock与Condition_读锁_39

并发编程从零开始(十二)-Lock与Condition_阻塞队列_40

lock()方法:

并发编程从零开始(十二)-Lock与Condition_并发编程_41

并发编程从零开始(十二)-Lock与Condition_读写锁_42

在互斥锁部分讲过了。tryLock和lock方法不区分公平/非公平。

2.unlock()实现分析

并发编程从零开始(十二)-Lock与Condition_读锁_43

并发编程从零开始(十二)-Lock与Condition_并发编程_44

unlock()方法不区分公平/非公平。

8.2.5 ReadLock公平vs非公平实现

读锁是共享锁,其实现策略和排他锁有很大的差异。

1.tryLock()实现分析

并发编程从零开始(十二)-Lock与Condition_读锁_45

并发编程从零开始(十二)-Lock与Condition_读写锁_46

并发编程从零开始(十二)-Lock与Condition_juc_47

并发编程从零开始(十二)-Lock与Condition_读写锁_48

并发编程从零开始(十二)-Lock与Condition_juc_49

2.unlock()实现分析

并发编程从零开始(十二)-Lock与Condition_读写锁_50

并发编程从零开始(十二)-Lock与Condition_读写锁_51

tryReleaseShared()的实现:

并发编程从零开始(十二)-Lock与Condition_juc_52

因为读锁是共享锁,多个线程会同时持有读锁,所以对读锁的释放不能直接减1,而是需要通过一个for循环+CAS操作不断重试。这是tryReleaseShared和tryRelease的根本差异所在。



8.3 Condition

8.3.1 Condition与Lock的关系

Condition本身也是一个接口,其功能和wait/notify类似,如下所示:

并发编程从零开始(十二)-Lock与Condition_读写锁_53

wait()/notify()必须和synchronized一起使用,Condition也必须和Lock一起使用。因此,在Lock的接口中,有一个与Condition相关的接口:

并发编程从零开始(十二)-Lock与Condition_并发编程_54

8.3.2 Condition的使用场景

以ArrayBlockingQueue为例。如下所示为一个用数组实现的阻塞队列,执行put(...)操作的时候,队列满了,生产者线程被阻塞;执行take()操作的时候,队列为空,消费者线程被阻塞。

并发编程从零开始(十二)-Lock与Condition_阻塞队列_55

并发编程从零开始(十二)-Lock与Condition_juc_56

8.3.3 Condition实现原理

可以发现,Condition的使用很方便,避免了wait/notify的生产者通知生产者、消费者通知消费者的问题。具体实现如下:

由于Condition必须和Lock一起使用,所以Condition的实现也是Lock的一部分。首先查看互斥锁和读写锁中Condition的构造方法:

并发编程从零开始(十二)-Lock与Condition_并发编程_57

首先,读写锁中的 ReadLock 是不支持 Condition 的,读写锁的写锁和互斥锁都支持Condition。虽然它们各自调用的是自己的内部类Sync,但内部类Sync都继承自AQS。因此,上面的代码sync.newCondition最终都调用了AQS中的newCondition:

并发编程从零开始(十二)-Lock与Condition_读锁_58

每一个Condition对象上面,都阻塞了多个线程。因此,在ConditionObject内部也有一个双向链表组成的队列,如下所示:

并发编程从零开始(十二)-Lock与Condition_读写锁_59

下面来看一下在await()/notify()方法中,是如何使用这个队列的。

8.3.4 await()实现分析

并发编程从零开始(十二)-Lock与Condition_并发编程_60

并发编程从零开始(十二)-Lock与Condition_读锁_61

关于await,有几个关键点要说明:

  1. 线程调用 await()的时候,肯定已经先拿到了锁。所以,在 addConditionWaiter()内部,对这个双向链表的操作不需要执行CAS操作,线程天生是安全的,代码如下:
    并发编程从零开始(十二)-Lock与Condition_读锁_62
  2. 在线程执行wait操作之前,必须先释放锁。也就是fullyRelease(node),否则会发生死锁。这个和wait/notify与synchronized的配合机制一样。
  3. 线程从wait中被唤醒后,必须用acquireQueued(node, savedState)方法重新拿锁。
  4. checkInterruptWhileWaiting(node)代码在park(this)代码之后,是为了检测在park期间是否收到过中断信号。当线程从park中醒来时,有两种可能:一种是其他线程调用了unpark,另一种是收到中断信号。这里的await()方法是可以响应中断的,所以当发现自己被中断唤醒的,而不是被unpark唤醒的时,会直接退出while循环,await()方法也会返回。
  5. isOnSyncQueue(node)用于判断该Node是否在AQS的同步队列里面。初始的时候,Node只 在Condition的队列里,而不在AQS的队列里。但执行notity操作的时候,会放进AQS的同步队列。
8.3.5 awaitUninterruptibly()实现分析

与await()不同,awaitUninterruptibly()不会响应中断,其方法的定义中不会有中断异常抛出,下面分析其实现和await()的区别。

并发编程从零开始(十二)-Lock与Condition_并发编程_63

可以看出,整体代码和 await()类似,区别在于收到异常后,不会抛出异常,而是继续执行while循环。

8.3.6 notify()实现分析

并发编程从零开始(十二)-Lock与Condition_阻塞队列_64

同 await()一样,在调用 notify()的时候,必须先拿到锁(否则就会抛出上面的异常),是因为前面执行await()的时候,把锁释放了。

然后,从队列中取出firstWaiter,唤醒它。在通过调用unpark唤醒它之前,先用enq(node)方法把这个Node放入AQS的锁对应的阻塞队列中。也正因为如此,才有了await()方法里面的判断条件:

while( ! isOnSyncQueue(node))

这个判断条件满足,说明await线程不是被中断,而是被unpark唤醒的。

notifyAll()与此类似。



8.4 StampedLock

8.4.1 为什么引入StampedLock

StampedLock是在JDK8中新增的,有了读写锁,为什么还要引入StampedLock呢?

并发编程从零开始(十二)-Lock与Condition_juc_65

可以看到,从ReentrantLock到StampedLock,并发度依次提高。

另一方面,因为ReentrantReadWriteLock采用的是“悲观读”的策略,当第一个读线程拿到锁之后,第二个、第三个读线程还可以拿到锁,使得写线程一直拿不到锁,可能导致写线程“饿死”。虽然在其公平或非公平的实现中,都尽量避免这种情形,但还有可能发生。

StampedLock引入了“乐观读”策略,读的时候不加读锁,读出来发现数据被修改了,再升级为“悲观读”,相当于降低了“读”的地位,把抢锁的天平往“写”的一方倾斜了一下,避免写线程被饿死。

8.4.2 使用场景

在剖析其原理之前,下面先以官方的一个例子来看一下StampedLock如何使用。

并发编程从零开始(十二)-Lock与Condition_读锁_66

并发编程从零开始(十二)-Lock与Condition_阻塞队列_67

如上面代码所示,有一个Point类,多个线程调用move()方法,修改坐标;还有多个线程调用distanceFromOrigin()方法,求距离。

首先,执行move操作的时候,要加写锁。这个用法和ReadWriteLock的用法没有区别,写操作和写操作也是互斥的。

关键在于读的时候,用了一个“乐观读”sl.tryOptimisticRead(),相当于在读之前给数据的状态做了一个“快照”。然后,把数据拷贝到内存里面,在用之前,再比对一次版本号。如果版本号变了,则说明在读的期间有其他线程修改了数据。读出来的数据废弃,重新获取读锁。关键代码就是下面这三行:

并发编程从零开始(十二)-Lock与Condition_阻塞队列_68

要说明的是,这三行关键代码对顺序非常敏感,不能有重排序。因为 state 变量已经是volatile,所以可以禁止重排序,但stamp并不是volatile的。为此,在validate(stamp)方法里面插入内存屏障。

并发编程从零开始(十二)-Lock与Condition_读写锁_69

8.4.3 "乐观读"的实现原理

首先,StampedLock是一个读写锁,因此也会像读写锁那样,把一个state变量分成两半,分别表示读锁和写锁的状态。同时,它还需要一个数据的version。但是,一次CAS没有办法操作两个变量,所以这个state变量本身同时也表示了数据的version。下面先分析state变量。

并发编程从零开始(十二)-Lock与Condition_juc_70

如下图:用最低的8位表示读和写的状态,其中第8位表示写锁的状态,最低的7位表示读锁的状态。因为写锁只有一个bit位,所以写锁是不可重入的。

并发编程从零开始(十二)-Lock与Condition_juc_71

初始值不为0,而是把WBIT 向左移动了一位,也就是上面的ORIGIN 常量,构造方法如下所示。

并发编程从零开始(十二)-Lock与Condition_并发编程_72

为什么state的初始值不设为0呢?看乐观锁的实现:

并发编程从零开始(十二)-Lock与Condition_并发编程_73

上面两个方法必须结合起来看:当state&WBIT != 0的时候,说明有线程持有写锁,上面的tryOptimisticRead会永远返回0。这样,再调用validate(stamp),也就是validate(0)也会永远返回false。这正是我们想要的逻辑:当有线程持有写锁的时候,validate永远返回false,无论写线程是否释放了写锁。因为无论是否释放了(state回到初始值)写锁,state值都不为0,所以validate(0)永远为false。

为什么上面的validate(...)方法不直接比较stamp=state,而要比较state&SBITS=state&SBITS 呢?

因为读锁和读锁是不互斥的!

所以,即使在“乐观读”的时候,state 值被修改了,但如果它改的是第7位,validate(...)还是会返回true。

另外要说明的一点是,上面使用了内存屏障VarHandle.acquireFence();,是因为在这行代码的下一行里面的stamp、SBITS变量不是volatile的,由此可以禁止其和前面的currentX=X,currentY=Y进行重排序。

通过上面的分析,可以发现state的设计非常巧妙。只通过一个变量,既实现了读锁、写锁的状态记录,还实现了数据的版本号的记录。

8.4.4 悲观读/写:“阻塞”与“自旋”策略实现差异

同ReadWriteLock一样,StampedLock也要进行悲观的读锁和写锁操作。不过,它不是基于AQS实现的,而是内部重新实现了一个阻塞队列。如下所示。

并发编程从零开始(十二)-Lock与Condition_读锁_74

并发编程从零开始(十二)-Lock与Condition_读锁_75

这个阻塞队列和 AQS 里面的很像。

刚开始的时候,whead=wtail=NULL,然后初始化,建一个空节点,whead和wtail都指向这个空节点,之后往里面加入一个个读线程或写线程节点。

但基于这个阻塞队列实现的锁的调度策略和AQS很不一样,也就是“自旋”。

在AQS里面,当一个线程CAS state失败之后,会立即加入阻塞队列,并且进入阻塞状态。

但在StampedLock中,CAS state失败之后,会不断自旋,自旋足够多的次数之后,如果还拿不到锁,才进入阻塞状态。

为此,根据CPU的核数,定义了自旋次数的常量值。如果是单核的CPU,肯定不能自旋,在多核情况下,才采用自旋策略。

并发编程从零开始(十二)-Lock与Condition_读写锁_76

下面以写锁的加锁,也就是StampedLock的writeLock()方法为例,来看一下自旋的实现。

并发编程从零开始(十二)-Lock与Condition_并发编程_77

如上面代码所示,当state&ABITS==0的时候,说明既没有线程持有读锁,也没有线程持有写锁,此时当前线程才有资格通过CAS操作state。若操作不成功,则调用acquireWrite()方法进入阻塞队列,并进行自旋,这个方法是整个加锁操作的核心,代码如下:

并发编程从零开始(十二)-Lock与Condition_读锁_78

并发编程从零开始(十二)-Lock与Condition_读写锁_79

并发编程从零开始(十二)-Lock与Condition_读写锁_80

整个acquireWrite(...)方法是两个大的for循环,内部实现了非常复杂的自旋策略。在第一个大的for循环里面,目的就是把该Node加入队列的尾部,一边加入,一边通过CAS操作尝试获得锁。如果获得了,整个方法就会返回;如果不能获得锁,会一直自旋,直到加入队列尾部。

在第二个大的for循环里,也就是该Node已经在队列尾部了。这个时候,如果发现自己刚好也在队列头部,说明队列中除了空的Head节点,就是当前线程了。此时,再进行新一轮的自旋,直到达到MAX_HEAD_SPINS次数,然后进入阻塞。这里有一个关键点要说明:当release(...)方法被调用之后,会唤醒队列头部的第1个元素,此时会执行第二个大的for循环里面的逻辑,也就是接着for循环里面park()方法后面的代码往下执行。

另外一个不同于AQS的阻塞队列的地方是,在每个WNode里面有一个cowait指针,用于串联起所有的读线程。例如,队列尾部阻塞的是一个读线程 1,现在又来了读线程 2、3,那么会通过cowait指针,把1、2、3串联起来。1被唤醒之后,2、3也随之一起被唤醒,因为读和读之间不互斥。

明白加锁的自旋策略后,下面来看锁的释放操作。和读写锁的实现类似,也是做了两件事情:一是把state变量置回原位,二是唤醒阻塞队列中的第一个节点。

并发编程从零开始(十二)-Lock与Condition_阻塞队列_81

并发编程从零开始(十二)-Lock与Condition_读锁_82

并发编程从零开始(十二)-Lock与Condition_读写锁_83