volatile是Java虚拟机提供的最轻量级的同步机制,当一个变量使用volatile关键字修饰之后,它就会具备两种特性:

  1. 可见性
    使用volatile修饰之后的变量,当一个线程修改了这个变量的值,新值对于其他线程来说也是立即可见的。一个很典型的应用场景就像下面的代码:
volatile boolean shutdownRequested;

public void shutdown() {
	shutdownRequested = true;
}

public void doWork() {
	while (!shutdownRequested) {
		doSomething();
	}
}

当调用了shutdown方法之后,shutdownRequested能立即被执行doWork的线程读到,从而取消操作。

那么volatile关键字是如何保证可见性的呢 ?

volatile关键字修饰的变量在编译成汇编语言之后,会在前面加上一个LOCK前缀,就像这样的

0x0000000002931351: lock add dword ptr [rsp],0h  ;*putstatic instance
                                                ; - org.xrq.test.design.singleton.LazySingleton::getInstance@13 (line 14)

LOCK前缀可以让被修饰的变量在改变之后,立即回写到主存中,并让其他CPU相关缓存行失效,那么缓存行失效过后又是通过什么来保证缓存的一致性呢?

这个时候就需要使用到缓存一致性协议,MESI协议,它的作用就是要使多组缓存的内容保持一致。

如果现在有两个线程操作同一个使用volatile修饰的变量 i,现在我们从头理一下整个过程:
1、线程1修改了变量 i 的值,转化为汇编语言时添加了LOCK前缀
2、LOCK前缀保证线程1将变量 i 回写主存,同时让线程2中的缓存行失效
3、线程2通过嗅探总线上的数据变化,发现自己的缓存行已经失效,然后去主存内获取最新的变量值

volatile的可见性也使用到了内存屏障,我们下面再说。

  1. 禁止指令重排

从硬件架构上来讲,指令重排是指CPU采用了允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理。但并不是说指令任意重排,CPU需要能正确处理指令依赖情况以保障程序能得出正确的结果。举一个简单的例子,指令1把地址A中的值加1,指令2把地址A中的值乘2,指令3把地址B中的值减3,指令1和指令2都是操作地址A,所以是互相依赖的,但是指令3跟其他指令无关,所以指令3完全可以重排在指令1和2之间,指令重排之后得出的结果依旧是正确的。

一个典型的例子就是DCL 双重检查锁定(Double Check Lock)

public class Singleton {
  private volatile static Singleton instance;

  public static Singleton getInstance() {
     if(instance == null) {
        synchronzied(Singleton.class) {
           if(instance == null) {
               instance = new Singleton();  
           }
        }
     }
     return instance;
   }
}

如果instance不使用volatile修饰的话,就可能出现问题,出现问题的地方在 instance = new Singleton() 这一句,因为new一个新对象并不是一个原子性的操作,它分为了三步
1、分配对象的内存空间
2、初始化对象
3、设置instance指向刚分配的内存地址

指令重排之后顺序可能会变成 1、3、2,加锁线程在执行完了1、3步骤之后,此时有一个新的线程进入了第一个instance == null的判断,发现此时intance != null,就直接返回instance了,但是此时初始化对象还未完成,最后导致报错。

volatile为了防止指令重排,会使用到内存屏障,内存屏障是硬件层的概念,分为Load Barrier 读屏障和 Store Barrier 写屏障两种,作用有两个:
1、阻止屏障两侧的指令重排序;
2、强制把写缓冲区/高速缓存中的脏数据等写回主内存,让缓存中相应的数据失效。

在JSR规范中定义了4种内存屏障:

  • LoadLoad屏障:(指令Load1; LoadLoad; Load2),在Load2及后续读取操作要读取的数据被访问前,保证Load1要读取的数据被读取完毕。
  • LoadStore屏障:(指令Load1; LoadStore; Store2),在Store2及后续写入操作被刷出前,保证Load1要读取的数据被读取完毕。
  • StoreStore屏障:(指令Store1; StoreStore; Store2),在Store2及后续写入操作执行前,保证Store1的写入操作对其它处理器可见。
  • StoreLoad屏障:(指令Store1; StoreLoad; Load2),在Load2及后续所有读取操作执行前,保证Store1的写入对所有处理器可见。它的开销是四种屏障中最大的。在大多数处理器的实现中,这个屏障是个万能屏障,兼具其它三种内存屏障的功能

对于volatile关键字,按照规范会有下面的操作:

  • 在每个volatile写入之前,插入一个StoreStore,写入之后,插入一个StoreLoad
  • 在每个volatile读取之前,插入LoadLoad,之后插入LoadStore
  1. 无法保证原子性

虽然在一些很极端的情况之下,volatile具有一定的原子性,但是我们还是认为volatile并不会保证原子性
所以在不符合以下两条规则的运算场景中,我们还是需要通过加锁来保证原子性

  • 运算结果不依赖变量的当前值,或者能够确保只有单一的线程修改变量的值
  • 变量不需要与其他的状态变量共同参与不变约束

参考:
《深入理解Java虚拟机 :JVM高级特性与最佳实践》

https://www.jianshu.com/p/6745203ae1fe