本篇主要是底层的东西。

Java内存模型/JMM

Java并发采用的是共享内存模型。线程的通信隐式进行,整个通信过程对程序员完全透明。所以要理解其中隐式的规则,否则会引起一些内存可见性问题。

java的堆内存是可以共享的,但是栈内存是私有的。

线程A与线程B之间如要通信的话,必须要经历下面2个步骤:

首先,线程A把本地内存A中更新过的共享变量刷新到主内存中去。

然后,线程B到主内存中去读取线程A之前已更新过的共享变量。

从整体来看,这两个步骤实质上是线程 A 在向线程 B 发送消息,而且这个通信过程必须要经过主内存。JMM 通过控制主内存与每个线程的本地内存之间的交互,来为 java 程序员提供内存可见性保证。

image

指令重排序

Happens-Before

这个关键字是JSR-133内存模型中用来阐述操作的内存可见性的。是JMM的核心概念。程序员要基于这个规则提供内存可见性保证来编程。

这个关系并不是说着前一个操作要在后一个操作之前,只是说前一个操作对后一个可见。

具体规则

单个线程的任意操作happens-Before后序操作

volatile写happens-Before于volatile读,原因在后面

对一个锁解锁happens-Before对一个锁加锁,原因也在后面

线程start一定happens-Before线程中任意操作

线程join成功之后一定happens-Before与返回操作

满足传递性

这个关系就是让JMM来对编译器与处理器的重排序做约束

JMM保证

因为有编译器与处理器优化的存在,所以有重排序存在的必要性。

但是JMM保证,在正确同步的情况下不改变程序的执行结果,尽可能让编译器与处理器优化。

也可以说在满足程序员定义的happens-Before规则来执行的结果与优化的结果肯定一致。

有一点要注意,JMM不保证64位的long/double变量写的原子性,因为32位处理器要执行64位数据的指令需要拆分成两个单独执行。jdk5以前的JMM,64的读/写都是分开的,jdk5以后只有写会拆分。

数据依赖性

只要两个操作访问同一个变量,并且有一个写操作,那么就说这俩是数据依赖关系。

写-读、写-写、读-写都是。

但是只对单个线程的操作和单个处理器执行的指令有效。

重排序

编译器会对指令序列做优化,并不会按照我们写的顺序执行

编译器在不改变单线程中语义前提进行重排序

处理器可以改变不存在数据依赖性的语句重排序

由于读/写缓冲区,内存系统进行的重排序

1是编译器重排序,2、3属于处理器重排序。

JMM重排序规则对编译器是禁止特定类型的重排,对处理器而是采用内存屏障指令的方法。

不同的处理器都有不同的重排序规则,所以java有对应的4个内存屏障指令来禁止这些重排序。

StoreLoad最强大,就是强制让写缓冲全部刷新到内存然后再读取,大部分关键字都靠这个实现

其他三个类似LoadLoad、StoreStore、LoadStore

比如:

class Test{
int a=0;
boolean flag=false;
public void writer(){
a=1;//1
flag=true;//2
}
public void reader(){
if(flag) //3
int i=a*a;//4
}
}
//A线程先执行writer,B线程执行reader
//1和2不存在数据依赖,可以重排
//3和4不存在数据依赖,可以重排(处理器可以把指令拆分,让a*a提前读,3成立再赋值,所以3、4中的指令可以重排序)
//1和4在多线程中不考虑数据依赖,所以结果会不一样

并发原语

Volatile

会java的都知道volatile的特点

可见性:只要修饰变量,就对所有线程可见,看到其最后写入

原子性:任意单个volatile变量读/写都具有原子性

JMM怎么做到的

具体做法:

每个volatile写操作前插入一个StoreStore屏障

每个volatile写操作后插入一个StoreLoad屏障

每个volatile读操作后插入一个LoadLoad屏障

每个volatile读操作后插入一个LoadStore屏障

举例来说:StoreStore屏障的意义在于volatile写之前,所有普通写操作已经对任意处理器可见。保证这个屏障之前的写已经刷到主存。后面再加一个StoreLoad,就是防止与后面普通读重排序。volatile读类似。

效果

最终形成的可重排序效果:

第一个操作

第二个操作

是否能重排序

普通读/写

volatile读

volatile写

普通读/写

NO

volatile读

NO

NO

NO

volatile写

NO

NO

然后再看上面的例子就理解了

class VolatileTest{
int a=0;
volatile boolean flag=false;
public void writer(){
a=1;//1
flag=true;//2
}
public void reader(){
if(flag) //3
int i=a*a;//4
}
}
//A线程先执行writer,B线程执行reader
//现在2 happens-before 3,又因为单线程中1 happens-before 2同理3、4
//根据传递性现在1 happens-before 4,保证结果单一

注:我们说的volatile的原子性是指它单一的读和写,像++这样的复合操作不具有原子性

那volatile怎么保证刷回主存

在解析volatile变量写的时候,会多出一个lock汇编指令,该指令在多核处理器下会

Lock前缀指令执行期间,以前的处理器会锁住总线来,但是开销有点大,所以现在处理器会锁处理部分的内存区域,用缓存一致性来阻止两个以上的处理器缓存修改内存区域

写回结束后会被其他处理器嗅探到,然后其他处理器会把该部分置为无效,重新刷新

正是因为会锁住内存,所以有的时候在高速缓存行是64位的处理器中,我们可以将volatile变量最加到64位来提高其并发的效率。

关于如何更好使用可以看这个

Final

final用于修饰常量代表不可变,也可以修饰方法和类

所以编译器和处理器处理的时候,要保证final的赋值规范

怎么做到的

final写之后插入一个StoreStore屏障

final读前面插入一个LoadLoad屏障

当然这些都是针对大部分处理器,不同情况也会不同。

效果

对象的 final 域已经被正确初始化过了之后,才会对其他线程可见,final写也不会重排序到构造函数之外

在读一个对象的 final 域之前,一定会先读包含这个 final 域的对象的引用

锁的内容非常多,下一篇单独整理。这里写概述。

显式锁Lock

ReentrantLock都是基于volatile关键字来实现的。

通过一个volatile变量Status来控制同步的状态,使那些没有获得的线程自旋或者阻塞来实现效果。

公平锁获取的时候会读volatile,所以具有volatile语义

非公平锁获取时会先读,然后用CAS来更新,所以同时具有volatile写和读的语义

锁释放的时候都会写volatile写语义

隐式锁synchronized

synchronized之所以会叫隐式锁是因为编译器自动帮我们通过一个monitor的对象来完成。

Java中每个对象都可以作为锁,所以synchronized存在Java的对象头里。

对于synchronized代码块,JVM的实现是插入monitorenter和monitorexit指令来实现的。

方法的同步也可以用这种方式,但是JVM没有详细说明。