Java内存模型Java Memory Model

JMM(Java内存模型Java Memory Model,简称JMM)本身是一种抽象的概念并不真实存在它仅仅描述的是一组约定或规范,通过这组规范定义了程序中(尤其是多线程)各个变量的读写访问方式并决定一个线程对共享变量的写入何时以及如何变成对另一个线程可见,

Java线程之间的通信由Java内存模型(本文简称为JMM)控制,JMM决定一个线程对共享变量的写入何时对另一个线程可见。从抽象的角度来看,JMM定义了线程和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory),本地内存中存储了该线程以读/写共享变量的副本。本地内存是JMM的一个抽象概念,并不真实存在。它涵盖了缓存、写缓冲区、寄存器以及其他的硬件和编译器优化。

原则:

JMM的关键技术点都是围绕多线程的原子性、可见性和有序性展开的

原子性 - 保证指令不会受到线程上下文切换的影响
可见性 - 保证指令不会受 cpu 缓存的影响
有序性 - 保证指令不会受 cpu 指令并行优化的影响

能干嘛?

1 通过JMM来实现线程和主内存之间的抽象关系。
2 屏蔽各个硬件平台和操作系统的内存访问差异以实现让Java程序在各种平台下都能达到一致的内存访问效果。

JMM规范下,三大特性

可见性

是指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更 ,JMM规定了所有的变量都存储在主内存中。

javarealm模型 java jmm模型_java

javarealm模型 java jmm模型_共享变量_02

如果线程A与线程B之间要通信的话,必须要经历下面2个步骤。
1)线程A把本地内存A中更新过的共享变量刷新到主内存中去。
2)线程B到主内存中去读取线程A之前已更新过的共享变量。

javarealm模型 java jmm模型_共享变量_03

本地内存A和本地内存B由主内存中共享变量x的副本。假设初始时,这3个
内存中的x值都为0。线程A在执行时,把更新后的x值(假设值为1)临时存放在自己的本地内存
A中。当线程A和线程B需要通信时,线程A首先会把自己本地内存中修改后的x值刷新到主内
存中,此时主内存中的x值变为了1。随后,线程B到主内存中去读取线程A更新后的x值,此时
线程B的本地内存的x值也变为了1。
从整体来看,这两个步骤实质上是线程A在向线程B发送消息,而且这个通信过程必须要
经过主内存。JMM通过控制主内存与每个线程的本地内存之间的交互,来为Java程序员提供
内存可见性保证。

本地内存的作用

Java中普通的共享变量不保证可见性,因为数据修改被写入内存的时机是不确定的,多线程并发下很可能出现"脏读",所以每个线程都有自己的工作内存,线程自己的工作内存中保存了该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取,赋值等 )都必需在线程自己的工作内存中进行,而不能够直接读写主内存中的变量。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成

javarealm模型 java jmm模型_重排序_04

线程脏读:如果没有可见性保证

主内存中有变量 x,初始值为 0
线程 A 要将 x 加 1,先将 x=0 拷贝到自己的私有内存中,然后更新 x 的值
线程 A 将更新后的 x 值回刷到主内存的时间是不固定的
刚好在线程 A 没有回刷 x 到主内存时,线程 B 同样从主内存中读取 x,此时为 0,和线程 A 一样的操作,最后期盼的 x=2 就会变成 x=1

javarealm模型 java jmm模型_javarealm模型_05

原子性

指一个操作是不可中断的,即多线程环境下,操作不能被其他线程干扰

有序性

对于一个线程的执行代码而言,我们总是习惯性认为代码的执行总是从上到下,有序执行。

但为了提供性能,编译器和处理器通常会对指令序列进行重新排序。
指令重排可以保证串行语义一致,但没有义务保证多线程间的语义也一致,即可能产生"脏读",简单说,
两行以上不相干的代码在执行的时候有可能先执行的不是第一条,不见得是从上到下顺序执行,执行顺序会被优化。

javarealm模型 java jmm模型_重排序_06

单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致。
处理器在进行重排序时必须要考虑指令之间的数据依赖性
多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的,结果无法预测

进行指令重排序的两个前提:

不改变程序运行的结果;

不存在数据依赖关系

public void mySort()
{
    int x = 11; //语句1
    int y = 12; //语句2
    x = x + 5;  //语句3
    y = x * x;  //语句4
}

运行顺序:

1234
2134
1324

语句4是不能排在语句1,3之前的

JMM属于语言级的内存模型,它确保在不同的编译器和不同的处理器平台之上,通过禁
止特定类型的编译器重排序和处理器重排序,为程序员提供一致的内存可见性保证。

JMM规范下,多线程对变量的读写过程

读取过程:
由于JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到的线程自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量,各个线程中的工作内存中存储着主内存中的变量副本拷贝,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成,其简要访问过程如下图:

javarealm模型 java jmm模型_java_07

JMM定义了线程和主内存之间的抽象关系
1 线程之间的共享变量存储在主内存中(从硬件角度来说就是内存条)
2 每个线程都有一个私有的本地工作内存,本地工作内存中存储了该线程用来读/写共享变量的副本(从硬件角度来说就是CPU的缓存,比如寄存器、L1、L2、L3缓存等)

可打开任务管理器查看性能,右下角就有L1、L2、L3缓存

javarealm模型 java jmm模型_重排序_08

总结

我们定义的所有共享变量都储存在物理主内存中

每个线程都有自己独立的工作内存,里面保存该线程使用到的变量的副本(主内存中该变量的一份拷贝)

线程对共享变量所有的操作都必须先在线程自己的工作内存中进行后写回主内存,不能直接从主内存中读写(不能越级)

不同线程之间也无法直接访问其他线程的工作内存中的变量,线程间变量值的传递需要通过主内存来进行(同级不能相互访问)

JMM规范下,多线程先行发生原则之happens-before

happens-before 规定了对共享变量的写操作对其它线程的读操作可见,它是可见性与有序性的一套规则总结

在JMM中,
如果一个操作执行的结果需要对另一个操作可见性
或者 代码重排序,那么这两个操作之间必须存在happens-before关系。

x 、y案例说明

x = 5 线程A执行
y = x 线程B执行
上述称之为:写后读

y是否等于5呢?

如果线程A的操作(x= 5)happens-before(先行发生)线程B的操作(y = x),那么可以确定线程B执行后y = 5 一定成立;

如果他们不存在happens-before原则,那么y = 5 不一定成立。

这就是happens-before原则的威力。-------------------》包含可见性和有序性的约束

先行发生原则说明

如果Java内存模型中所有的有序性都仅靠volatile和synchronized来完成,那么有很多操作都将会变得非常啰嗦,
但是我们在编写Java并发代码的时候并没有察觉到这一点。

我们没有时时、处处、次次,添加volatile和synchronized来完成程序,这是因为Java语言中JMM原则下
有一个“先行发生”(Happens-Before)的原则限制和规矩

这个原则非常重要:
它是判断数据是否存在竞争,线程是否安全的非常有用的手段。依赖这个原则,我们可以通过几条简单规则一揽子解决并发环境下两个操
作之间是否可能存在冲突的所有问题,而不需要陷入Java内存模型苦涩难懂的底层编译原理之中。

happens-before总原则

如果一个操作happens-before另一个操作,那么第一个操作的执行结果将对第二个操作可见,
而且第一个操作的执行顺序排在第二个操作之前。

两个操作之间存在happens-before关系,并不意味着一定要按照happens-before原则制定的顺序来执行。
如果重排序之后的执行结果与按照happens-before关系来执行的结果一致,那么这种重排序并不非法。

例如 1+2+3 -》 3+2+1

happens-before之8条

次序规则:

一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作;

前一个操作的结果可以被后续的操作获取。
讲白点就是前面一个操作把变量X赋值为1,那后面一个操作肯定能知道X已经变成了1。

锁定规则:

一个unLock操作先行发生于后面((这里的“后面”是指时间上的先后))对同一个锁的lock操作;

package com.dongguo.cas;

/**
 * @author Dongguo
 * @date 2021/9/12 0012-17:29
 * @description: 线程解锁 m 之前对变量的写,对于接下来对 m 加锁的其它线程对该变量的读可见
 */
public class HappensBeforeDemo {
    static int x;
    static Object m = new Object();

    public static void main(String[] args) {
        new Thread(() -> {
            synchronized (m) {
                x = 10;
            }
        }, "t1").start();
        new Thread(() -> {
            synchronized (m) {
                System.out.println(x);
            }
        }, "t2").start();
    }
}
运行结果
10

volatile变量规则:

对一个volatile变量的写操作先行发生于后面对这个变量的读操作,
前面的写对后面的读是可见的,这里的“后面”同样是指时间上的先后。

package com.dongguo.cas;

/**
 * @author Dongguo
 * @date 2021/9/12 0012-17:32
 * @description: 线程对 volatile 变量的写,对接下来其它线程对该变量的读可见
 */
public class HappensBeforeDemo2 {
    volatile static int x;
    public static void main(String[] args) {
        
        new Thread(()->{
            x = 10;
        },"t1").start();
        new Thread(()->{
            System.out.println(x);
        },"t2").start();
    }
}
运行结果
10

传递规则:

如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C;

package com.dongguo.cas;

/**
 * @author Dongguo
 * @date 2021/9/12 0012-17:40
 * @description: 
 */
public class HappensBeforeDemo6 {
    volatile static int x;
    static int y;
    public static void main(String[] args) {
        new Thread(()->{
            y = 10;
            x = 20;
        },"t1").start();
        new Thread(()->{
        // x=20 对 t2 可见, 同时 y=10 也对 t2 可见
            System.out.println(x);
        },"t2").start();
    }
}
运行结果
2

线程启动规则(Thread Start Rule):

Thread对象的start()方法先行发生于此线程的每一个动作

package com.dongguo.cas;

/**
 * @author Dongguo
 * @date 2021/9/12 0012-17:33
 * @description: 线程 start 前对变量的写,对该线程开始后对该变量的读可见
 */
public class HappensBeforeDemo3 {
    static int x;

    public static void main(String[] args) {

        x = 10;
        new Thread(() -> {
            System.out.println(x);
        }, "t2").start();
    }
}
运行结果
10

线程中断规则(Thread Interruption Rule):

对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生;

可以通过Thread.interrupted()检测到是否发生中断

package com.dongguo.cas;

import java.util.concurrent.TimeUnit;

/**
 * @author Dongguo
 * @date 2021/9/12 0012-17:37
 * @description: 线程 t1 打断 t2(interrupt)前对变量的写,对于其他线程得知 t2 被打断后对变量的读可见(通过
 * t2.interrupted 或 t2.isInterrupted)
 */
public class HappensBeforeDemo5 {
    static int x;

    public static void main(String[] args) {
        Thread t2 = new Thread(() -> {
            while (true) {
                if (Thread.currentThread().isInterrupted()) {
                    System.out.println(x);
                    break;
                }
            }
        }, "t2");
        t2.start();
        new Thread(() -> {
            try {
                TimeUnit.SECONDS.sleep(1);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            x = 10;
            t2.interrupt();
        }, "t1").start();
        while (!t2.isInterrupted()) {
            Thread.yield();
        }
        System.out.println(x);
    }
}
运行结果
10
10

线程终止规则(Thread Termination Rule):

线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过Thread::join()方法是否结束、Thread::isAlive()的返回值等手段检测线程是否已经终止执行。

package com.dongguo.cas;

/**
 * @author Dongguo
 * @date 2021/9/12 0012-17:35
 * @description: 线程结束前对变量的写,对其它线程得知它结束后的读可见(比如其它线程调用 t1.isAlive() 或 t1.join()等待
 * 它结束)
 */
public class HappensBeforeDemo4 {
    static int x;
    public static void main(String[] args) {
        Thread t1 = new Thread(()->{
            x = 10;
        },"t1");
        t1.start();
        try {
            t1.join();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println(x);
    }
}
运行结果
10

对象终结规则(Finalizer Rule):

一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始

对象没有完成初始化之前,是不能调用finalized()方法的

案例:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-G5fDkBKW-1632358072787)(E:\笔记\图片\image\15Java内存模型之JMM.assets\image-20210906204107804.png)]

假设存在线程A和B,

线程A先(时间上的先后)调用了setValue(1),

然后线程B调用了同一个对象的getValue(),

那么线程B收到的返回值是什么?

我们就这段简单的代码一次分析happens-before的规则(规则5、6、7、8 可以忽略,因为他们和这段代码毫无关系):
1 由于两个方法是由不同的线程调用,不在同一个线程中,所以肯定不满足程序次序规则;
2 两个方法都没有使用锁,所以不满足锁定规则;
3 变量不是用volatile修饰的,所以volatile变量规则不满足;
4 传递规则肯定不满足;

所以我们无法通过happens-before原则推导出线程A happens-before线程B,虽然可以确认在时间上线程A优先于线程B指定,
但就是无法确认线程B获得的结果是什么,所以这段代码不是线程安全的。那么怎么修复这段代码呢?

1把getter/setter方法都定义为synchronized方法

2把value定义为volatile变量,由于setter方法对value的修改不依赖value的原值,满足volatile关键字使用场景

as-if-serial语义

看上去是(单线程)序列化执行的

as-if-serial语义的意思是:不管怎么重排序,单线程程序的执行结果不能被改变。编译器、runtime和处理器都必须遵守as-if-serial语义。所以编译器和处理器不会对存在数据依赖关系的操作做重排序,因为这种重排序会改变执行结果。但是,如果操作之间不存在数据依赖关系,这些操作就可能被编译器和处理器重排序。

下面还是以书中的实例(计算圆的面积)进行说明:

double pi  = 3.14;           // A
double r   = 1.0;            // B
double area = pi * r * r;    // C

上面3个操作的数据依赖关系如图所示:

javarealm模型 java jmm模型_java_09

A和C之间存在数据依赖关系,同时B和C之间也存在数据依赖关系。因此在最终执行的指令序列中,C不能被重排序到A和B的前面(因为C排到A和B的前面,程序的结果将会被改变)。但A和B之间没有数据依赖关系,编译器和处理器可以重排序A和B之间的执行顺序

该程序的两种可能执行顺序:

javarealm模型 java jmm模型_java_10

as-if-serial语义把单线程程序保护了起来,遵守as-if-serial语义的编译器、runtime和处理器共同为编写单线程程序的程序员创建了一个幻觉:单线程程序是按程序的顺序来执行的

保证单线程的最终一致性