并发编程之：JMM

2021 年 8 月 28 日
筆記
JAVA, 多线程

并发编程之：JMM

大家好，我是小黑，一个在互联网苟且偷生的农民工。

上一期给大家分享了关于Java中线程相关的一些基础知识。在关于线程终止的例子中，第一个方法讲到要想终止一个线程，可以使用标志位的方法，我们再来回顾一下代码。

class MyRunnable implements Runnable {
    // volatile关键字，保证主线程修改后当前线程能够看到被改后的值（可见性）
    private volatile boolean exit = false; 
    @Override
    public void run() {
        while (!exit) { // 循环判断标识位，是否需要退出
            System.out.println("这是我自定义的线程");
        }
    }
    public void setExit(boolean exit) {
        this.exit = exit;
    }
}
public class ThreadDemo {
    public static void main(String[] args) {
        MyRunnable runnable = new MyRunnable();
        new Thread(runnable).start();
        runnable.setExit(true); //修改标志位，退出线程
    }
}

在这个代码中，标志位exit字段在声明时使用了volatile关机字修饰，目的是为了保证在另外一个线程修改后当前线程能够感知到变化，那么这个关键字到底做了些什么呢？这一期我们来详细聊一聊。

在开始讲volatile关键字之前，需要先和大家聊一聊计算机的内存模型这个玩意儿。

计算机的内存模型

所谓内存模型，英文描述是Memory Model，这玩意儿是一个比较底层的东西，它是与计算机硬件有关的一个概念。

我们都知道，计算机在执行程序的时候，最终是一条条的指令在CPU中执行，在执行过程中往往会存在数据的传递。而数据是存放在主内存上的，对，就是你那个内存条。

在刚开始CPU的的执行速度还不够快的时候并没有什么问题，但随着CPU技术的不断发展，CPU计算的速度越来越快，但是呢，从主内存上读取和写入数据的速度有点拉胯，跟不上呀，这就导致CPU每次操作主内存都要花费很多的等待时间。

技术总是要往前发展的，不能因为内存读写慢CPU就不发展了吧，也不能让主内存的读写速度成为瓶颈。

想必这里大家也应该想到了，就是在CPU和主内存之间加一个高速缓存，将需要的数据在这个高速缓存上复制一份，而这个高速缓存的特点就是读写很快，然后定期的将缓存中的数据和主内存同步。

到这里问题就解决了吗？ too young,too simple啊，这种结构在但线程的情况下是没有问题的，随着计算机能力不断提升，开始支持多线程了，并且CPU牛逼到支持多核，到现在的4核8核16核，在这种情况下是会存在一些问题的，我们来分析一下。

单核多线程情况：多个线程同时访问一个共享数据，CPU将数据从主内存加载到高速缓存中，多个线程会访问高速缓存中的同一个地址，这样即使在线程切换时，缓存数据也不会失效，因为在单核CPU同一时间只能有一个线程在执行，所以也不会有数据访问的冲突。

多核多线程情况：每个CPU内核都会复制一份数据到自己的高速缓存，这样的话在不同内核上的两个线程是并行的，这样就会导致两个内核各自缓存的数据发生不一致。这个问题就叫做缓存一致性问题。

除了上面说到的缓存一致性问题，计算机为了使CPU的算力能够被充分利用，会对输入的指令进行乱序处理，叫做处理器优化。很多的编程语言为了提高执行效率，也会对代码的执行顺序重新排序，比如咱们Java虚拟机的即时编译器(JIT)也会做，这个动作叫做指令重排。

int a = 1;
int b = 2;
int c = a + b;
int d = a - b;

比如我们写的这段代码，第三行和第四行的执行顺序就有可能发生改变，这在单线程中并没有问题，但是在多线程情况下，会产生和我们预期不一样的结果。

其实上面提出的缓存一致性问题，处理器优化，指令重排就对应我们并发编程中的可见性问题，原子性问题，有序性问题。带着这些问题，我们再来看看，在Java中是如何来解决的。

因为存在这些问题，那么肯定要有一种机制来解决。这种解决的机制就是内存模型。

内存模型定义了一个规范，用来保证共享内存的可见性，有序性，原子性。内存模型是怎么解决的呢？主要采取两种方式：限制处理器优化和内存屏障。这里我们先不深究底层原理。

JMM

从前面我们知道内存模型是一个规范，用来解决并发情况下的一些问题。不同的编程语言对于这个规范都有对应的实现。那么JMM（Java Memory Model）就是Java语言对于这一规范的具体实现。

那么JMM具体是如何解决这写问题的呢？我们先来看下面这张图。

内存可见性问题

我们一个一个问题来看，首先，如何解决可见性问题？

如上图所示，在JMM中，一个线程对于一个数据的操作，分成了6个步骤。

分别是：read,load,use,assign,write,store.

如果说这个变量在声明时，没有使用volatile关键字，那么两个线程是各自复制一份到工作内存，线程B将flag赋值为true，线程A是不可见的。

那么要想线程A可见，就需要在声明flag这个变量时，加上volatile关键字。那么加了关键字之后JMM是怎么做的呢？这里要分读和写两个情况。

线程在读取一个volatile变量时，JMM会把工作内存中的该变量置为无效，重新从主内存中读取；
线程在写一个volatile变量时，会立刻将工作内存中的值刷新到主内存中。

也就是说，对于volatile关键字修饰的变量，在read,load,use操作必须是一起执行的；assign，write,store操作时一起执行。

通过这样的方式，就能够解决内存可见性的问题。

指令重排

而指令重排这个问题，对于编译器来说，只要该对象声明为volatile的，那么就不会对它进行指令重排的优化。

而volatile禁止指令重排的这种规则是符合一个叫做happens-before的规则。

happens-before除了在volatile变量规则外，还有一些其他规则。

程序次序规则：在一个线程内一段代码的执行结果是有序的。就是还会指令重排，但是随便它怎么排，结果是按照我们代码的顺序生成的不会变。

管程锁定规则：就是无论是在单线程环境还是多线程环境，对于同一个锁来说，一个线程对这个锁解锁之后，另一个线程获取了这个锁都能看到前一个线程的操作结果！(管程是一种通用的同步原语，synchronized就是管程的实现）

volatile变量规则：就是如果一个线程先去写一个volatile变量，然后一个线程去读这个变量，那么这个写操作的结果一定对读的这个线程可见。

线程启动规则：在主线程A执行过程中，启动子线程B，那么线程A在启动子线程B之前对共享变量的修改结果对线程B可见。

线程终止规则：在主线程A执行过程中，子线程B终止，那么线程B在终止之前对共享变量的修改结果在线程A中可见。也称线程join()规则。

线程中断规则：对线程interrupt()方法的调用先行发生于被中断线程代码检测到中断事件的发生，可以通过Thread.interrupted()检测到是否发生中断。

传递性规则：happens-before原则具有传递性，即hb(A, B) ， hb(B, C)，那么hb(A, C)。

对象终结规则：一个对象的初始化的完成，也就是构造函数执行的结束一定 happens-before它的finalize()方法。

竞态条件

到这里，大家是不是感觉问题已经都解决了？emmm，我们来看下面这个场景：

假设上图中的线程A和线程B执行在两个CPU核心上，是并行执行的，它们一起读取到i的值等于0，然后各自加1，然后一起往主内存写。如果线程A和线程B是有先后顺序执行的，i的值最后应该是等于2才对，但是并行情况下是有可能同时操作的，最后写回到主内存中的值只被增加了一次。

这就好比你的银行卡收到了两笔100块的转账，但是账户上只多了100块。

对于这种问题通过volatile是无法解决的，volatile不会保证该变量操作的原子性。那我们应该怎么解决呢，就需要使用synchronized对这个操作加锁，保证同一时刻只能有一个线程进行操作。

总结

因为CPU和内存之间存在着高速缓存，在多线程并发情况下，可能会存在缓存一致性问题；而CPU对于输入的指令会做一些处理器优化，一些高级语言的编译器也会做指令重排。因为这些问题，会导致我们在并发情况下存在内存可见性问题，有序性问题，而JMM就是Java中为了解决这些问题而出现的。通过volatile关键字可以保证内存可见性，并且会禁止指令重排。但是volatile只能保证操作的有序性，无法保证操作的原子性，所以，为了安全，我们对于共享变量的并发处理要进行加锁。

好的，今天的内容就到这里，我们下期再见。

Tags: JAVA 多线程