ReentrantLock 源码分析以及 AQS （一）

2020 年 3 月 13 日
筆記

前言

JDK1.5 之后发布了JUC（java.util.concurrent），用于解决多线程并发问题。AQS 是一个特别重要的同步框架，很多同步类都借助于 AQS 实现了对线程同步状态的管理。

AQS 中最主要的就是独占锁和共享锁的获取和释放，以及提供了一些可中断的获取锁，超时等待锁等方法。

ReentranLock 是基于 AQS 独占锁的一个实现。ReentrantReadWriteLock 是基于 AQS 共享锁的一个读写锁实现。本来打算一篇文章里面写完独占锁和共享锁，但是发现篇幅太长了，也不易于消化。

因此，本篇就先结合 ReentrantLock 源码，分析 AQS 的独占锁获取和释放。以及 ReentrantLock 的公平锁和非公平锁实现。

下一篇再写 ReentrantReadWriteLock 读写锁源码，以及 AQS 共享锁的获取和释放。

在正式讲解源码之前，墙裂建议读者做一些准备工作，最好对以下知识有一定的了解，这样阅读起来源码会比较轻松（因为，我当初刚开始接触多线程时，直接看 AQS 简直是一脸懵逼，就像读天书一样。。）。

了解双向链表的数据结构，以及队列的入队出队等操作。
LockSupport 的 park，unpark 方法，以及对线程的 interrupt 几个方法了解（可参考：LockSupport的 park 方法是怎么响应中断的？）。
对 CAS 和自旋机制有一定的了解。

AQS 同步队列

AQS 内部维护了一个 FIFO（先进先出）的双向队列。它的内部是用双向链表来实现的，每个数据节点（Node）中都包含了当前节点的线程信息，还有它的前后两个指针，分别指向前驱节点和后继节点。下边看一下 Node 的属性和方法：

static final class Node {      //可以认为是一种标记，表明了这个 node 是以共享模式在同步队列中等待      static final Node SHARED = new Node();      //也是一种标记，表明这个 node 是以独占模式在同步队列中等待      static final Node EXCLUSIVE = null;        /** waitStatus 常量值 */      //说明当前节点被取消，原因有可能是超时，或者被中断。      //节点被取消的状态是不可逆的，也就是说此节点会一直停留在取消状态，不会转变。      static final int CANCELLED =  1;      //说明后继节点的线程被 park 阻塞，因此当前线程需要在释放锁或者被取消时，唤醒后继节点      static final int SIGNAL    = -1;      //说明线程在 condition 条件队列等待      static final int CONDITION = -2;      //在共享模式中用，表明下一个共享线程应该无条件传播      static final int PROPAGATE = -3;          //当前线程的等待状态，除了以上四种值，还有一个值 0 为初始化状态（条件队列的节点除外）。      //注意这个值修改时是通过 CAS ，以保证线程安全。      volatile int waitStatus;        //前驱节点      volatile Node prev;        //后继节点      volatile Node next;        //当前节点中的线程，通过构造函数初始化，出队时会置空（这个后续说，重点强调）      volatile Thread thread;        //有两种情况。1.在 condition 条件队列中的后一个节点      //2. 一个特殊值 SHARED 用于表明当前是共享模式（因为条件队列只存在于独占模式）      Node nextWaiter;        //是否是共享模式，理由同上      final boolean isShared() {          return nextWaiter == SHARED;      }        //返回前驱节点，如果为空抛出空指针      final Node predecessor() throws NullPointerException {          Node p = prev;          if (p == null)              throw new NullPointerException();          else              return p;      }        Node() {    // Used to establish initial head or SHARED marker      }        Node(Thread thread, Node mode) {     // Used by addWaiter          this.nextWaiter = mode;          this.thread = thread;      }        Node(Thread thread, int waitStatus) { // Used by Condition          this.waitStatus = waitStatus;          this.thread = thread;      }  }

另外，在 AQS 类中，还会记录同步队列的头结点和尾结点：

    //同步队列的头结点，是懒加载的，即不会立即创建一个同步队列，      //只有当某个线程获取不到锁，需要排队的时候，才会初始化头结点      private transient volatile Node head;        //同步队列的尾结点，同样是懒加载。      private transient volatile Node tail;

独占锁

这部分就结合 ReentrantLock 源码分析 AQS 的独占锁是怎样获得和释放锁的。

非公平锁

首先，我们从 ReentrantLock 开始分析，它有两个构造方法，一个构造，可以传入一个 boolean 类型的参数，表明是用公平锁还是非公平锁模式。另一个构造方法，不传入任何参数，则默认用非公平锁。

public ReentrantLock() {      sync = new NonfairSync();  }    public ReentrantLock(boolean fair) {      sync = fair ? new FairSync() : new NonfairSync();  }

NonfairSync 和 FairSync 都继承自 Sync ，它们都是 ReentranLock 的内部类。而Sync 类又继承自 AQS (AbstractQueuedSynchronizer)。

static final class NonfairSync extends Sync {  }    static final class FairSync extends Sync {  }    abstract static class Sync extends AbstractQueuedSynchronizer {  }

知道了它们之间的继承关系，我们就从非公平锁的加锁方法作为入口，跟踪源码。因为非公平锁的流程讲明白之后，公平锁大致流程都一样，只是多了一个条件判断（这个，一会儿后边细讲，会做对比）。

NonfairSync.lock

我们看下公平锁的获取锁的方法：

final void lock() {      //通过 CAS 操作把 state 设置为 1      if (compareAndSetState(0, 1))          //如果设值成功，说明加锁成功，保存当前获得锁的线程          setExclusiveOwnerThread(Thread.currentThread());      else          //如果加锁失败，则执行 AQS 的acquire 方法          acquire(1);  }    public final void acquire(int arg) {      if (!tryAcquire(arg) &&          acquireQueued(addWaiter(Node.EXCLUSIVE), arg))          selfInterrupt();  }

acquire

这个方法的逻辑是：

通过 tryAcquire 方法，尝试获取锁，如果成功，则返回 true，失败返回 false 。
tryAcquire 失败之后，会先调用 addWaiter 方法，把当前线程封装成 node 节点，加入同步队列（独占模式）。
acquireQueued 方法会把刚加入队列的 node 作为参数，通过自旋去获得锁。

tryAcquire

这是一个模板方法，具体的实现需要看它的子类，这里对应的就是 ReentrantLock.NonfairSync.tryAcquire 方法。我们看一下：

protected final boolean tryAcquire(int acquires) {      return nonfairTryAcquire(acquires);  }    final boolean nonfairTryAcquire(int acquires) {      //当前线程      final Thread current = Thread.currentThread();      //获取当前的同步状态，若为 0 ，表示无锁状态。若大于 0，表示已经有线程抢到了锁。      int c = getState();      if (c == 0) {          //然后通过 CAS 操作把 state 的值改为 1。          if (compareAndSetState(0, acquires)) {              // CAS 成功之后，保存当前获得锁的线程              setExclusiveOwnerThread(current);              return true;          }      }      // 如果 state 大于0，则判断当前线程是否是获得锁的线程，是的话，可重入。      else if (current == getExclusiveOwnerThread()) {          //由于 ReentrantLock 是可重入的，所以每重入一次 state 就加 1 。          int nextc = c + acquires;          if (nextc < 0)              throw new Error("Maximum lock count exceeded");          setState(nextc);          return true;      }      return false;  }

addWaiter

如果获取锁失败之后，就会调用 addWaiter 方法，把当前线程加入同步队列。

private Node addWaiter(Node mode) {      //把当前线程封装成 Node ，并且是独占模式      Node node = new Node(Thread.currentThread(), mode);      //尝试快速入队，如果失败，则会调用 enq 入队方法。enq 会初始化队列。      Node pred = tail;      //如果 tail 不为空，说明当前队列中已经有节点      if (pred != null) {          //把当前 node 的 prev 指针指向 tail          node.prev = pred;          //通过 CAS 把 node 设置为 tail，即添加到队尾          if (compareAndSetTail(pred, node)) {              //把旧的 tail 节点的 next 指针指向当前 node              pred.next = node;              return node;          }      }      //当 tail 为空时，把 node 添加到队列，如果需要的话，先进行队列初始化      enq(node);      //入队成功之后，返回当前 node      return node;  }

enq

通过自旋，把当前节点加入到队列中

private Node enq(final Node node) {      for (;;) {          Node t = tail;          //如果 tail为空，说明队列未初始化          if (t == null) {              //创建一个空节点，通过 CAS把它设置为头结点              if (compareAndSetHead(new Node()))                  //此时只有一个 head头节点，因此把 tail也指向它                  tail = head;          } else {              //第二次自旋时，tail不为空，于是把当前节点的 prev指向 tail节点              node.prev = t;              //通过 CAS把 tail节点设置为当前 node节点              if (compareAndSetTail(t, node)) {                  //把旧的 tail节点的 next指向当前 node                  t.next = node;                  return t;              }          }      }  }

acquireQueued

入队成功之后，就会调用 acquireQueued 方法自旋抢锁。

final boolean acquireQueued(final Node node, int arg) {      boolean failed = true;      try {          boolean interrupted = false;          for (;;) {              //获取当前节点的前驱节点              final Node p = node.predecessor();              //如果前驱节点就是 head 节点，就调用 tryAcquire 方法抢锁              if (p == head && tryAcquire(arg)) {                  //如果抢锁成功，就把当前 node 设置为头结点                  setHead(node);                  p.next = null; // help GC                  failed = false;                  //抢锁成功后，会把线程中断标志返回出去，终止for循环                  return interrupted;              }              //如果抢锁失败，就根据前驱节点的 waitStatus 状态判断是否需要把当前线程挂起              if (shouldParkAfterFailedAcquire(p, node) &&                  //线程被挂起时，判断是否被中断过                  parkAndCheckInterrupt())                  //注意此处，如果被线程被中断过，需要把中断标志重新设置一下                  interrupted = true;          }      } finally {          if (failed)              //如果抛出异常，则取消锁的获取，进行出队操作              cancelAcquire(node);      }  }

setHead

通过代码，我们可以看到，当前的同步队列中，只有第二个节点才有资格抢锁。如果抢锁成功，则会把它设置为头结点。

private void setHead(Node node) {      head = node;      node.thread = null;      node.prev = null;  }

需要注意的是，这个方法，会把头结点的线程设置为 null 。想一下，为什么？

因为，此时头结点的线程已经抢锁成功，需要出队了。自然的，队列中也就不应该存在这个线程了。

PS：由 enq 方法，还有 setHead 方法，我们可以发现，头结点的线程总是为 null。这是因为，头结点要么是刚初始化的空节点，要么是抢到锁的线程出队了。因此，我们也常常把头结点叫做虚拟节点（不存储任何线程）。

shouldParkAfterFailedAcquire

以上是抢锁成功的情况，那么抢锁失败了呢？这时，我们需要判断是否应该把当前线程挂起。

private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {      //获取当前节点的前驱节点的 waitStatus      int ws = pred.waitStatus;      if (ws == Node.SIGNAL)          //如果 ws = -1 ，说明当前线程可以被前驱节点正常唤醒，于是就可以安全的 park了          return true;      if (ws > 0) {          //如果 ws > 0，说明前驱节点被取消，则会从当前节点依次向前查找，          //直到找到第一个没有被取消的节点，把那个节点的 next 指向当前 node          //这一步，是为了找到一个可以把当前线程唤起的前驱节点          do {              node.prev = pred = pred.prev;          } while (pred.waitStatus > 0);          pred.next = node;      } else {          //如果 ws 为 0，或者 -3（共享锁状态），则把它设置为 -1          //返回 false，下次自旋时，就会判断等于 -1，返回 true了          compareAndSetWaitStatus(pred, ws, Node.SIGNAL);      }      return false;  }

parkAndCheckInterrupt

如果 shouldParkAfterFailedAcquire 返回 true，说明当前线程需要被挂起。因此，就执行此方法，同时检查线程是否被中断。

private final boolean parkAndCheckInterrupt() {      //把当前线程挂起，则 acquireQueued 方法的自旋就会暂停，等待前驱节点 unpark      LockSupport.park(this);      //返回当前节点是否被中断的标志，注意此方法会把线程的中断标志清除。      //因此，返回上一层方法时，需要设置 interrupted = true 把中断标志重新设置，以便上层代码可以处理中断      return Thread.interrupted();  }

想一下，为什么抢锁失败后，需要判断是否把线程挂起？

因为，如果抢不到锁，并且还不把线程挂起，acquireQueued 方法就会一直自旋下去，这样你的CPU能受得了吗。

cancelAcquire

当不停的自旋抢锁时，若发生了异常，就会调用此方法，取消正在尝试获取锁的线程。node 的位置分为三种情况，见下面注释，

private void cancelAcquire(Node node) {        if (node == null)          return;        // node 不再指向任何线程      node.thread = null;        Node pred = node.prev;      //从当前节点不断的向前查找，直到找到一个有效的前驱节点      while (pred.waitStatus > 0)          node.prev = pred = pred.prev;        Node predNext = pred.next;        //把 node 的 ws 设置为 -1      node.waitStatus = Node.CANCELLED;        // 1.如果 node 是 tail，则把 tail 更新为 node，并把 pred.next 指向 null      if (node == tail && compareAndSetTail(node, pred)) {          compareAndSetNext(pred, predNext, null);      } else {          int ws;          //2.如果 node 既不是 tail，也不是 head 的后继节点，就把 node的前驱节点的 ws 设置为 -1          //最后把 node 的前驱节点的 next 指向 node 的后继节点          if (pred != head &&              ((ws = pred.waitStatus) == Node.SIGNAL ||               (ws <= 0 && compareAndSetWaitStatus(pred, ws, Node.SIGNAL))) &&              pred.thread != null) {              Node next = node.next;              if (next != null && next.waitStatus <= 0)                  compareAndSetNext(pred, predNext, next);          } else {              //3.如果 node是 head 的后继节点，则直接唤醒 node 的后继节点。              //这个也很好理解，因为 node 是队列中唯一有资格尝试获取锁的节点，              //它放弃了资格，当然有义务把后继节点唤醒，以让后继节点尝试抢锁。              unparkSuccessor(node);          }            node.next = node; // help GC      }  }

unparkSuccessor

这个唤醒方法就比较简单了，

private void unparkSuccessor(Node node) {        int ws = node.waitStatus;      if (ws < 0)          compareAndSetWaitStatus(node, ws, 0);        Node s = node.next;      if (s == null || s.waitStatus > 0) {          s = null;          //从尾结点向前依次遍历，直到找到距离当前 node 最近的一个有效节点          for (Node t = tail; t != null && t != node; t = t.prev)              if (t.waitStatus <= 0)                  s = t;      }      if (s != null)          //把这个有效节点的线程唤醒，          //唤醒之后，当前线程就可以继续自旋抢锁了，（回到 park 的地方）          LockSupport.unpark(s.thread);  }

下面画一个流程图更直观的查看整个获取锁的过程。

公平锁

公平锁和非公平锁的整体流程大致相同，只是在抢锁之前先判断一下是否已经有人排在前面，如果有的话，就不执行抢锁。我们通过源码追踪到 FairSync.tryAcquire 方法。会发现，多了一个 hasQueuedPredecessors 方法。

hasQueuedPredecessors

这个方法判断逻辑稍微有点复杂，有多种情况。

public final boolean hasQueuedPredecessors() {      Node t = tail;      Node h = head;      Node s;      return h != t &&              ((s = h.next) == null || s.thread != Thread.currentThread());  }

如果 h == t，说明 h 和 t 都为空（此时队列还未初始化）或者它们是同一个节点（说明队列已经初始化，并且只有一个节点，此时为 enq 方法第一次自旋成功后）。此时，返回false。
如果 h != t，则判断 head.next == null 是否成立，如果成立，则返回 true。这种情况发生在有其他线程第一次入队时。在 AQS 的 enq 入队方法，设置头结点成功之后 compareAndSetHead(new Node()) ，还未执行 tail = head 时（仔细想一想为什么？）。此时 tail = null , head = new Node()，head.next = null。
如果 h != t，并且 head.next != null，说明此时队列中至少已经有两个节点，则判断 head.next 是否是当前线程。如果是，返回 false（注意是 false哦，因为用了 !），否则返回 true 。

总结：以上几种情况，只有最终返回 false 时，才会继续往下执行。因为 false，说明没有线程排在当前线程前面，于是通过 CAS 尝试把 state 值设置为 1。若成功，则方法返回。若失败，同样需要去排队。

公平锁和非公平锁区别

举个例子来对比公平锁和非公平锁。比如，现在到饭点了，大家都到食堂打饭。把队列中的节点比作排队打饭的人，每个打饭窗口都有一个管理员，只有排队的人从管理员手中抢到锁，才有资格打饭。打饭的过程就是线程执行的过程。

如果，你发现前面没有人在排队，那么就可以直接从管理员手中拿到锁，然后打饭。对于公平锁来说，如果你前面有人在打饭，那么你就要排队到他后面（图中B），等他打完之后，把锁还给管理员。那么，你就可以从管理员手中拿到锁，然后打饭了。后面的人依次排队。这就是FIFO先进先出的队列模型。

对于非公平锁来说，如果你是图中的 B，当 A 把锁还给管理员后，有可能有另外一个 D 插队过来直接把锁抢走。那么，他就可以打饭，你只能继续等待了。

所以，可以看出来。公平锁是严格按照排队的顺序来的，先来后到嘛，你来的早，就可以早点获取锁。优点是，这样不会造成某个线程等待时间过长，因为大家都是中规中矩的在排队。而缺点呢，就是会频繁的唤起线程，增加 CPU的开销。

非公平锁的优点是吞吐量大，因为有可能正好锁可用，然后线程来了，直接抢到锁了，不用排队了，这样也减少了 CPU 唤醒排队线程的开销。但是，缺点也很明显，你说我排队排了好长时间了，终于轮到我打饭了，凭什么其他人刚过来就插到我前面，比我还先打到饭，也太不公平了吧，后边一大堆排队的人更是怨声载道。这要是每个人来了都插到我前面去，我岂不是要饿死了。

独占锁的释放

我们从 ReentrantLock 的 unlock 方法看起：

public void unlock() {      //调用 AQS 的 release 方法      sync.release(1);  }    public final boolean release(int arg) {      if (tryRelease(arg)) {          Node h = head;          //如果头结点不为空，并且 ws 不为 0，则唤起后继节点          if (h != null && h.waitStatus != 0)              unparkSuccessor(h);          return true;      }      return false;  }

这段逻辑比较简单，当线程释放锁之后，就会唤醒后继节点。 unparkSuccessor 已讲，不再赘述。然后看下 tryRelease 方法，公平锁和非公平锁走的是同一个方法。

protected final boolean tryRelease(int releases) {      //每释放一次锁，state 值就会减 1，因为之前可能有锁的重入      int c = getState() - releases;      //如果当前线程不是抢到锁的线程，则抛出异常      if (Thread.currentThread() != getExclusiveOwnerThread())          throw new IllegalMonitorStateException();      boolean free = false;      if (c == 0) {          //只有 state 的值减到 0 的时候，才会全部释放锁          free = true;          setExclusiveOwnerThread(null);      }      setState(c);      return free;  }

因为，ReentrantLock 支持锁的重入，所以每次重入 state 值都会加 1，相应的每次释放锁， state 的值也会减 1 。所以，这也是为什么每个 lock 方法最后都要有一个 unlock 方法释放锁，它们的个数需要保证相同。

当 state 值为 0 的时候，说明锁完全释放。其他线程才可以有机会抢到锁。

结语

以上已经讲解了独占锁主要的获取方法 acquire ，另外还有一些其他相关方法，不再赘述，因为主要逻辑都是一样的，只有部分稍有不同，只要理解了 acquire ，这些都是相通的。如 acquireInterruptibly 方法，它可以在获取锁的时候响应中断。还有超时获取锁的方法 doAcquireNanos 可以设定获取锁的超时时间，超时之后就返回失败。

下篇预告：分析 ReentrantReadWriteLock 读写锁源码，以及 AQS 共享锁的获取和释放，敬请期待。

如果本文对你有用，欢迎点赞，评论，转发。

学习是枯燥的，也是有趣的。我是「烟雨星空」，欢迎关注，可第一时间接收文章推送。