LinkedList源码分析（jdk1.8）

2019 年 10 月 3 日
筆記

LinkedList概述

LinkedList 是 Java 集合框架中一个重要的实现，我们先简述一下LinkedList的一些特点：

LinkedList底层采用的双向链表结构；
LinkedList支持空值和重复值(List的特点)；
LinkedList实现Deque接口，具有双端队列的特性，也可以作为栈来使用；
LinkedList存储元素过程中，无需像 ArrayList 那样进行扩容，但存储元素的节点需要额外的空间存储前驱和后继的引用；
LinkedList在链表头部和尾部插入效率比较高，但在指定位置进行插入时，需要定位到该位置处的节点，此操作的时间复杂度为O(N)；
LinkedList是非线程安全的集合类，并发环境下，多个线程同时操作 LinkedList，会引发不可预知的异常错误。

LinkedList继承体系

直接通过idea查看一下LinkedList的继承体系，体系结构比较复杂，一点点看。

继承自 AbstractSequentialList；
实现了 List 和 Deque 接口；
实现序列化接口；
实现了Cloneable接口

这里简单说一下AbstractSequentialList这个类，该类提供一套基本的基于顺序访问的接口，通过继承此类，子类仅需实现部分代码即可拥有完整的一套访问某种序列表（比如链表）的接口。AbstractSequentialList 提供的方法基本上都是通过 ListIterator 实现的，比如下面的get和add方法。但是虽然LinkedList 继承了 AbstractSequentialList，却并没有直接使用父类的方法，而是重新实现了一套的方法，后面我们会讲到这些方法的实现。

public E get(int index) {      try {          return listIterator(index).next();      } catch (NoSuchElementException exc) {          throw new IndexOutOfBoundsException("Index: "+index);      }  }  public void add(int index, E element) {      try {          listIterator(index).add(element);      } catch (NoSuchElementException exc) {          throw new IndexOutOfBoundsException("Index: "+index);      }  }  // 留给子类实现  public abstract ListIterator<E> listIterator(int index);

另外的就是文章开头概述的，LinkedList实现了Deque接口，具有双端队列的特点。

LinkedList的成员属性

//记录链表中的实际元素个数  transient int size = 0;  //维护链表的首结点引用  transient Node<E> first;  //维护链表的尾节点引用  transient Node<E> last;

可以看到first和last都是Node类型的，所以我们简单看一下LinkedList中的这个内部类

private static class Node<E> {      E item; //结点中存放的实际元素      Node<E> next; //维护结点的后继结点      Node<E> prev; //维护结点的前驱结点      //构造方法，创建一个新的结点，参数为：前驱结点，插入元素引用，后继节点      Node(Node<E> prev, E element, Node<E> next) {          this.item = element;          this.next = next;          this.prev = prev;      }  }

可以看到Node这个静态内部类的结构也是比较简单的，每个结点维护的就是自己存储的元素信息+前驱结点引用+后继节点引用。这里就不做过多的阐述，下面简单看看LinkedList的构造方法

LinkedList的构造方法

//构造一个空的集合（链表为空）  public LinkedList() {  }  //先调用自己的无参构造方法构造一个空的集合，然后将Collection集合中的所有元素加入该链表中  //如果传入的Collection为空，会抛出空指针异常  public LinkedList(Collection<? extends E> c) {      this();      addAll(c);  }

LinkedList的主要方法

add方法

LinkedList实现的添加方法主要有下面几种

在链表尾部添加结点（linkLast方法）
在链表首部添加元素（linkFirst方法）
在链表中间添加元素（linkBefore方法）

下面我们看看这三种方法的实现。

（1）linkLast方法

public void addLast(E e) {      linkLast(e);  }

在addLast方法中直接就是调用了linkLast方法实现结点的添加（没有返回值，所以add方法一定是返回true的），所以下面我们看看这个方法：

void linkLast(E e) {      //（1）获得当前链表实例的全局后继节点      final Node<E> l = last;      //（2）创建一个新的结点，从Node的构造方法我们就能知道      //这个新的结点中存放的元素item为当前传入的泛型引用，前驱结点为全局后继结点，后继节点为null      //(即相当于要将这个新节点作为链表的新的后继节点)      final Node<E> newNode = new Node<>(l, e, null);// Node(Node<E> prev, E element, Node<E> next){}      //（3）更新全局后继节点的引用      last = newNode;      //（4）如果原链表的后继结点为null，那么也需要将全局头节点引用指向这个新的结点      if (l == null)          first = newNode;      //（5）不为null，因为是双向链表，创建新节点的时候只是将newNode的prev设置为原last结点。这里就需要将原last      //结点的后继结点设置为newNode      else          l.next = newNode;      //（6）更新当前链表中的size个数      size++;      //（7）这里是fast-fail机制使用的参数      modCount++;  }

我们通过一个示例图来简单模拟这个过程

当链表初始时为空的时候，我么调用add方法添加一个新的结点

链表不为空，此时调用add方法在链表尾部添加结点的时候

（2）linkFirst方法

该方法是一个private方法，通过addFirst方法调用暴露给使用者。

public void addFirst(E e) {      linkFirst(e);  }

我们还是主要看看linkFirst方法的实现逻辑

private void linkFirst(E e) {      //（1）获取全局头节点      final Node<E> f = first;      //（2）创建一个新节点，其前驱结点为null，后继结点为当前的全局首结点      final Node<E> newNode = new Node<>(null, e, f);      //（3）更新全局首结点引用      first = newNode;      //（4）如果首结点为null，last结点指向新建的结点      if (f == null)          last = newNode;      //（5）不为null，原头节点的前驱结点为newNode      else          f.prev = newNode;      size++;      modCount++;  }

上面的逻辑也比较简单，就是将新添加的结点设置为头节点，然后更新链表中结点之间的指向，我们通过下面这个图简单理解一下（链表初始为null就不做演示了，和上面图示的差不多，这里假设已经存在结点）

（3）linkBefore方法

public void add(int index, E element) {      //检查index的合法性：大于等于0小于等于size，不合法会抛出异常      checkPositionIndex(index);      //index等于size，就在尾部插入新节点，linkLast方法上面说到过      if (index == size)          linkLast(element);      //否则就在指定index处插入结点，先找到index处的结点（调用的是node(index方法)）      else          linkBefore(element, node(index));  }  private void checkPositionIndex(int index) {      if (!isPositionIndex(index))          throw new IndexOutOfBoundsException(outOfBoundsMsg(index));  }  private boolean isPositionIndex(int index) {      return index >= 0 && index <= size;  }

add(index,element)方法中主要的逻辑还是linkBefore，我们下面看看这个方法，在此之前调用的是node(index)方法，找到index处的结点

Node<E> node(int index) {      //index < size/2 （index在链表的前半部分）      if (index < (size >> 1)) {          //使用全局头节点去查找（遍历链表）          Node<E> x = first;          for (int i = 0; i < index; i++)              x = x.next;          return x;      } else {          //index > size / 2 （index在链表的后半部分）          Node<E> x = last;          //使用全局尾节点向前查找          for (int i = size - 1; i > index; i--)              x = x.prev;          return x;      }  }

node方法实现利用双向链表以及记录了链表总长度的这两个特点，分为前后两部分去遍历查询jindex位置处的结点。查找这个结点后，就会作为参数调用linkBefore方法，如下所示

void linkBefore(E e, Node<E> succ) {      //succ != null;succ就是指定位置处的结点      //传入的结点element=succ      final Node<E> pred = succ.prev;      //创建新的结点      //前驱结点是传入的结点的前驱结点      //后继结点是传入的结点      final Node<E> newNode = new Node<>(pred, e, succ);      //更新index处结点的前驱结点引用      succ.prev = newNode;      //index处结点的前驱结点为null，那么就相当于在头部插入结点，并且更新first      if (pred == null)          first = newNode;      //不为null，那么它的后继结点就是新的结点      else          pred.next = newNode;      size++;      modCount++;  }

这个方法的逻辑也比较简单，就是在succ和succ.prev两个结点之间插入一个新的结点，我们通过简单的图示理解这个过程

删除

作为双端队列，删除元素也有两种方式队列首删除元素、队列尾删除元素；作为List，又要支持中间删除元素，所以删除元素一个有三个方法。

（1）unlinkFirst方法

下面是调用unlinkFirst方法的两个public方法（Deque接口的方法实现），主要区别就是removeFirst方法执行时候，first为null的时候会抛出异常，而pollFirst返回null。

// remove的时候如果没有元素抛出异常  public E removeFirst() {      final Node<E> f = first;      if (f == null)          throw new NoSuchElementException();      return unlinkFirst(f);  }  // poll的时候如果没有元素返回null  public E pollFirst() {      final Node<E> f = first;      return (f == null) ? null : unlinkFirst(f);  }

主要还是看unlinkFirst这个方法的实现

private E unlinkFirst(Node<E> f) {      // assert f == first && f != null;      //获取头结点的元素值      final E element = f.item;      //获取头结点的后继结点      final Node<E> next = f.next;      //删除头节点中存放的元素item和后继结点，GC      f.item = null;      f.next = null; // help GC      //更新头节点引用（原头节点的后继结点）      first = next;      //链表中只有一个结点，那么尾节点也是null了      if (next == null)          last = null;      //将新的头节点的前驱结点设置为null      else          next.prev = null;      //更新size和modCount      size--;      modCount++;      //返回原头节点的值      return element;  }

（2）unlinkLast方法

下面是调用unlinkLast方法的两个public方法（Deque接口的方法实现），主要区别就是removeLast方法执行时候，first为null的时候会抛出异常，而pollLast返回null。

// remove的时候如果没有元素抛出异常  public E removeLast() {      final Node<E> l = last;      if (l == null)          throw new NoSuchElementException();      return unlinkLast(l);  }    // poll的时候如果没有元素返回null  public E pollLast() {      final Node<E> l = last;      return (l == null) ? null : unlinkLast(l);  }

下面是unlinkLast方法的实现

// 删除尾节点  private E unlinkLast(Node<E> l) {      // 尾节点的元素值      final E element = l.item;      // 尾节点的前置指针      final Node<E> prev = l.prev;      // 清空尾节点的内容，协助GC      l.item = null;      l.prev = null; // help GC      // 让前置节点成为新的尾节点      last = prev;      // 如果只有一个元素，删除了把first置为空      // 否则把前置节点的next置为空      if (prev == null)          first = null;      else          prev.next = null;      // 更新size和modCount      size--;      modCount++;      // 返回删除的元素      return element;  }

（4）unlink方法

// 删除中间节点  public E remove(int index) {      // 检查是否越界      checkElementIndex(index);      // 删除指定index位置的节点      return unlink(node(index));  }

// 删除指定节点x  E unlink(Node<E> x) {      // x的元素值      final E element = x.item;      // x的前置节点      final Node<E> next = x.next;      // x的后置节点      final Node<E> prev = x.prev;      // 如果前置节点为空      // 说明是首节点，让first指向x的后置节点      // 否则修改前置节点的next为x的后置节点      if (prev == null) {          first = next;      } else {          prev.next = next;          x.prev = null;      }      // 如果后置节点为空      // 说明是尾节点，让last指向x的前置节点      // 否则修改后置节点的prev为x的前置节点      if (next == null) {          last = prev;      } else {          next.prev = prev;          x.next = null;      }      // 清空x的元素值，协助GC      x.item = null;      // 元素个数减1      size--;      // 修改次数加1      modCount++;      // 返回删除的元素      return element;  }

查找

LinkedList底层基于链表结构，无法向 ArrayList 那样随机访问指定位置的元素。LinkedList 查找过程要稍麻烦一些，需要从链表头结点（或尾节点）向后查找，时间复杂度为 O(N)。相关源码如下：

public E get(int index) {      checkElementIndex(index); //还是先检验index的合法性，这里上面已经说过      //调用node方法遍历查询index处的结点，然后返回结点存放的值item，node方法上面已经说过      return node(index).item;  }

遍历

链表的遍历过程也很简单，和上面查找过程类似，我们从头节点往后遍历就行了。但对于 LinkedList 的遍历还是需要注意一些，不然可能会导致代码效率低下。通常情况下，我们会使用 foreach 遍历 LinkedList，而 foreach 最终转换成迭代器形式。所以分析 LinkedList 的遍历的核心就是它的迭代器实现，相关代码如下：

public ListIterator<E> listIterator(int index) {      checkPositionIndex(index);      return new ListItr(index);  }  private class ListItr implements ListIterator<E> {      private Node<E> lastReturned;      private Node<E> next;      private int nextIndex;      private int expectedModCount = modCount;      /** 构造方法将 next 引用指向指定位置的节点 */      ListItr(int index) {          // assert isPositionIndex(index);          next = (index == size) ? null : node(index);          nextIndex = index;      }        public boolean hasNext() {          return nextIndex < size;      }        public E next() {          checkForComodification();          if (!hasNext())              throw new NoSuchElementException();          lastReturned = next;          next = next.next;          nextIndex++;          return lastReturned.item;      }      //...other method  }

这里主要说下遍历 LinkedList 需要注意的一个点。LinkedList 不擅长随机位置访问，如果大家用随机访问的方式遍历 LinkedList，效率会很差。比如下面的代码：

List<Integet> list = new LinkedList<>();  list.add(1)  list.add(2)  ......  for (int i = 0; i < list.size(); i++) {      Integet item = list.get(i);      // do something  }

当链表中存储的元素很多时，上面的遍历方式对于效率肯定是非常低的。原因在于，通过上面的方式每获取一个元素(调用get(i)方法，上面说到了这个方法的实现)，LinkedList 都需要从头节点（或尾节点）进行遍历(node()方法的实现)，效率低，上面的遍历方式在大数据量情况下，效率很差。在日常使用中应该尽量避免这种用法。

总结

最后总结一下面试常问的ArrayList和LinkedList的区别，关于ArrayList请参考我上一篇ArrayList源码分析。

ArrayList是基于动态数组实现的，LinkedList是基于双向链表实现的；
对于随机访问来说，ArrayList(数组下标访问)要优于LinkedList(遍历链表访问)；
不考虑直接在尾部添加数据的话，ArrayList按照指定的index添加/删除数据是通过复制数组实现。LinkedList通过寻址改变节点指向实现；所以添加元素的话LinkedList（改变结点的next和prev指向即可）要优于ArrayList（移动数组元素）。
LinkedList在数据存储上不存在浪费空间的情况。ArrayList动态扩容会导致有一部分空间是浪费的。

LinkedList源码分析（jdk1.8）

LinkedList概述

LinkedList继承体系

LinkedList的成员属性

LinkedList的构造方法

LinkedList的主要方法

add方法

（1）linkLast方法

（2）linkFirst方法

（3）linkBefore方法

删除

（1）unlinkFirst方法

（2）unlinkLast方法

（4）unlink方法

查找

遍历

总结

VirMach 便宜 VPS

QNews

LinkedList源码分析（jdk1.8）

LinkedList概述

LinkedList继承体系

LinkedList的成员属性

LinkedList的构造方法

LinkedList的主要方法

add方法

（1）linkLast方法

（2）linkFirst方法

（3）linkBefore方法

删除

（1）unlinkFirst方法

（2）unlinkLast方法

（4）unlink方法

查找

遍历

总结

分享此文：

Related Posts

MyScript 开发文档

ES7 – 11新特性总结

JavaScript数据结构——集合的实现与应用

因数分解算法、周期查找算法（简化）

VirMach 便宜 VPS

QNews

熱門搜尋