Java之ArrayList解剖學

2019 年 10 月 8 日
筆記

「一起來了解集合中ArrayList的源碼實現。」 —— 23號老闆

引入

先送一張圖。好好珍藏~ （來自網路）

回歸基礎，回歸原理，你會有更深的領悟。今天來聊一聊在Java當中常用的一個集合類：ArrayList。

在大學學習數據結構的時候，我們知道常見的一種數據結構，就是集合。而在Java中的集合，是用於存儲對象的工具類容器，它實現了常用的數據結構，提供了一系列公開的方法用於增加、刪除、修改、查找和遍曆數據，降低了日常開發的成本，提高了開發效率。

從上面的框架圖中可以看出，Java的集合主要分為兩類。

1、按照單個元素存儲的Collection，在其繼承樹中，Set、List都實現了Collection介面；

2、按照Key – Value存儲的Map，也是當下最流行的一種數據結構，業內出現了以此為基礎的各式Nosql數據存儲層產品。

了解ArrayList

List集合是線性數據結構的主要實現，集合元素通常存在一個明確的元素關係，Pre、Next。因此，List集合的遍歷結果是穩定的。ArrayList就是List集合中的一個實現類，在開發中也是最常使用的一個集合類。這裡以最常使用的JDK8為例，如果有版本上的不一致，請參看對比。

public class ArrayList<E> extends AbstractList<E>          implements List<E>, RandomAccess, Cloneable, java.io.Serializable

也許你會在面試當中，常說到這樣的話，和LinkedList作一次對比。ArrayList在使用上查詢效率較高，新增元素的效率較低，balabala……然後就沒什麼可說的。再一問，這是為什麼？不知道。

簡單來說，ArrayList在記憶體上的存儲，是利用了一個連續的存儲空間，是一個順序容器。即元素存放的數據與放進去的順序相同，允許放入null元素，底層通過數組實現。

ArrayList的幾個實現。

1、實現RandomAccess類

其原理的本質就在於indexedBinarySerach(list,key)或iteratorBinarySerach(list,key)方法。你會發現實現RandomAccess介面的List集合採用一般的for循環遍歷，而未實現這介面則採用迭代器。通過大量的測試可以知道，使用迭代器遍歷集合的速度會比for循環遍歷差。

2、實現Cloneable類

Cloneable是一個標記介面，只有實現這個介面後，然後在類中重寫Object中的clone方法，然後通過類調用clone方法才能克隆成功，如果不實現這個介面，則會拋出CloneNotSupportedException(克隆不被支援)異常。

3、實現Serializable類

實現Serializable介面的作用是就是可以把對象存到位元組流，然後可以恢復（反序列化），能夠進行關於對象的網路傳輸方式。

深入理解

/**   * 默認初始容量   */  private static final int DEFAULT_CAPACITY = 10;    private static final Object[] EMPTY_ELEMENTDATA = {};    /**   * 空表的表示方法   */  private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};    /**   * 底層的數組為elementData   */  transient Object[] elementData; // non-private to simplify nested class access    /**   * ArrayList的大小   */  private int size;    /**   * 帶有初始容量的構造器   */  public ArrayList(int initialCapacity) {      if (initialCapacity > 0) {//大於0時創建一個initialCapacity大小的數組          this.elementData = new Object[initialCapacity];      } else if (initialCapacity == 0) {          this.elementData = EMPTY_ELEMENTDATA;      } else {          throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);      }  }    /**   * 無參構造，默認空表數組 {}   */  public ArrayList() {      this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;  }    /**   * 當size大於0，採用Arrays.copyOf的複製方法賦值數組   */  public ArrayList(Collection<? extends E> c) {      elementData = c.toArray();      if ((size = elementData.length) != 0) {          // c.toArray might (incorrectly) not return Object[] (see 6260652)          if (elementData.getClass() != Object[].class)              elementData = Arrays.copyOf(elementData, size, Object[].class);      } else {          // replace with empty array.          this.elementData = EMPTY_ELEMENTDATA;      }  }

add、remove等

ArrayList的底層是基於動態數組實現的原因，動態數組的意思就是指底層的數組大小並不是固定的，而是根據添加的元素大小進行一個判斷，不夠的話就動態擴容，擴容的程式碼就在ensureCapacity里。

/**   * 確保在擴容時的容量   */  public void ensureCapacity(int minCapacity) {      int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)          // any size if not default element table          ? 0          // larger than default for default empty table. It's already          // supposed to be at default size.          : DEFAULT_CAPACITY;        if (minCapacity > minExpand) {          ensureExplicitCapacity(minCapacity);      }  }    /**   * 數組的最大長度值，超過則OutOfMemoryError   * OutOfMemoryError: Requested array size exceeds VM limit   */  private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;    /**   * 擴容，原數組長度的2倍+1，採用的Arrays.copyOf複製方法   */  private void grow(int minCapacity) {      // overflow-conscious code      int oldCapacity = elementData.length;      int newCapacity = oldCapacity + (oldCapacity >> 1);      if (newCapacity - minCapacity < 0)          newCapacity = minCapacity;      if (newCapacity - MAX_ARRAY_SIZE > 0)          newCapacity = hugeCapacity(minCapacity);      elementData = Arrays.copyOf(elementData, newCapacity);  }      public int size() { return size;}    public boolean isEmpty() { return size == 0;}    public boolean contains(Object o) { return indexOf(o) >= 0;}

空間的問題解決後，插入過程就顯得非常簡單。

/**   * 獲取index位置的元素   */  public E get(int index) {      rangeCheck(index);        return elementData(index);  }    /**   * 替換index位置上的元素   */  public E set(int index, E element) {      rangeCheck(index);      E oldValue = elementData(index);      elementData[index] = element;      return oldValue;  }    /**   * 新增元素   */  public boolean add(E e) {      ensureCapacityInternal(size + 1);  // Increments modCount!!      elementData[size++] = e;      return true;  }    /**   * 刪除元素   */  public E remove(int index) {      rangeCheck(index);      modCount++;      E oldValue = elementData(index);        int numMoved = size - index - 1;      if (numMoved > 0)          System.arraycopy(elementData, index+1, elementData, index,                           numMoved);      elementData[--size] = null; // clear to let GC do its work      return oldValue;  }    public boolean remove(Object o) {      if (o == null) {          for (int index = 0; index < size; index++)              if (elementData[index] == null) {                  fastRemove(index);                  return true;              }      } else {          for (int index = 0; index < size; index++)              if (o.equals(elementData[index])) {                  fastRemove(index);                  return true;              }      }      return false;  }    private void fastRemove(int index) {      modCount++;      int numMoved = size - index - 1;      if (numMoved > 0)          System.arraycopy(elementData, index+1, elementData, index,                           numMoved);      elementData[--size] = null; // clear to let GC do its work  }

刪除是每次進行數組複製，然後讓舊的elementData置為null進行垃圾回收。

以remove()方法為例。

可以看到這個 remove() 方法被重載了，一種是根據下標刪除，一種是根據元素刪除，這也都很好理解。

根據下標刪除的 remove() 方法，大致的步驟如下：

1、檢查有沒有下標越界，就是檢查一下當前的下標有沒有大於等於數組的長度

2、列表被修改（add和remove操作）的次數加1

3、保存要刪除的值

4、計算移動的元素數量

5、刪除位置後面的元素向左移動，這裡是用數組拷貝實現的

6、將最後一個位置引用設為 null，使垃圾回收器回收這塊記憶體

7、返回刪除元素的值

根據元素刪除的 remove() 方法，大致的步驟如下：

1、元素值分為null和非null值

2、循環遍歷判等

3、調用 fastRemove(i) 函數

a、修改次數加1

b、計算移動的元素數量

c、數組拷貝實現元素向左移動

d、將最後一個位置引用設為 null

e、返回 fase

4、返回 true

小結

現在，你對ArrayList是不是有了一個更深入的理解。深入源碼，有時候能夠讓你更加理解程式碼的邏輯和數據結構。

文章部分內容來自網路部落格，綜合整理，在此鳴謝。

Java之ArrayList解剖學

VirMach 便宜 VPS

QNews

Java之ArrayList解剖學

分享此文：

Related Posts

2019-11-19 一段可以把MacOS搞重啟的java程式碼

第一節、了解Python《Python學習》

JAVA之常用開發工具

Go學習之Mac、Linux、Windows之間進行交叉編譯（五）

VirMach 便宜 VPS

QNews

熱門搜尋