Java 集合系列08: List總結(LinkedList, ArrayList等使用場景和性能分析)

  • 2019 年 10 月 5 日
  • 筆記

概要 前面,我們學完了List的全部內容(ArrayList, LinkedList, Vector, Stack)。

第1部分 List概括

先回顧一下List的框架圖

這裡寫圖片描述 (01) List 是一個介面,它繼承於Collection的介面。它代表著有序的隊列。 (02) AbstractList 是一個抽象類,它繼承於AbstractCollection。AbstractList實現List介面中除size()、get(int location)之外的函數。 (03) AbstractSequentialList 是一個抽象類,它繼承於AbstractList。AbstractSequentialList 實現了「鏈表中,根據index索引值操作鏈表的全部函數」。

(04) ArrayList, LinkedList, Vector, Stack是List的4個實現類。   ArrayList 是一個數組隊列,相當於動態數組。它由數組實現,隨機訪問效率高,隨機插入、隨機刪除效率低。   LinkedList 是一個雙向鏈表。它也可以被當作堆棧、隊列或雙端隊列進行操作。LinkedList隨機訪問效率低,但隨機插入、隨機刪除效率低。   Vector 是矢量隊列,和ArrayList一樣,它也是一個動態數組,由數組實現。但是ArrayList是非執行緒安全的,而Vector是執行緒安全的。   Stack 是棧,它繼承於Vector。它的特性是:先進後出(FILO, First In Last Out)。

第2部分 List使用場景

學東西的最終目的是為了能夠理解、使用它。下面先概括的說明一下各個List的使用場景,後面再分析原因。

如果涉及到「棧」、「隊列」、「鏈表」等操作,應該考慮用List,具體的選擇哪個List,根據下面的標準來取捨。 (01) 對於需要快速插入,刪除元素,應該使用LinkedList。 (02) 對於需要快速隨機訪問元素,應該使用ArrayList。 (03) 對於「單執行緒環境」 或者 「多執行緒環境,但List僅僅只會被單個執行緒操作」,此時應該使用非同步的類(如ArrayList)。 對於「多執行緒環境,且List可能同時被多個執行緒操作」,此時,應該使用同步的類(如Vector)。

通過下面的測試程式,我們來驗證上面的(01)和(02)結論。參考程式碼如下:

import java.util.*;  import java.lang.Class;  /*   * @desc 對比ArrayList和LinkedList的插入、隨機讀取效率、刪除的效率   *   * @author skywang   */  public class ListCompareTest {      private static final int COUNT = ;      private static LinkedList linkedList = new LinkedList();      private static ArrayList arrayList = new ArrayList();      private static Vector vector = new Vector();      private static Stack stack = new Stack();      public static void main(String[] args) {          // 換行符          System.out.println();          // 插入          insertByPosition(stack) ;          insertByPosition(vector) ;          insertByPosition(linkedList) ;          insertByPosition(arrayList) ;          // 換行符          System.out.println();          // 隨機讀取          readByPosition(stack);          readByPosition(vector);          readByPosition(linkedList);          readByPosition(arrayList);          // 換行符          System.out.println();          // 刪除          deleteByPosition(stack);          deleteByPosition(vector);          deleteByPosition(linkedList);          deleteByPosition(arrayList);      }      // 獲取list的名稱      private static String getListName(List list) {          if (list instanceof LinkedList) {              return "LinkedList";          } else if (list instanceof ArrayList) {              return "ArrayList";          } else if (list instanceof Stack) {              return "Stack";          } else if (list instanceof Vector) {              return "Vector";          } else {              return "List";          }      }      // 向list的指定位置插入COUNT個元素,並統計時間      private static void insertByPosition(List list) {          long startTime = System.currentTimeMillis();          // 向list的位置0插入COUNT個數          for (int i=; i<COUNT; i++)              list.add(, i);          long endTime = System.currentTimeMillis();          long interval = endTime - startTime;          System.out.println(getListName(list) + " : insert "+COUNT+" elements into the 1st position use time:" + interval+" ms");      }      // 從list的指定位置刪除COUNT個元素,並統計時間      private static void deleteByPosition(List list) {          long startTime = System.currentTimeMillis();          // 刪除list第一個位置元素          for (int i=; i<COUNT; i++)              list.remove();          long endTime = System.currentTimeMillis();          long interval = endTime - startTime;          System.out.println(getListName(list) + " : delete "+COUNT+" elements from the 1st position use time:" + interval+" ms");      }      // 根據position,不斷從list中讀取元素,並統計時間      private static void readByPosition(List list) {          long startTime = System.currentTimeMillis();          // 讀取list元素          for (int i=; i<COUNT; i++)              list.get(i);          long endTime = System.currentTimeMillis();          long interval = endTime - startTime;          System.out.println(getListName(list) + " : read "+COUNT+" elements by position use time:" + interval+" ms");      }  }  

運行結果如下:

Stack : insert  elements into the st position use time: ms  Vector : insert  elements into the st position use time: ms  LinkedList : insert  elements into the st position use time: ms  ArrayList : insert  elements into the st position use time: ms  Stack : read  elements by position use time: ms  Vector : read  elements by position use time: ms  LinkedList : read  elements by position use time: ms  ArrayList : read  elements by position use time: ms  Stack : delete  elements from the st position use time: ms  Vector : delete  elements from the st position use time: ms  LinkedList : delete  elements from the st position use time: ms  ArrayList : delete  elements from the st position use time: ms  

從中,我們可以發現: 插入10萬個元素,LinkedList所花時間最短:29ms。 刪除10萬個元素,LinkedList所花時間最短:15ms。 遍歷10萬個元素,LinkedList所花時間最長:10809 ms;而ArrayList、Stack和Vector則相差不多,都只用了幾秒。

考慮到Vector是支援同步的,而Stack又是繼承於Vector的;因此,得出結論: (01) 對於需要快速插入,刪除元素,應該使用LinkedList。 (02) 對於需要快速隨機訪問元素,應該使用ArrayList。 (03) 對於「單執行緒環境」 或者 「多執行緒環境,但List僅僅只會被單個執行緒操作」,此時應該使用非同步的類。

第3部分 LinkedList和ArrayList性能差異分析

下面我們看看為什麼LinkedList中插入元素很快,而ArrayList中插入元素很慢!

LinkedList.java中向指定位置插入元素的程式碼如下:

// 在index前添加節點,且節點的值為element  public void add(int index, E element) {      addBefore(element, (index==size ? header : entry(index)));  }  // 獲取雙向鏈表中指定位置的節點  private Entry<E> entry(int index) {      if (index <  || index >= size)          throw new IndexOutOfBoundsException("Index: "+index+                                              ", Size: "+size);      Entry<E> e = header;      // 獲取index處的節點。      // 若index < 雙向鏈表長度的1/2,則從前向後查找;      // 否則,從後向前查找。      if (index < (size >> )) {          for (int i = ; i <= index; i++)              e = e.next;      } else {          for (int i = size; i > index; i--)              e = e.previous;      }      return e;  }  // 將節點(節點數據是e)添加到entry節點之前。  private Entry<E> addBefore(E e, Entry<E> entry) {      // 新建節點newEntry,將newEntry插入到節點e之前;並且設置newEntry的數據是e      Entry<E> newEntry = new Entry<E>(e, entry, entry.previous);      // 插入newEntry到鏈表中      newEntry.previous.next = newEntry;      newEntry.next.previous = newEntry;      size++;      modCount++;      return newEntry;  }  

從中,我們可以看出:通過add(int index, E element)向LinkedList插入元素時。先是在雙向鏈表中找到要插入節點的位置index;找到之後,再插入一個新節點。 雙向鏈表查找index位置的節點時,有一個加速動作:若index < 雙向鏈表長度的1/2,則從前向後查找; 否則,從後向前查找。

接著,我們看看ArrayList.java中向指定位置插入元素的程式碼。如下:

// 將e添加到ArrayList的指定位置  public void add(int index, E element) {      if (index > size || index < )          throw new IndexOutOfBoundsException(          "Index: "+index+", Size: "+size);      ensureCapacity(size+);  // Increments modCount!!      System.arraycopy(elementData, index, elementData, index + ,           size - index);      elementData[index] = element;      size++;  }  

ensureCapacity(size+1) 的作用是「確認ArrayList的容量,若容量不夠,則增加容量。」 真正耗時的操作是 System.arraycopy(elementData, index, elementData, index + 1, size - index);

Sun JDK包的java/lang/System.java中的arraycopy()聲明如下:

public static native void arraycopy(Object src, int srcPos, Object dest, int destPos, int length);  

arraycopy()是個JNI函數,它是在JVM中實現的。sunJDK中看不到源碼,不過可以在OpenJDK包中看到的源碼。 實際上,我們只需要了解: System.arraycopy(elementData, index, elementData, index + 1, size - index); 會移動index之後所有元素即可。這就意味著,ArrayList的add(int index, E element)函數,會引起index之後所有元素的改變!

通過上面的分析,我們就能理解為什麼LinkedList中插入元素很快,而ArrayList中插入元素很慢。 「刪除元素」與「插入元素」的原理類似,這裡就不再過多說明。

接下來,我們看看 「為什麼LinkedList中隨機訪問很慢,而ArrayList中隨機訪問很快」。

先看看LinkedList隨機訪問的程式碼

// 返回LinkedList指定位置的元素  public E get(int index) {      return entry(index).element;  }  // 獲取雙向鏈表中指定位置的節點  private Entry<E> entry(int index) {      if (index <  || index >= size)          throw new IndexOutOfBoundsException("Index: "+index+                                              ", Size: "+size);      Entry<E> e = header;      // 獲取index處的節點。      // 若index < 雙向鏈表長度的1/2,則從前先後查找;      // 否則,從後向前查找。      if (index < (size >> )) {          for (int i = ; i <= index; i++)              e = e.next;      } else {          for (int i = size; i > index; i--)              e = e.previous;      }      return e;  }  

從中,我們可以看出:通過get(int index)獲取LinkedList第index個元素時。先是在雙向鏈表中找到要index位置的元素;找到之後再返回。 雙向鏈表查找index位置的節點時,有一個加速動作:若index < 雙向鏈表長度的1/2,則從前向後查找; 否則,從後向前查找。

下面看看ArrayList隨機訪問的程式碼

// 獲取index位置的元素值  public E get(int index) {      RangeCheck(index);      return (E) elementData[index];  }  private void RangeCheck(int index) {      if (index >= size)          throw new IndexOutOfBoundsException(          "Index: "+index+", Size: "+size);  }  

從中,我們可以看出:通過get(int index)獲取ArrayList第index個元素時。直接返回數組中index位置的元素,而不需要像LinkedList一樣進行查找。

第4部分 Vector和ArrayList比較

相同之處

1 它們都是List

它們都繼承於AbstractList,並且實現List介面。 ArrayList和Vector的類定義如下:

// ArrayList的定義  public class ArrayList<E> extends AbstractList<E>          implements List<E>, RandomAccess, Cloneable, java.io.Serializable  // Vector的定義  public class Vector<E> extends AbstractList<E>      implements List<E>, RandomAccess, Cloneable, java.io.Serializable {}  

2 它們都實現了RandomAccess和Cloneable介面

實現RandomAccess介面,意味著它們都支援快速隨機訪問; 實現Cloneable介面,意味著它們能克隆自己。

3 它們都是通過數組實現的,本質上都是動態數組

ArrayList.java中定義數組elementData用於保存元素

// 保存ArrayList中數據的數組  private transient Object[] elementData;  

Vector.java中也定義了數組elementData用於保存元素

// 保存Vector中數據的數組  protected Object[] elementData;  

4 它們的默認數組容量是10

若創建ArrayList或Vector時,沒指定容量大小;則使用默認容量大小10。

ArrayList的默認構造函數如下:

// ArrayList構造函數。默認容量是10。  public ArrayList() {      this();  }  

Vector的默認構造函數如下:

// Vector構造函數。默認容量是10。  public Vector() {      this();  }  

5 它們都支援Iterator和listIterator遍歷

它們都繼承於AbstractList,而AbstractList中分別實現了 「iterator()介面返回Iterator迭代器」 和 「listIterator()返回ListIterator迭代器」。

不同之處

1 執行緒安全性不一樣

ArrayList是非執行緒安全; 而Vector是執行緒安全的,它的函數都是synchronized的,即都是支援同步的。 ArrayList適用於單執行緒,Vector適用於多執行緒。

2 對序列化支援不同

ArrayList支援序列化,而Vector不支援;即ArrayList有實現java.io.Serializable介面,而Vector沒有實現該介面。

3 構造函數個數不同 ArrayList有3個構造函數,而Vector有4個構造函數。Vector除了包括和ArrayList類似的3個構造函數之外,另外的一個構造函數可以指定容量增加係數。

ArrayList的構造函數如下:

// 默認構造函數  ArrayList()  // capacity是ArrayList的默認容量大小。當由於增加數據導致容量不足時,容量會添加上一次容量大小的一半。  ArrayList(int capacity)  // 創建一個包含collection的ArrayList  ArrayList(Collection<? extends E> collection)  

Vector的構造函數如下:

// 默認構造函數  Vector()  // capacity是Vector的默認容量大小。當由於增加數據導致容量增加時,每次容量會增加一倍。  Vector(int capacity)  // 創建一個包含collection的Vector  Vector(Collection<? extends E> collection)  // capacity是Vector的默認容量大小,capacityIncrement是每次Vector容量增加時的增量值。  Vector(int capacity, int capacityIncrement)  

4 容量增加方式不同

逐個添加元素時,若ArrayList容量不足時,「新的容量」=「(原始容量x3)/2 + 1」。 而Vector的容量增長與「增長係數有關」,若指定了「增長係數」,且「增長係數有效(即,大於0)」;那麼,每次容量不足時,「新的容量」=「原始容量+增長係數」。若增長係數無效(即,小於/等於0),則「新的容量」=「原始容量 x 2」。

ArrayList中容量增長的主要函數如下:

public void ensureCapacity(int minCapacity) {      // 將「修改統計數」+1      modCount++;      int oldCapacity = elementData.length;      // 若當前容量不足以容納當前的元素個數,設置 新的容量=「(原始容量x3)/2 + 1」      if (minCapacity > oldCapacity) {          Object oldData[] = elementData;          int newCapacity = (oldCapacity * )/ + ;          if (newCapacity < minCapacity)              newCapacity = minCapacity;          elementData = Arrays.copyOf(elementData, newCapacity);      }  }  

Vector中容量增長的主要函數如下:

private void ensureCapacityHelper(int minCapacity) {      int oldCapacity = elementData.length;      // 當Vector的容量不足以容納當前的全部元素,增加容量大小。      // 若 容量增量係數>0(即capacityIncrement>0),則將容量增大當capacityIncrement      // 否則,將容量增大一倍。      if (minCapacity > oldCapacity) {          Object[] oldData = elementData;          int newCapacity = (capacityIncrement > ) ?              (oldCapacity + capacityIncrement) : (oldCapacity * );          if (newCapacity < minCapacity) {              newCapacity = minCapacity;          }          elementData = Arrays.copyOf(elementData, newCapacity);      }  }  

5 對Enumeration的支援不同。Vector支援通過Enumeration去遍歷,而List不支援

Vector中實現Enumeration的程式碼如下:

public Enumeration<E> elements() {      // 通過匿名類實現Enumeration      return new Enumeration<E>() {          int count = ;          // 是否存在下一個元素          public boolean hasMoreElements() {              return count < elementCount;          }          // 獲取下一個元素          public E nextElement() {              synchronized (Vector.this) {                  if (count < elementCount) {                      return (E)elementData[count++];                  }              }              throw new NoSuchElementException("Vector Enumeration");          }      };  }  

出處:http://www.cnblogs.com/skywang12345/p/3308900.html