面試突擊17:HashMap除了死循環還有什麼問題?

面試合集://gitee.com/mydb/interview

本篇的這個問題是一個開放性問題,HashMap 除了死循環之外,還有其他什麼問題?總體來說 HashMap 的所有「問題」,都是因為使用(HashMap)不當才導致的,這些問題大致可以分為兩類:

  1. 程式問題:比如 HashMap 在 JDK 1.7 中,並發插入時可能會發生死循環或數據覆蓋的問題。
  2. 業務問題:比如 HashMap 無序性造成查詢結果和預期結果不相符的問題。

接下來我們一個一個來看。

1.死循環問題

死循環問題發生在 JDK 1.7 版本中,形成的原因是 JDK 1.7 HashMap 使用的是頭插法,那麼在並發擴容時可能就會導致死循環的問題,具體產生的過程如下流程所示。
HashMap 正常情況下的擴容實現如下圖所示:
image.png
舊 HashMap 的節點會依次轉移到新 HashMap 中,舊 HashMap 轉移的順序是 A、B、C,而新 HashMap 使用的是頭插法,所以最終在新 HashMap 中的順序是 C、B、A,也就是上圖展示的那樣。有了這些前置知識之後,咱們來看死循環是如何誕生的?

1.1 死循環執行流程一

死循環是因為並發 HashMap 擴容導致的,並發擴容的第一步,執行緒 T1 和執行緒 T2 要對 HashMap 進行擴容操作,此時 T1 和 T2 指向的是鏈表的頭結點元素 A,而 T1 和 T2 的下一個節點,也就是 T1.next 和 T2.next 指向的是 B 節點,如下圖所示:
image.png

1.2 死循環執行流程二

死循環的第二步操作是,執行緒 T2 時間片用完進入休眠狀態,而執行緒 T1 開始執行擴容操作,一直到執行緒 T1 擴容完成後,執行緒 T2 才被喚醒,擴容之後的場景如下圖所示:
image.png
從上圖可知執行緒 T1 執行之後,因為是頭插法,所以 HashMap 的順序已經發生了改變,但執行緒 T2 對於發生的一切是不可知的,所以它的指向元素依然沒變,如上圖展示的那樣,T2 指向的是 A 元素,T2.next 指向的節點是 B 元素。

1.3 死循環執行流程三

當執行緒 T1 執行完,而執行緒 T2 恢復執行時,死循環就建立了,如下圖所示:
image.png
因為 T1 執行完擴容之後 B 節點的下一個節點是 A,而 T2 執行緒指向的首節點是 A,第二個節點是 B,這個順序剛好和 T1 擴完容完之後的節點順序是相反的。T1 執行完之後的順序是 B 到 A,而 T2 的順序是 A 到 B,這樣 A 節點和 B 節點就形成死循環了,這就是 HashMap 死循環導致的原因。

1.4 解決方案

使用執行緒安全的容器來替代 HashMap,比如 ConcurrentHashMap 或 Hashtable,因為 ConcurrentHashMap 的性能遠高於 Hashtable,因此推薦使用 ConcurrentHashMap 來替代 HashMap。

2.數據覆蓋問題

數據覆蓋問題發生在並發添加元素的場景下,它不止出現在 JDK 1.7 版本中,其他版本中也存在此問題,數據覆蓋產生的流程如下:

  1. 執行緒 T1 進行添加時,判斷某個位置可以插入元素,但還沒有真正的進行插入操作,自己時間片就用完了。
  2. 執行緒 T2 也執行添加操作,並且 T2 產生的哈希值和 T1 相同,也就是 T2 即將要存儲的位置和 T1 相同,因為此位置尚未插入值(T1 執行緒執行了一半),於是 T2 就把自己的值存入到當前位置了。
  3. T1 恢復執行之後,因為非空判斷已經執行完了,它感知不到此位置已經有值了,於是就把自己的值也插入到了此位置,那麼 T2 的值就被覆蓋了。

具體執行流程如下圖所示。

2.1 數據覆蓋執行流程一

執行緒 T1 準備將數據 k1:v1 插入到 Null 處,但還沒有真正的執行,自己的時間片就用完了,進入休眠狀態了,如下圖所示:
image.png

2.2 數據覆蓋執行流程二

執行緒 T2 準備將數據 k2:v2 插入到 Null 處,因為此處現在並未有值,如果此處有值的話,它會使用鏈式法將數據插入到下一個沒值的位置上,但判斷之後發現此處並未有值,那麼就直接進行數據插入了,如下圖所示:
image.png

2.3 數據覆蓋執行流程三

執行緒 T2 執行完成之後,執行緒 T1 恢復執行,因為執行緒 T1 之前已經判斷過此位置沒值了,所以會直接插入,此時執行緒 T2 插入的值就被覆蓋了,如下圖所示:
image.png

2.4 解決方案

解決方案和第一個解決方案相同,使用 ConcurrentHashMap 來替代 HashMap 就可以解決此問題了。

3.無序性問題

這裡的無序性問題指的是 HashMap 添加和查詢的順序不一致,導致程式執行的結果和程式設計師預期的結果不相符,如以下程式碼所示:

HashMap<String, String> map = new HashMap<>();
// 添加元素
for (int i = 1; i <= 5; i++) {
    map.put("2022-10-" + i, "Hello,Java:" + i);
}
// 查詢元素
map.forEach((k, v) -> {
    System.out.println(k + ":" + v);
});

我們添加的順序:
image.png
我們期望查詢的順序和添加的順序是一致的,然而以上程式碼輸出的結果卻是:
image.png
執行結果和我們預期結果不相符,這就是 HashMap 的無序性問題。我們期望輸出的結果是 Hello,Java 1、2、3、4、5,而得到的順序卻是 2、1、4、3、5。

解決方案

想要解決 HashMap 無序問題,我們只需要將 HashMap 替換成 LinkedHashMap 就可以了,如下程式碼所示:

LinkedHashMap<String, String> map = new LinkedHashMap<>();
// 添加元素
for (int i = 1; i <= 5; i++) {
    map.put("2022-10-" + i, "Hello,Java:" + i);
}
// 查詢元素
map.forEach((k, v) -> {
    System.out.println(k + ":" + v);
});

以上程式的執行結果如下圖所示:
image.png

總結

本文演示了 3 個 HashMap 的經典問題,其中死循環和數據覆蓋是發生在並發添加元素時,而無序問題是添加元素的順序和查詢的順序不一致的問題,這些問題本質來說都是對 HashMap 使用不當才會造成的問題,比如在多執行緒情況下就應該使用 ConcurrentHashMap,想要保證插入順序和查詢順序一致就應該使用 LinkedHashMap,但剛開始時我們對 HashMap 不熟悉,所以才會造成這些問題,不過了解了它們之後,就能更好的使用它和更好的應對面試了。

是非審之於己,毀譽聽之於人,得失安之於數。

公眾號:Java面試真題解析

Tags: