【純乾貨】Java 並發進階常見面試題總結

  • 2019 年 12 月 2 日
  • 筆記

Java 並發進階常見面試題總結

1. synchronized 關鍵字

1.1. 說一說自己對於 synchronized 關鍵字的了解

synchronized關鍵字解決的是多個線程之間訪問資源的同步性,synchronized關鍵字可以保證被它修飾的方法或者代碼塊在任意時刻只能有一個線程執行。

另外,在 Java 早期版本中,synchronized屬於重量級鎖,效率低下,因為監視器鎖(monitor)是依賴於底層的操作系統的 Mutex Lock 來實現的,Java 的線程是映射到操作系統的原生線程之上的。如果要掛起或者喚醒一個線程,都需要操作系統幫忙完成,而操作系統實現線程之間的切換時需要從用戶態轉換到內核態,這個狀態之間的轉換需要相對比較長的時間,時間成本相對較高,這也是為什麼早期的 synchronized 效率低的原因。慶幸的是在 Java 6 之後 Java 官方對從 JVM 層面對synchronized 較大優化,所以現在的 synchronized 鎖效率也優化得很不錯了。JDK1.6對鎖的實現引入了大量的優化,如自旋鎖、適應性自旋鎖、鎖消除、鎖粗化、偏向鎖、輕量級鎖等技術來減少鎖操作的開銷。

1.2. 說說自己是怎麼使用 synchronized 關鍵字,在項目中用到了嗎

synchronized關鍵字最主要的三種使用方式:

  • 修飾實例方法: 作用於當前對象實例加鎖,進入同步代碼前要獲得當前對象實例的鎖
  • 修飾靜態方法: 也就是給當前類加鎖,會作用於類的所有對象實例,因為靜態成員不屬於任何一個實例對象,是類成員( static 表明這是該類的一個靜態資源,不管new了多少個對象,只有一份)。所以如果一個線程A調用一個實例對象的非靜態 synchronized 方法,而線程B需要調用這個實例對象所屬類的靜態 synchronized 方法,是允許的,不會發生互斥現象,因為訪問靜態 synchronized 方法佔用的鎖是當前類的鎖,而訪問非靜態 synchronized 方法佔用的鎖是當前實例對象鎖
  • 修飾代碼塊: 指定加鎖對象,對給定對象加鎖,進入同步代碼庫前要獲得給定對象的鎖。

總結: synchronized 關鍵字加到 static 靜態方法和 synchronized(class)代碼塊上都是是給 Class 類上鎖。synchronized 關鍵字加到實例方法上是給對象實例上鎖。盡量不要使用 synchronized(String a) 因為JVM中,字符串常量池具有緩存功能!

下面我以一個常見的面試題為例講解一下 synchronized 關鍵字的具體使用。

面試中面試官經常會說:「單例模式了解嗎?來給我手寫一下!給我解釋一下雙重檢驗鎖方式實現單例模式的原理唄!」

雙重校驗鎖實現對象單例(線程安全)

public class Singleton {        private volatile static Singleton uniqueInstance;        private Singleton() {      }        public static Singleton getUniqueInstance() {         //先判斷對象是否已經實例過,沒有實例化過才進入加鎖代碼          if (uniqueInstance == null) {              //類對象加鎖              synchronized (Singleton.class) {                  if (uniqueInstance == null) {                      uniqueInstance = new Singleton();                  }              }          }          return uniqueInstance;      }  }  

另外,需要注意 uniqueInstance 採用 volatile 關鍵字修飾也是很有必要。

uniqueInstance 採用 volatile 關鍵字修飾也是很有必要的, uniqueInstance = new Singleton(); 這段代碼其實是分為三步執行:

  1. 為 uniqueInstance 分配內存空間
  2. 初始化 uniqueInstance
  3. 將 uniqueInstance 指向分配的內存地址

但是由於 JVM 具有指令重排的特性,執行順序有可能變成 1->3->2。指令重排在單線程環境下不會出現問題,但是在多線程環境下會導致一個線程獲得還沒有初始化的實例。例如,線程 T1 執行了 1 和 3,此時 T2 調用 getUniqueInstance() 後發現 uniqueInstance 不為空,因此返回 uniqueInstance,但此時 uniqueInstance 還未被初始化。

使用 volatile 可以禁止 JVM 的指令重排,保證在多線程環境下也能正常運行。

1.3. 講一下 synchronized 關鍵字的底層原理

synchronized 關鍵字底層原理屬於 JVM 層面。

① synchronized 同步語句塊的情況

public class SynchronizedDemo {  	public void method() {  		synchronized (this) {  			System.out.println("synchronized 代碼塊");  		}  	}  }    

通過 JDK 自帶的 javap 命令查看 SynchronizedDemo 類的相關位元組碼信息:首先切換到類的對應目錄執行 javac SynchronizedDemo.java 命令生成編譯後的 .class 文件,然後執行javap -c -s -v -l SynchronizedDemo.class

synchronized關鍵字原理

從上面我們可以看出:

synchronized 同步語句塊的實現使用的是 monitorenter 和 monitorexit 指令,其中 monitorenter 指令指向同步代碼塊的開始位置,monitorexit 指令則指明同步代碼塊的結束位置。 當執行 monitorenter 指令時,線程試圖獲取鎖也就是獲取 monitor(monitor對象存在於每個Java對象的對象頭中,synchronized 鎖便是通過這種方式獲取鎖的,也是為什麼Java中任意對象可以作為鎖的原因) 的持有權。當計數器為0則可以成功獲取,獲取後將鎖計數器設為1也就是加1。相應的在執行 monitorexit 指令後,將鎖計數器設為0,表明鎖被釋放。如果獲取對象鎖失敗,那當前線程就要阻塞等待,直到鎖被另外一個線程釋放為止。

② synchronized 修飾方法的的情況

public class SynchronizedDemo2 {  	public synchronized void method() {  		System.out.println("synchronized 方法");  	}  }    

synchronized關鍵字原理

synchronized 修飾的方法並沒有 monitorenter 指令和 monitorexit 指令,取得代之的確實是 ACC_SYNCHRONIZED 標識,該標識指明了該方法是一個同步方法,JVM 通過該 ACC_SYNCHRONIZED 訪問標誌來辨別一個方法是否聲明為同步方法,從而執行相應的同步調用。

1.4. 說說 JDK1.6 之後的synchronized 關鍵字底層做了哪些優化,可以詳細介紹一下這些優化嗎

JDK1.6 對鎖的實現引入了大量的優化,如偏向鎖、輕量級鎖、自旋鎖、適應性自旋鎖、鎖消除、鎖粗化等技術來減少鎖操作的開銷。

鎖主要存在四種狀態,依次是:無鎖狀態、偏向鎖狀態、輕量級鎖狀態、重量級鎖狀態,他們會隨着競爭的激烈而逐漸升級。注意鎖可以升級不可降級,這種策略是為了提高獲得鎖和釋放鎖的效率。

關於這幾種優化的詳細信息可以查看筆主的這篇文章:https://gitee.com/SnailClimb/JavaGuide/blob/master/docs/java/Multithread/synchronized.md

1.5. 談談 synchronized和ReentrantLock 的區別

① 兩者都是可重入鎖

兩者都是可重入鎖。「可重入鎖」概念是:自己可以再次獲取自己的內部鎖。比如一個線程獲得了某個對象的鎖,此時這個對象鎖還沒有釋放,當其再次想要獲取這個對象的鎖的時候還是可以獲取的,如果不可鎖重入的話,就會造成死鎖。同一個線程每次獲取鎖,鎖的計數器都自增1,所以要等到鎖的計數器下降為0時才能釋放鎖。

② synchronized 依賴於 JVM 而 ReentrantLock 依賴於 API

synchronized 是依賴於 JVM 實現的,前面我們也講到了 虛擬機團隊在 JDK1.6 為 synchronized 關鍵字進行了很多優化,但是這些優化都是在虛擬機層面實現的,並沒有直接暴露給我們。ReentrantLock 是 JDK 層面實現的(也就是 API 層面,需要 lock() 和 unlock() 方法配合 try/finally 語句塊來完成),所以我們可以通過查看它的源代碼,來看它是如何實現的。

③ ReentrantLock 比 synchronized 增加了一些高級功能

相比synchronized,ReentrantLock增加了一些高級功能。主要來說主要有三點:①等待可中斷;②可實現公平鎖;③可實現選擇性通知(鎖可以綁定多個條件)

  • ReentrantLock提供了一種能夠中斷等待鎖的線程的機制,通過lock.lockInterruptibly()來實現這個機制。也就是說正在等待的線程可以選擇放棄等待,改為處理其他事情。
  • ReentrantLock可以指定是公平鎖還是非公平鎖。而synchronized只能是非公平鎖。所謂的公平鎖就是先等待的線程先獲得鎖。 ReentrantLock默認情況是非公平的,可以通過 ReentrantLock類的ReentrantLock(boolean fair)構造方法來制定是否是公平的。
  • synchronized關鍵字與wait()和notify()/notifyAll()方法相結合可以實現等待/通知機制,ReentrantLock類當然也可以實現,但是需要藉助於Condition接口與newCondition() 方法。Condition是JDK1.5之後才有的,它具有很好的靈活性,比如可以實現多路通知功能也就是在一個Lock對象中可以創建多個Condition實例(即對象監視器),線程對象可以註冊在指定的Condition中,從而可以有選擇性的進行線程通知,在調度線程上更加靈活。在使用notify()/notifyAll()方法進行通知時,被通知的線程是由 JVM 選擇的,用ReentrantLock類結合Condition實例可以實現「選擇性通知」 ,這個功能非常重要,而且是Condition接口默認提供的。而synchronized關鍵字就相當於整個Lock對象中只有一個Condition實例,所有的線程都註冊在它一個身上。如果執行notifyAll()方法的話就會通知所有處於等待狀態的線程這樣會造成很大的效率問題,而Condition實例的signalAll()方法 只會喚醒註冊在該Condition實例中的所有等待線程。

如果你想使用上述功能,那麼選擇ReentrantLock是一個不錯的選擇。

④ 性能已不是選擇標準

2. volatile關鍵字

2.1. 講一下Java內存模型

在 JDK1.2 之前,Java的內存模型實現總是從主存(即共享內存)讀取變量,是不需要進行特別的注意的。而在當前的 Java 內存模型下,線程可以把變量保存本地內存(比如機器的寄存器)中,而不是直接在主存中進行讀寫。這就可能造成一個線程在主存中修改了一個變量的值,而另外一個線程還繼續使用它在寄存器中的變量值的拷貝,造成數據的不一致

數據不一致

要解決這個問題,就需要把變量聲明為volatile,這就指示 JVM,這個變量是不穩定的,每次使用它都到主存中進行讀取。

說白了, volatile 關鍵字的主要作用就是保證變量的可見性然後還有一個作用是防止指令重排序。

volatile關鍵字的可見性

2.2. 說說 synchronized 關鍵字和 volatile 關鍵字的區別

synchronized關鍵字和volatile關鍵字比較

  • volatile關鍵字是線程同步的輕量級實現,所以volatile性能肯定比synchronized關鍵字要好。但是volatile關鍵字只能用於變量而synchronized關鍵字可以修飾方法以及代碼塊。synchronized關鍵字在JavaSE1.6之後進行了主要包括為了減少獲得鎖和釋放鎖帶來的性能消耗而引入的偏向鎖和輕量級鎖以及其它各種優化之後執行效率有了顯著提升,實際開發中使用 synchronized 關鍵字的場景還是更多一些
  • 多線程訪問volatile關鍵字不會發生阻塞,而synchronized關鍵字可能會發生阻塞
  • volatile關鍵字能保證數據的可見性,但不能保證數據的原子性。synchronized關鍵字兩者都能保證。
  • volatile關鍵字主要用於解決變量在多個線程之間的可見性,而 synchronized關鍵字解決的是多個線程之間訪問資源的同步性。

3. ThreadLocal

3.1. ThreadLocal簡介

通常情況下,我們創建的變量是可以被任何一個線程訪問並修改的。如果想實現每一個線程都有自己的專屬本地變量該如何解決呢? JDK中提供的ThreadLocal類正是為了解決這樣的問題。ThreadLocal類主要解決的就是讓每個線程綁定自己的值,可以將ThreadLocal類形象的比喻成存放數據的盒子,盒子中可以存儲每個線程的私有數據。

如果你創建了一個ThreadLocal變量,那麼訪問這個變量的每個線程都會有這個變量的本地副本,這也是ThreadLocal變量名的由來。他們可以使用 get()set() 方法來獲取默認值或將其值更改為當前線程所存的副本的值,從而避免了線程安全問題。

再舉個簡單的例子:

比如有兩個人去寶屋收集寶物,這兩個共用一個袋子的話肯定會產生爭執,但是給他們兩個人每個人分配一個袋子的話就不會出現這樣的問題。如果把這兩個人比作線程的話,那麼ThreadLocal就是用來避免這兩個線程競爭的。

3.2. ThreadLocal示例

相信看了上面的解釋,大家已經搞懂 ThreadLocal 類是個什麼東西了。

import java.text.SimpleDateFormat;  import java.util.Random;    public class ThreadLocalExample implements Runnable{         // SimpleDateFormat 不是線程安全的,所以每個線程都要有自己獨立的副本      private static final ThreadLocal<SimpleDateFormat> formatter = ThreadLocal.withInitial(() -> new SimpleDateFormat("yyyyMMdd HHmm"));        public static void main(String[] args) throws InterruptedException {          ThreadLocalExample obj = new ThreadLocalExample();          for(int i=0 ; i<10; i++){              Thread t = new Thread(obj, ""+i);              Thread.sleep(new Random().nextInt(1000));              t.start();          }      }        @Override      public void run() {          System.out.println("Thread Name= "+Thread.currentThread().getName()+" default Formatter = "+formatter.get().toPattern());          try {              Thread.sleep(new Random().nextInt(1000));          } catch (InterruptedException e) {              e.printStackTrace();          }          //formatter pattern is changed here by thread, but it won't reflect to other threads          formatter.set(new SimpleDateFormat());            System.out.println("Thread Name= "+Thread.currentThread().getName()+" formatter = "+formatter.get().toPattern());      }    }    

Output:

Thread Name= 0 default Formatter = yyyyMMdd HHmm  Thread Name= 0 formatter = yy-M-d ah:mm  Thread Name= 1 default Formatter = yyyyMMdd HHmm  Thread Name= 2 default Formatter = yyyyMMdd HHmm  Thread Name= 1 formatter = yy-M-d ah:mm  Thread Name= 3 default Formatter = yyyyMMdd HHmm  Thread Name= 2 formatter = yy-M-d ah:mm  Thread Name= 4 default Formatter = yyyyMMdd HHmm  Thread Name= 3 formatter = yy-M-d ah:mm  Thread Name= 4 formatter = yy-M-d ah:mm  Thread Name= 5 default Formatter = yyyyMMdd HHmm  Thread Name= 5 formatter = yy-M-d ah:mm  Thread Name= 6 default Formatter = yyyyMMdd HHmm  Thread Name= 6 formatter = yy-M-d ah:mm  Thread Name= 7 default Formatter = yyyyMMdd HHmm  Thread Name= 7 formatter = yy-M-d ah:mm  Thread Name= 8 default Formatter = yyyyMMdd HHmm  Thread Name= 9 default Formatter = yyyyMMdd HHmm  Thread Name= 8 formatter = yy-M-d ah:mm  Thread Name= 9 formatter = yy-M-d ah:mm  

從輸出中可以看出,Thread-0已經改變了formatter的值,但仍然是thread-2默認格式化程序與初始化值相同,其他線程也一樣。

上面有一段代碼用到了創建 ThreadLocal 變量的那段代碼用到了 Java8 的知識,它等於下面這段代碼,如果你寫了下面這段代碼的話,IDEA會提示你轉換為Java8的格式(IDEA真的不錯!)。因為ThreadLocal類在Java 8中擴展,使用一個新的方法withInitial(),將Supplier功能接口作為參數。

 private static final ThreadLocal<SimpleDateFormat> formatter = new ThreadLocal<SimpleDateFormat>(){          @Override          protected SimpleDateFormat initialValue()          {              return new SimpleDateFormat("yyyyMMdd HHmm");          }      };  

3.3. ThreadLocal原理

Thread類源代碼入手。

public class Thread implements Runnable {   ......  //與此線程有關的ThreadLocal值。由ThreadLocal類維護  ThreadLocal.ThreadLocalMap threadLocals = null;    //與此線程有關的InheritableThreadLocal值。由InheritableThreadLocal類維護  ThreadLocal.ThreadLocalMap inheritableThreadLocals = null;   ......  }  

從上面Thread類 源代碼可以看出Thread 類中有一個 threadLocals 和 一個 inheritableThreadLocals 變量,它們都是 ThreadLocalMap 類型的變量,我們可以把 ThreadLocalMap 理解為ThreadLocal 類實現的定製化的 HashMap。默認情況下這兩個變量都是null,只有當前線程調用 ThreadLocal 類的 setget方法時才創建它們,實際上調用這兩個方法的時候,我們調用的是ThreadLocalMap類對應的 get()set()方法。

ThreadLocal類的set()方法

    public void set(T value) {          Thread t = Thread.currentThread();          ThreadLocalMap map = getMap(t);          if (map != null)              map.set(this, value);          else              createMap(t, value);      }      ThreadLocalMap getMap(Thread t) {          return t.threadLocals;      }  

通過上面這些內容,我們足以通過猜測得出結論:最終的變量是放在了當前線程的 ThreadLocalMap 中,並不是存在 ThreadLocal 上,ThreadLocal 可以理解為只是ThreadLocalMap的封裝,傳遞了變量值。 ThrealLocal 類中可以通過Thread.currentThread()獲取到當前線程對象後,直接通過getMap(Thread t)可以訪問到該線程的ThreadLocalMap對象。

每個Thread中都具備一個ThreadLocalMap,而ThreadLocalMap可以存儲以ThreadLocal為key的鍵值對。 比如我們在同一個線程中聲明了兩個 ThreadLocal 對象的話,會使用 Thread內部都是使用僅有那個ThreadLocalMap 存放數據的,ThreadLocalMap的 key 就是 ThreadLocal對象,value 就是 ThreadLocal 對象調用set方法設置的值。ThreadLocal 是 map結構是為了讓每個線程可以關聯多個 ThreadLocal變量。這也就解釋了 ThreadLocal 聲明的變量為什麼在每一個線程都有自己的專屬本地變量。

ThreadLocalMapThreadLocal的靜態內部類。

ThreadLocal內部類

3.4. ThreadLocal 內存泄露問題

ThreadLocalMap 中使用的 key 為 ThreadLocal 的弱引用,而 value 是強引用。所以,如果 ThreadLocal 沒有被外部強引用的情況下,在垃圾回收的時候,key 會被清理掉,而 value 不會被清理掉。這樣一來,ThreadLocalMap 中就會出現key為null的Entry。假如我們不做任何措施的話,value 永遠無法被GC 回收,這個時候就可能會產生內存泄露。ThreadLocalMap實現中已經考慮了這種情況,在調用 set()get()remove() 方法的時候,會清理掉 key 為 null 的記錄。使用完 ThreadLocal方法後 最好手動調用remove()方法

      static class Entry extends WeakReference<ThreadLocal<?>> {              /** The value associated with this ThreadLocal. */              Object value;                Entry(ThreadLocal<?> k, Object v) {                  super(k);                  value = v;              }          }  

弱引用介紹:

如果一個對象只具有弱引用,那就類似於可有可無的生活用品。弱引用與軟引用的區別在於:只具有弱引用的對象擁有更短暫的生命周期。在垃圾回收器線程掃描它 所管轄的內存區域的過程中,一旦發現了只具有弱引用的對象,不管當前內存空間足夠與否,都會回收它的內存。不過,由於垃圾回收器是一個優先級很低的線程, 因此不一定會很快發現那些只具有弱引用的對象。 弱引用可以和一個引用隊列(ReferenceQueue)聯合使用,如果弱引用所引用的對象被垃圾回收,Java虛擬機就會把這個弱引用加入到與之關聯的引用隊列中。

4. 線程池

4.1. 為什麼要用線程池?

池化技術相比大家已經屢見不鮮了,線程池、數據庫連接池、Http 連接池等等都是對這個思想的應用。池化技術的思想主要是為了減少每次獲取資源的消耗,提高對資源的利用率。

線程池提供了一種限制和管理資源(包括執行一個任務)。每個線程池還維護一些基本統計信息,例如已完成任務的數量。

這裡借用《Java 並發編程的藝術》提到的來說一下使用線程池的好處

  • 降低資源消耗。通過重複利用已創建的線程降低線程創建和銷毀造成的消耗。
  • 提高響應速度。當任務到達時,任務可以不需要的等到線程創建就能立即執行。
  • 提高線程的可管理性。線程是稀缺資源,如果無限制的創建,不僅會消耗系統資源,還會降低系統的穩定性,使用線程池可以進行統一的分配,調優和監控。

4.2. 實現Runnable接口和Callable接口的區別

Runnable自Java 1.0以來一直存在,但Callable僅在Java 1.5中引入,目的就是為了來處理Runnable不支持的用例。Runnable 接口不會返回結果或拋出檢查異常,但是**Callable 接口**可以。所以,如果任務不需要返回結果或拋出異常推薦使用 Runnable 接口,這樣代碼看起來會更加簡潔。

工具類 Executors 可以實現 Runnable 對象和 Callable 對象之間的相互轉換。(Executors.callable(Runnable task)或 Executors.callable(Runnable task,Object resule))。

Runnable.java

@FunctionalInterface  public interface Runnable {     /**      * 被線程執行,沒有返回值也無法拋出異常      */      public abstract void run();  }  

Callable.java

@FunctionalInterface  public interface Callable<V> {      /**       * 計算結果,或在無法這樣做時拋出異常。       * @return 計算得出的結果       * @throws 如果無法計算結果,則拋出異常       */      V call() throws Exception;  }  

4.3. 執行execute()方法和submit()方法的區別是什麼呢?

  1. execute()方法用於提交不需要返回值的任務,所以無法判斷任務是否被線程池執行成功與否;
  2. submit()方法用於提交需要返回值的任務。線程池會返回一個 Future 類型的對象,通過這個 Future 對象可以判斷任務是否執行成功,並且可以通過 Futureget()方法來獲取返回值,get()方法會阻塞當前線程直到任務完成,而使用 get(long timeout,TimeUnit unit)方法則會阻塞當前線程一段時間後立即返回,這時候有可能任務沒有執行完。

我們以**AbstractExecutorService**接口中的一個 submit 方法為例子來看看源代碼:

    public Future<?> submit(Runnable task) {          if (task == null) throw new NullPointerException();          RunnableFuture<Void> ftask = newTaskFor(task, null);          execute(ftask);          return ftask;      }  

上面方法調用的 newTaskFor 方法返回了一個 FutureTask 對象。

    protected <T> RunnableFuture<T> newTaskFor(Runnable runnable, T value) {          return new FutureTask<T>(runnable, value);      }  

我們再來看看execute()方法:

    public void execute(Runnable command) {        ...      }  

4.4. 如何創建線程池

《阿里巴巴Java開發手冊》中強制線程池不允許使用 Executors 去創建,而是通過 ThreadPoolExecutor 的方式,這樣的處理方式讓寫的同學更加明確線程池的運行規則,規避資源耗盡的風險

Executors 返回線程池對象的弊端如下:

  • FixedThreadPool 和 SingleThreadExecutor :允許請求的隊列長度為 Integer.MAX_VALUE ,可能堆積大量的請求,從而導致OOM。
  • CachedThreadPool 和 ScheduledThreadPool :允許創建的線程數量為 Integer.MAX_VALUE ,可能會創建大量線程,從而導致OOM。

方式一:通過構造方法實現

方式二:通過Executor 框架的工具類Executors來實現我們可以創建三種類型的ThreadPoolExecutor:

  • FixedThreadPool :該方法返回一個固定線程數量的線程池。該線程池中的線程數量始終不變。當有一個新的任務提交時,線程池中若有空閑線程,則立即執行。若沒有,則新的任務會被暫存在一個任務隊列中,待有線程空閑時,便處理在任務隊列中的任務。
  • SingleThreadExecutor: 方法返回一個只有一個線程的線程池。若多餘一個任務被提交到該線程池,任務會被保存在一個任務隊列中,待線程空閑,按先入先出的順序執行隊列中的任務。
  • CachedThreadPool: 該方法返回一個可根據實際情況調整線程數量的線程池。線程池的線程數量不確定,但若有空閑線程可以復用,則會優先使用可復用的線程。若所有線程均在工作,又有新的任務提交,則會創建新的線程處理任務。所有線程在當前任務執行完畢後,將返回線程池進行復用。

對應Executors工具類中的方法如圖所示:

4.5 ThreadPoolExecutor 類分析

ThreadPoolExecutor 類中提供的四個構造方法。我們來看最長的那個,其餘三個都是在這個構造方法的基礎上產生(其他幾個構造方法說白點都是給定某些默認參數的構造方法比如默認制定拒絕策略是什麼),這裡就不貼代碼講了,比較簡單。

    /**       * 用給定的初始參數創建一個新的ThreadPoolExecutor。       */      public ThreadPoolExecutor(int corePoolSize,                                int maximumPoolSize,                                long keepAliveTime,                                TimeUnit unit,                                BlockingQueue<Runnable> workQueue,                                ThreadFactory threadFactory,                                RejectedExecutionHandler handler) {          if (corePoolSize < 0 ||              maximumPoolSize <= 0 ||              maximumPoolSize < corePoolSize ||              keepAliveTime < 0)              throw new IllegalArgumentException();          if (workQueue == null || threadFactory == null || handler == null)              throw new NullPointerException();          this.corePoolSize = corePoolSize;          this.maximumPoolSize = maximumPoolSize;          this.workQueue = workQueue;          this.keepAliveTime = unit.toNanos(keepAliveTime);          this.threadFactory = threadFactory;          this.handler = handler;      }  

下面這些對創建 非常重要,在後面使用線程池的過程中你一定會用到!所以,務必拿着小本本記清楚。

4.5.1 ThreadPoolExecutor構造函數重要參數分析

ThreadPoolExecutor 3 個最重要的參數:

  • corePoolSize : 核心線程數線程數定義了最小可以同時運行的線程數量。
  • maximumPoolSize : 當隊列中存放的任務達到隊列容量的時候,當前可以同時運行的線程數量變為最大線程數。
  • workQueue: 當新任務來的時候會先判斷當前運行的線程數量是否達到核心線程數,如果達到的話,信任就會被存放在隊列中。

ThreadPoolExecutor其他常見參數:

  1. keepAliveTime:當線程池中的線程數量大於 corePoolSize 的時候,如果這時沒有新的任務提交,核心線程外的線程不會立即銷毀,而是會等待,直到等待的時間超過了 keepAliveTime才會被回收銷毀;
  2. unit : keepAliveTime 參數的時間單位。
  3. threadFactory :executor 創建新線程的時候會用到。
  4. handler :飽和策略。關於飽和策略下面單獨介紹一下。

4.5.2 ThreadPoolExecutor 飽和策略

ThreadPoolExecutor 飽和策略定義:

如果當前同時運行的線程數量達到最大線程數量並且隊列也已經被放滿了任時,ThreadPoolTaskExecutor 定義一些策略:

  • ThreadPoolExecutor.AbortPolicy:拋出 RejectedExecutionException來拒絕新任務的處理。
  • ThreadPoolExecutor.CallerRunsPolicy:調用執行自己的線程運行任務。您不會任務請求。但是這種策略會降低對於新任務提交速度,影響程序的整體性能。另外,這個策略喜歡增加隊列容量。如果您的應用程序可以承受此延遲並且你不能任務丟棄任何一個任務請求的話,你可以選擇這個策略。
  • ThreadPoolExecutor.DiscardPolicy 不處理新任務,直接丟棄掉。
  • ThreadPoolExecutor.DiscardOldestPolicy 此策略將丟棄最早的未處理的任務請求。

舉個例子:Spring 通過 ThreadPoolTaskExecutor 或者我們直接通過 ThreadPoolExecutor 的構造函數創建線程池的時候,當我們不指定 RejectedExecutionHandler 飽和策略的話來配置線程池的時候默認使用的是 ThreadPoolExecutor.AbortPolicy。在默認情況下,ThreadPoolExecutor 將拋出 RejectedExecutionException 來拒絕新來的任務 ,這代表你將丟失對這個任務的處理。對於可伸縮的應用程序,建議使用 ThreadPoolExecutor.CallerRunsPolicy。當最大池被填滿時,此策略為我們提供可伸縮隊列。(這個直接查看 ThreadPoolExecutor 的構造函數源碼就可以看出,比較簡單的原因,這裡就不貼代碼了)

4.6 一個簡單的線程池Demo:Runnable+ThreadPoolExecutor

為了讓大家更清楚上面的面試題中的一些概念,我寫了一個簡單的線程池 Demo。

首先創建一個 Runnable 接口的實現類(當然也可以是 Callable 接口,我們上面也說了兩者的區別。)

MyRunnable.java

import java.util.Date;    /**   * 這是一個簡單的Runnable類,需要大約5秒鐘來執行其任務。   * @author shuang.kou   */  public class MyRunnable implements Runnable {        private String command;        public MyRunnable(String s) {          this.command = s;      }        @Override      public void run() {          System.out.println(Thread.currentThread().getName() + " Start. Time = " + new Date());          processCommand();          System.out.println(Thread.currentThread().getName() + " End. Time = " + new Date());      }        private void processCommand() {          try {              Thread.sleep(5000);          } catch (InterruptedException e) {              e.printStackTrace();          }      }        @Override      public String toString() {          return this.command;      }  }    

編寫測試程序,我們這裡以阿里巴巴推薦的使用 ThreadPoolExecutor 構造函數自定義參數的方式來創建線程池。

ThreadPoolExecutorDemo.java

import java.util.concurrent.ArrayBlockingQueue;  import java.util.concurrent.ThreadPoolExecutor;  import java.util.concurrent.TimeUnit;    public class ThreadPoolExecutorDemo {        private static final int CORE_POOL_SIZE = 5;      private static final int MAX_POOL_SIZE = 10;      private static final int QUEUE_CAPACITY = 100;      private static final Long KEEP_ALIVE_TIME = 1L;      public static void main(String[] args) {            //使用阿里巴巴推薦的創建線程池的方式          //通過ThreadPoolExecutor構造函數自定義參數創建          ThreadPoolExecutor executor = new ThreadPoolExecutor(                  CORE_POOL_SIZE,                  MAX_POOL_SIZE,                  KEEP_ALIVE_TIME,                  TimeUnit.SECONDS,                  new ArrayBlockingQueue<>(QUEUE_CAPACITY),                  new ThreadPoolExecutor.CallerRunsPolicy());            for (int i = 0; i < 10; i++) {              //創建WorkerThread對象(WorkerThread類實現了Runnable 接口)              Runnable worker = new MyRunnable("" + i);              //執行Runnable              executor.execute(worker);          }          //終止線程池          executor.shutdown();          while (!executor.isTerminated()) {          }          System.out.println("Finished all threads");      }  }    

可以看到我們上面的代碼指定了:

  1. corePoolSize: 核心線程數為 5。
  2. maximumPoolSize :最大線程數 10
  3. keepAliveTime : 等待時間為 1L。
  4. unit: 等待時間的單位為 TimeUnit.SECONDS。
  5. workQueue:任務隊列為 ArrayBlockingQueue,並且容量為 100;
  6. handler:飽和策略為 CallerRunsPolicy

Output:

pool-1-thread-2 Start. Time = Tue Nov 12 20:59:44 CST 2019  pool-1-thread-5 Start. Time = Tue Nov 12 20:59:44 CST 2019  pool-1-thread-4 Start. Time = Tue Nov 12 20:59:44 CST 2019  pool-1-thread-1 Start. Time = Tue Nov 12 20:59:44 CST 2019  pool-1-thread-3 Start. Time = Tue Nov 12 20:59:44 CST 2019  pool-1-thread-5 End. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-3 End. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-2 End. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-4 End. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-1 End. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-2 Start. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-1 Start. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-4 Start. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-3 Start. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-5 Start. Time = Tue Nov 12 20:59:49 CST 2019  pool-1-thread-2 End. Time = Tue Nov 12 20:59:54 CST 2019  pool-1-thread-3 End. Time = Tue Nov 12 20:59:54 CST 2019  pool-1-thread-4 End. Time = Tue Nov 12 20:59:54 CST 2019  pool-1-thread-5 End. Time = Tue Nov 12 20:59:54 CST 2019  pool-1-thread-1 End. Time = Tue Nov 12 20:59:54 CST 2019    

4.7 線程池原理分析

承接 4.6 節,我們通過代碼輸出結果可以看出:線程池每次會同時執行 5 個任務,這 5 個任務執行完之後,剩餘的 5 個任務才會被執行。 大家可以先通過上面講解的內容,分析一下到底是咋回事?(自己獨立思考一會)

現在,我們就分析上面的輸出內容來簡單分析一下線程池原理。

**為了搞懂線程池的原理,我們需要首先分析一下 execute方法。**在 4.6 節中的 Demo 中我們使用 executor.execute(worker)來提交一個任務到線程池中去,這個方法非常重要,下面我們來看看它的源碼:

   // 存放線程池的運行狀態 (runState) 和線程池內有效線程的數量 (workerCount)     private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));        private static int workerCountOf(int c) {          return c & CAPACITY;      }        private final BlockingQueue<Runnable> workQueue;        public void execute(Runnable command) {          // 如果任務為null,則拋出異常。          if (command == null)              throw new NullPointerException();          // ctl 中保存的線程池當前的一些狀態信息          int c = ctl.get();            //  下面會涉及到 3 步 操作          // 1.首先判斷當前線程池中之行的任務數量是否小於 corePoolSize          // 如果小於的話,通過addWorker(command, true)新建一個線程,並將任務(command)添加到該線程中;然後,啟動該線程從而執行任務。          if (workerCountOf(c) < corePoolSize) {              if (addWorker(command, true))                  return;              c = ctl.get();          }          // 2.如果當前之行的任務數量大於等於 corePoolSize 的時候就會走到這裡          // 通過 isRunning 方法判斷線程池狀態,線程池處於 RUNNING 狀態才會被並且隊列可以加入任務,該任務才會被加入進去          if (isRunning(c) && workQueue.offer(command)) {              int recheck = ctl.get();              // 再次獲取線程池狀態,如果線程池狀態不是 RUNNING 狀態就需要從任務隊列中移除任務,並嘗試判斷線程是否全部執行完畢。同時執行拒絕策略。              if (!isRunning(recheck) && remove(command))                  reject(command);                  // 如果當前線程池為空就新創建一個線程並執行。              else if (workerCountOf(recheck) == 0)                  addWorker(null, false);          }          //3. 通過addWorker(command, false)新建一個線程,並將任務(command)添加到該線程中;然後,啟動該線程從而執行任務。          //如果addWorker(command, false)執行失敗,則通過reject()執行相應的拒絕策略的內容。          else if (!addWorker(command, false))              reject(command);      }  

通過下圖可以更好的對上面這 3 步做一個展示,下圖是我為了省事直接從網上找到,原地址不明。

圖解線程池實現原理

現在,讓我們在回到 4.6 節我們寫的 Demo, 現在應該是不是很容易就可以搞懂它的原理了呢?

沒搞懂的話,也沒關係,可以看看我的分析:

我們在代碼中模擬了 10 個任務,我們配置的核心線程數為 5 、等待隊列容量為 100 ,所以每次只可能存在 5 個任務同時執行,剩下的 5 個任務會被放到等待隊列中去。當前的 5 個任務之行完成後,才會之行剩下的 5 個任務。

5. Atomic 原子類

5.1. 介紹一下Atomic 原子類

Atomic 翻譯成中文是原子的意思。在化學上,我們知道原子是構成一般物質的最小單位,在化學反應中是不可分割的。在我們這裡 Atomic 是指一個操作是不可中斷的。即使是在多個線程一起執行的時候,一個操作一旦開始,就不會被其他線程干擾。

所以,所謂原子類說簡單點就是具有原子/原子操作特徵的類。

並發包 java.util.concurrent 的原子類都存放在java.util.concurrent.atomic下,如下圖所示。

JUC原子類概覽

5.2. JUC 包中的原子類是哪4類?

基本類型

使用原子的方式更新基本類型

  • AtomicInteger:整形原子類
  • AtomicLong:長整型原子類
  • AtomicBoolean:布爾型原子類

數組類型

使用原子的方式更新數組裡的某個元素

  • AtomicIntegerArray:整形數組原子類
  • AtomicLongArray:長整形數組原子類
  • AtomicReferenceArray:引用類型數組原子類

引用類型

  • AtomicReference:引用類型原子類
  • AtomicStampedReference:原子更新引用類型里的字段原子類
  • AtomicMarkableReference :原子更新帶有標記位的引用類型

對象的屬性修改類型

  • AtomicIntegerFieldUpdater:原子更新整形字段的更新器
  • AtomicLongFieldUpdater:原子更新長整形字段的更新器
  • AtomicStampedReference:原子更新帶有版本號的引用類型。該類將整數值與引用關聯起來,可用於解決原子的更新數據和數據的版本號,可以解決使用 CAS 進行原子更新時可能出現的 ABA 問題。

5.3. 講講 AtomicInteger 的使用

AtomicInteger 類常用方法

public final int get() //獲取當前的值  public final int getAndSet(int newValue)//獲取當前的值,並設置新的值  public final int getAndIncrement()//獲取當前的值,並自增  public final int getAndDecrement() //獲取當前的值,並自減  public final int getAndAdd(int delta) //獲取當前的值,並加上預期的值  boolean compareAndSet(int expect, int update) //如果輸入的數值等於預期值,則以原子方式將該值設置為輸入值(update)  public final void lazySet(int newValue)//最終設置為newValue,使用 lazySet 設置之後可能導致其他線程在之後的一小段時間內還是可以讀到舊的值。  

AtomicInteger 類的使用示例

使用 AtomicInteger 之後,不用對 increment() 方法加鎖也可以保證線程安全。

class AtomicIntegerTest {          private AtomicInteger count = new AtomicInteger();        //使用AtomicInteger之後,不需要對該方法加鎖,也可以實現線程安全。          public void increment() {                    count.incrementAndGet();          }           public int getCount() {                  return count.get();          }  }    

5.4. 能不能給我簡單介紹一下 AtomicInteger 類的原理

AtomicInteger 線程安全原理簡單分析

AtomicInteger 類的部分源碼:

    // setup to use Unsafe.compareAndSwapInt for updates(更新操作時提供「比較並替換」的作用)      private static final Unsafe unsafe = Unsafe.getUnsafe();      private static final long valueOffset;        static {          try {              valueOffset = unsafe.objectFieldOffset                  (AtomicInteger.class.getDeclaredField("value"));          } catch (Exception ex) { throw new Error(ex); }      }        private volatile int value;  

AtomicInteger 類主要利用 CAS (compare and swap) + volatile 和 native 方法來保證原子操作,從而避免 synchronized 的高開銷,執行效率大為提升。

CAS的原理是拿期望的值和原本的一個值作比較,如果相同則更新成新的值。UnSafe 類的 objectFieldOffset() 方法是一個本地方法,這個方法是用來拿到「原來的值」的內存地址,返回值是 valueOffset。另外 value 是一個volatile變量,在內存中可見,因此 JVM 可以保證任何時刻任何線程總能拿到該變量的最新值。

關於 Atomic 原子類這部分更多內容可以查看我的這篇文章:並發編程面試必備:JUC 中的 Atomic 原子類總結

6. AQS

6.1. AQS 介紹

AQS的全稱為(AbstractQueuedSynchronizer),這個類在java.util.concurrent.locks包下面。

AQS類

AQS是一個用來構建鎖和同步器的框架,使用AQS能簡單且高效地構造出應用廣泛的大量的同步器,比如我們提到的ReentrantLock,Semaphore,其他的諸如ReentrantReadWriteLock,SynchronousQueue,FutureTask等等皆是基於AQS的。當然,我們自己也能利用AQS非常輕鬆容易地構造出符合我們自己需求的同步器。

6.2. AQS 原理分析

AQS 原理這部分參考了部分博客,在5.2節末尾放了鏈接。

在面試中被問到並發知識的時候,大多都會被問到「請你說一下自己對於AQS原理的理解」。下面給大家一個示例供大家參加,面試不是背題,大家一定要加入自己的思想,即使加入不了自己的思想也要保證自己能夠通俗的講出來而不是背出來。

下面大部分內容其實在AQS類注釋上已經給出了,不過是英語看着比較吃力一點,感興趣的話可以看看源碼。

6.2.1. AQS 原理概覽

AQS核心思想是,如果被請求的共享資源空閑,則將當前請求資源的線程設置為有效的工作線程,並且將共享資源設置為鎖定狀態。如果被請求的共享資源被佔用,那麼就需要一套線程阻塞等待以及被喚醒時鎖分配的機制,這個機制AQS是用CLH隊列鎖實現的,即將暫時獲取不到鎖的線程加入到隊列中。

CLH(Craig,Landin,and Hagersten)隊列是一個虛擬的雙向隊列(虛擬的雙向隊列即不存在隊列實例,僅存在結點之間的關聯關係)。AQS是將每條請求共享資源的線程封裝成一個CLH鎖隊列的一個結點(Node)來實現鎖的分配。

看個AQS(AbstractQueuedSynchronizer)原理圖:

AQS原理圖

AQS使用一個int成員變量來表示同步狀態,通過內置的FIFO隊列來完成獲取資源線程的排隊工作。AQS使用CAS對該同步狀態進行原子操作實現對其值的修改。

private volatile int state;//共享變量,使用volatile修飾保證線程可見性  

狀態信息通過protected類型的getState,setState,compareAndSetState進行操作

  //返回同步狀態的當前值  protected final int getState() {          return state;  }   // 設置同步狀態的值  protected final void setState(int newState) {          state = newState;  }  //原子地(CAS操作)將同步狀態值設置為給定值update如果當前同步狀態的值等於expect(期望值)  protected final boolean compareAndSetState(int expect, int update) {          return unsafe.compareAndSwapInt(this, stateOffset, expect, update);  }  

6.2.2. AQS 對資源的共享方式

AQS定義兩種資源共享方式

  • Exclusive(獨佔):只有一個線程能執行,如ReentrantLock。又可分為公平鎖和非公平鎖:
    • 公平鎖:按照線程在隊列中的排隊順序,先到者先拿到鎖
    • 非公平鎖:當線程要獲取鎖時,無視隊列順序直接去搶鎖,誰搶到就是誰的
  • Share(共享):多個線程可同時執行,如Semaphore/CountDownLatch。Semaphore、CountDownLatch、 CyclicBarrier、ReadWriteLock 我們都會在後面講到。

ReentrantReadWriteLock 可以看成是組合式,因為ReentrantReadWriteLock也就是讀寫鎖允許多個線程同時對某一資源進行讀。

不同的自定義同步器爭用共享資源的方式也不同。自定義同步器在實現時只需要實現共享資源 state 的獲取與釋放方式即可,至於具體線程等待隊列的維護(如獲取資源失敗入隊/喚醒出隊等),AQS已經在頂層實現好了。

6.2.3. AQS底層使用了模板方法模式

同步器的設計是基於模板方法模式的,如果需要自定義同步器一般的方式是這樣(模板方法模式很經典的一個應用):

  1. 使用者繼承AbstractQueuedSynchronizer並重寫指定的方法。(這些重寫方法很簡單,無非是對於共享資源state的獲取和釋放)
  2. 將AQS組合在自定義同步組件的實現中,並調用其模板方法,而這些模板方法會調用使用者重寫的方法。

這和我們以往通過實現接口的方式有很大區別,這是模板方法模式很經典的一個運用。

AQS使用了模板方法模式,自定義同步器時需要重寫下面幾個AQS提供的模板方法:

isHeldExclusively()//該線程是否正在獨佔資源。只有用到condition才需要去實現它。  tryAcquire(int)//獨佔方式。嘗試獲取資源,成功則返回true,失敗則返回false。  tryRelease(int)//獨佔方式。嘗試釋放資源,成功則返回true,失敗則返回false。  tryAcquireShared(int)//共享方式。嘗試獲取資源。負數表示失敗;0表示成功,但沒有剩餘可用資源;正數表示成功,且有剩餘資源。  tryReleaseShared(int)//共享方式。嘗試釋放資源,成功則返回true,失敗則返回false。    

默認情況下,每個方法都拋出 UnsupportedOperationException。這些方法的實現必須是內部線程安全的,並且通常應該簡短而不是阻塞。AQS類中的其他方法都是final ,所以無法被其他類使用,只有這幾個方法可以被其他類使用。

以ReentrantLock為例,state初始化為0,表示未鎖定狀態。A線程lock()時,會調用tryAcquire()獨佔該鎖並將state+1。此後,其他線程再tryAcquire()時就會失敗,直到A線程unlock()到state=0(即釋放鎖)為止,其它線程才有機會獲取該鎖。當然,釋放鎖之前,A線程自己是可以重複獲取此鎖的(state會累加),這就是可重入的概念。但要注意,獲取多少次就要釋放多麼次,這樣才能保證state是能回到零態的。

再以CountDownLatch以例,任務分為N個子線程去執行,state也初始化為N(注意N要與線程個數一致)。這N個子線程是並行執行的,每個子線程執行完後countDown()一次,state會CAS(Compare and Swap)減1。等到所有子線程都執行完後(即state=0),會unpark()主調用線程,然後主調用線程就會從await()函數返回,繼續後余動作。

一般來說,自定義同步器要麼是獨佔方法,要麼是共享方式,他們也只需實現tryAcquire-tryReleasetryAcquireShared-tryReleaseShared中的一種即可。但AQS也支持自定義同步器同時實現獨佔和共享兩種方式,如ReentrantReadWriteLock

推薦兩篇 AQS 原理和相關源碼分析的文章:

  • http://www.cnblogs.com/waterystone/p/4920797.html
  • https://www.cnblogs.com/chengxiao/archive/2017/07/24/7141160.html

6.3. AQS 組件總結

  • Semaphore(信號量)-允許多個線程同時訪問: synchronized 和 ReentrantLock 都是一次只允許一個線程訪問某個資源,Semaphore(信號量)可以指定多個線程同時訪問某個資源。
  • CountDownLatch (倒計時器): CountDownLatch是一個同步工具類,用來協調多個線程之間的同步。這個工具通常用來控制線程等待,它可以讓某一個線程等待直到倒計時結束,再開始執行。
  • CyclicBarrier(循環柵欄): CyclicBarrier 和 CountDownLatch 非常類似,它也可以實現線程間的技術等待,但是它的功能比 CountDownLatch 更加複雜和強大。主要應用場景和 CountDownLatch 類似。CyclicBarrier 的字面意思是可循環使用(Cyclic)的屏障(Barrier)。它要做的事情是,讓一組線程到達一個屏障(也可以叫同步點)時被阻塞,直到最後一個線程到達屏障時,屏障才會開門,所有被屏障攔截的線程才會繼續幹活。CyclicBarrier默認的構造方法是 CyclicBarrier(int parties),其參數表示屏障攔截的線程數量,每個線程調用await()方法告訴 CyclicBarrier 我已經到達了屏障,然後當前線程被阻塞。

7 Reference

  • 《深入理解 Java 虛擬機》
  • 《實戰 Java 高並發程序設計》
  • 《Java並發編程的藝術》
  • http://www.cnblogs.com/waterystone/p/4920797.html
  • https://www.cnblogs.com/chengxiao/archive/2017/07/24/7141160.html
  • https://www.journaldev.com/1076/java-threadlocal-example