深入理解 volatile 關鍵字

2022 年 6 月 29 日
筆記
java內存模型

volatile 關鍵字是 Java 語言的高級特性，但要弄清楚其工作原理，需要先弄懂 Java 內存模型。如果你之前沒了解過 Java 內存模型，那可以先看看之前我寫過的一篇「深入理解 Java 內存模型」一文。

初學 volatile 關鍵字，我們需要弄清楚它到底意味着什麼。總的來說，它有兩個含義，分別是：

保證可見性
禁止指令重排序

保證可見性

保證可見性指的是：當一個線程修改了某個變量時，其他所有線程都知道該變量被修改了。 由於 volatile 可以保證可見性，因此 Java 能夠保證現在在讀取 volatile 變量時，線程讀取到的值是準確的。但是這並不意味着對 volatile 變量的操作是線程安全的，因為有可能在讀取到變量之後，又有其他線程對變量進行修改了。

為了說明這個問題，我們可以舉個簡單地例子。下面代碼發起了 20 個線程，每個線程對 race 變量進行 1 萬次自增操作。如果這段代碼能夠正確並發執行，那麼最後輸出的結果應該是 20 萬。但實際上，每次輸出的結果都不一樣，都是一個小於 20 萬的數字，為什麼呢？

這是因為當線程在獲取到 race 變量的值，然後對其進行自增這中間，有可能其他線程對 race 變量做了自增操作，然後寫回了主內存。而當前線程再將數據寫回主內存時，就發生了數據覆蓋。因此，就發生了數據不一致的問題。

要使得 volatile 變量不發生並發安全問題，只需要遵守如下兩條規則即可：

運算結果並不依賴變量的當前值，或者能夠確保只有單一的線程修改變量的值。
變量不需要與其他的狀態變量共同參與不變約束。

第一條規則比較好理解，例如上面例子的 race 變量，其運算結果就依賴於變量的當前值，所以其並不符合第一條規則，因此就會有線程安全問題。但如果 race++ 變成了 race=1; 這樣的情況，那麼 race 的值就不依賴變量當前值，因此就不會有線程安全問題。

第二條規則有點晦澀難懂。其意思是說，變量不能和其他變量一起參與判斷，無論其他變量是否是 volatile 類型的變量。例如 if（a && b） 這個判斷就無法滿足 volatile 的第二條規則，會發生線程安全問題，即使這兩個變量都是 volatile 類型的變量。

關於第二條規則的描述，為啥與其他變量一起，就沒法保證線程安全呢？

要解答這個問題，我們不妨假設一下各種可能的場景。

我們假設變量 a b 的初始值都是 true，並且兩者都是 volatile 類型變量。

場景一：線程 A 執行 if（a && b） 判斷，先判斷變量 a，發現是 true，於是繼續判斷變量 b。發現變量 b 也是 true，於是整個表達式為 true。

場景二：線程 A 執行 if（a && b） 判斷，先判斷變量 a，發現是 true。此時線程 B 修改了變量 b 的值為 false。接着線程 A 繼續判斷變量 b 的值，發現變量 b 的值為 false。於是整體表達式的值為 false。

通過上面的例子，我們發現同樣的表達式在不同的並發場景下會有不同的結果，這很明顯就是線程不安全的。因為線程安全的代碼，在單線程和多線程下，其結果應該是一樣的。

禁止指令重排序

指令重排序，指的是硬件層面為了加快執行速度，可能會調整指令的執行順序，從而會出現並不按代碼順序的執行情況出現。例如下面的代碼里，我們初始化了 flag 變量為 false，然後再將 flag 變量置為 true。但這樣的代碼在並發執行的時候，有可能先將 flag 職位 true，再將 flag 變為 false，從而發生線程安全問題。

boolean flag = false;
flag = true;

我們說 volatile 變量禁止指令重排序，其實就是指被 volatile 修飾的變量，其執行順序不能被重排序。 禁止重排序的實現，是使用了一個叫「內存屏障」的東西。簡單地說，內存屏障的作用就是指令重排序時，不能把後面的指令重排序到內存屏障之前的位置。

可見性的來源

我們前面說過：volatile 修飾的變量，當其被修改之後，其他變量就能立即獲取到其變化。但這個可見性的來源是哪裡呢？為什麼其能夠實現這樣的可見性呢？其實 volatile 的這些功能來源於 Java 內存模型中對 volatile 變量定義的特殊規則。

假定 T 表示一個線程，V 和 W 分別表示兩個 volatile 型變量。在 Java 內存模型中規定在進行 read、load、use、assign、store 和 write 操作時需要滿足如下規則：

只有當線程 T 對變量 V 執行的前一個動作是 load 的時候，線程 T 才能對變量 V 執行 use 動作。並且，只有當線程 T 對變量 V 執行的後一個動作是 use 的時候，線程 T 才能對變量 V 執行 load 動作。
只有當線程 T 對變量 V 執行的前一個動作是 assign 的時候，線程 T 才能對變量 V 執行 store 動作；並且，只有當線程 T 對變量V執行的後一個動作是 store 的時候，線程 T 才能對變量 V 執行 assign 動作。
假定動作 A 是線程 T 對變量 V 實施的 use 或 assign 動作，假定動作 F 是和動作 A 相關聯的 load 或 store 動作，假定動作 P 是和動作 F 相應的對變量 V 的 read 或 write 動作。類似的，假定動作 B 是線程 T 對變量 W 實施的 use 或 assign 動作，假定動作 G 是和動作 B 相關聯的 load 或 store 動作，假定動作 Q 是和動作 G 相應的對變量 W 的 read 或 write 動作。如果 A 先於 B，那麼 P 先於 Q。

上面三條規則有點複雜，我們來一條條講解下。

首先，我們來看看第一條規則。

只有當線程 T 對變量 V 執行的前一個動作是 load 的時候，線程 T 才能對變量 V 執行 use 動作。

load 動作，指的是把從主內存得到的變量值，放入到工作內存的變量副本。use 動作，指的是將工作內存的一個變量值，傳遞給執行引擎。那麼這句話合起來的意思可以理解為：要使用變量 V 之前，必須去主內存讀取變量 V。

並且，只有當線程 T 對變量 V 執行的後一個動作是 use 的時候，線程 T 才能對變量 V 執行 load 動作。

這句的意思可以理解為：要去讀取主內存的變量值放入工作內存的變量副本，那就必須使用它。

總的來說，這條規則的意思是：線程對變量 V 的 use 動作，必須與 read、load 動作連在一起，即 read -> load -> use 必須一起出現。這條規則要求在工作內存中，每次使用 V 前都必須先從主內存刷新最新的值，用於保證能看見其他線程對變量V所做的修改後的值。

我們繼續看第二條規則。

只有當線程 T 對變量 V 執行的前一個動作是 assign 的時候，線程 T 才能對變量 V 執行 store 動作。

assign 動作，指的是將執行引擎的值賦值給工作內存的變量。store 動作，指的是將工作內存的一個變量傳送到主內存，方便後續寫回主內存。那麼這句話合起來的意思可以理解為：要講工作內存的變量寫回主內存，那麼必須是工作內存的變量收到執行引擎的賦值。

並且，只有當線程 T 對變量 V 執行的後一個動作是 store 的時候，線程 T 才能對變量 V 執行 assign 動作。

這句話的意思可以理解為：要將執行引擎接收到的值賦給工作內存的變量，就必須把工作內存變量的值寫回主內存。

總的來說，這條規則的意思是：線程對變量 V 的 assign 動作，必須與 store、write 連在一起，即：assign -> store -> write 必須一起出現。這條規則要求在工作內存中，每次修改 V 後都必須立刻同步回主內存中，用於保證其他線程可以看到自己對變量 V 所做的修改。

我們繼續看第三條規則。

假定動作 A 是線程 T 對變量 V 實施的 use 或 assign 動作，假定動作 F 是和動作 A 相關聯的 load 或 store 動作，假定動作 P 是和動作 F 相應的對變量 V 的 read 或 write 動作。

這句話意思比較簡單，use 和 assign 動作分別是從工作內存傳遞變量給執行引擎，以及從執行引擎傳遞變量給工作內存。load 和 store 動作分別是從主內存載入數據到工作內存，以及從工作內存寫數據到主內存。read 和 write 動作分別是將數據讀取到工作內存，以及將數據寫回主內存。

我們假設是一個寫入到主內存動作，如果這幾個組合起來，那麼就是：A -> F -> P（assign -> store -> write）。

類似的，假定動作 B 是線程 T 對變量 W 實施的 use 或 assign 動作，假定動作 G 是和動作 B 相關聯的 load 或 store 動作，假定動作 Q 是和動作 G 相應的對變量 W 的 read 或 write 動作。

與上面類似，如果是一個寫入到主內存動作，如果這幾個組合起來，那麼就是：B -> G -> Q（assign -> store -> write）。

如果 A 先於 B，那麼 P 先於 Q。

這個的意思是，如果 A 動作早於 B 動作發生，那麼 A 動作對應的 P 動作（write 動作）就要早於 Q 動作(write 動作）。

這條規則要求 volatile 修飾的變量不會被指令重排序優化，保證代碼的執行順序與程序的順序相同。

所以說 volatile 變量的可見性以及禁止重排序的語義，其實都來源於 Java 內存模型里對於 volatile 變量的定義。

總結

這篇文章，我們介紹了 volatile 的兩個語義：

可見性
禁止重排序

可見性指的是 volatile 類型的變量，其變量值一旦被修改，其他線程就能夠立刻感知到。而禁止重排序指的是被 volatile 修飾的變量，其執行順序不能被重排序。我們在日常使用中，如果要使 volatile 變量不發生線程安全問題，只需要遵守下面兩個規則即可。

運算結果並不依賴變量的當前值，或者能夠確保只有單一的線程修改變量的值。
變量不需要與其他的狀態變量共同參與不變約束。

最後，我們進一步探究了 volatile 可見性以及禁止重排序的來源，其實就是 Java 內存模型里對於 volatile 變量的定義。

參考資料

《深入理解 Java 虛擬機》
如何理解「變量不需要與其他的狀態變量共同參與不變約束」一話？ – 知乎

Tags: java內存模型