Java內存模型相關原則詳解

2019 年 11 月 6 日
筆記

在《Java內存模型(JMM)詳解》一文中我們已經講到了Java內存模型的基本結構以及相關操作和規則。而Java內存模型又是圍繞着在並發過程中如何處理原子性、可見性以及有序性這三個特徵來構建的。本篇文章就帶大家了解一下相關概念、原則等內容。

原子性

原子性即一個操作或一系列是不可中斷的。即使是在多個線程的情況下，操作一旦開始，就不會被其他線程干擾。

比如，對於一個靜態變量int x兩條線程同時對其賦值，線程A賦值為1，而線程B賦值為2，不管線程如何運行，最終x的值要麼是1，要麼是2，線程A和線程B間的操作是沒有干擾的，這就是原子性操作，不可被中斷的。

Java內存模型對以下操作保證其原子性：read，load，assign，use，store，write。我們可以大致認為基本數據類型的訪問讀寫是具備原子性的（前面也提到了long和double類型的「半個變量」情況，不過幾乎不會發生）。

從Java內存模型底層來看有上面的原子性操作，但針對用戶來說，也就是我們編寫Java的程序，如果需要更大範圍的原子性保障，就需要同步關鍵字——synchronized來保障了。也就是說synchronized中的操作也具有原子性。

可見性

可見性是指當一個線程修改了共享變量的值，其他線程能夠立即得知這個修改。

Java內存模型是通過變量修改後將新值同步回主內存，在變量讀取前從主內存刷新變量值，將主內存作為傳遞媒介。可回顧一下上篇文章的圖。

無論普通變量還是volatile變量都是如此，只不過volatile變量保證新值能夠立馬同步到主內存，使用時也立即從主內存刷新，保證了多線程操作時變量的可見性。而普通變量不能夠保證。

除了volatile，synchronized和final也能夠實現可見性。

synchronized實現的可見性是通過「對一個變量執行unlock操作之前，必須先把此變量同步回主內存中」來保證的。

主要有兩個原則：線程解鎖前，必須把共享變量的最新值刷新到主內存中；線程加鎖時，將清空工作內存中共享變量的值，從而使用共享變量時需要從主內存中重新讀取最新的值。

final的可見性是指：被final修飾的字段在構造器中一旦初始化完成，並且構造器沒有把「this」的引用傳遞出去，那在其他線程中就能看見final的值。

有序性

在Java內存模型中有序性可歸納為這樣一句話：如果在本線程內觀察，所有操作都是有序的，如果在一個線程中觀察另一個線程，所有操作都是無序的。

有序性是指對於單線程的執行代碼，執行是按順序依次進行的。但在多線程環境中，則可能出現亂序現象，因為在編譯過程會出現「指令重排」，重排後的指令與原指令的順序未必一致。

因此，上面歸納的前半句指的是線程內保證串行語義執行，後半句則指指「令重排現」象和「工作內存與主內存同步延遲」現象。

同樣，Java語言提供了volatile和synchronized兩個關鍵字來保證線程之間操作的有序性。

指令重排

計算機執行指令經過編譯之後形成指令序列。一般情況，指令序列是會輸出確定的結果，且每一次的執行都有確定的結果。

CPU和編譯器為了提升程序執行的效率，會按照一定的規則允許進行指令優化。但代碼邏輯之間是存在一定的先後順序，並發執行時按照不同的執行邏輯會得到不同的結果。

編譯器優化重排序：編譯器在不改變單線程程序語義的前提下，重新安排語句執行順序。
指令級並行重排序：處理器採用了指令級並行技術來將多條指令重疊執行。如果不存在數據依賴性，處理器可以改變語句對應及其的執行順序。
內存系統的重排序：處理器使用緩存和讀/寫緩衝區，使得加載和存儲操作看上去可能是亂序執行。

舉個例來說明一下多線程中可能出現的重排現象：

class ReOrderDemo {      int a = 0;      boolean flag = false;        public void write() {          a = 1;                   //1          flag = true;             //2      }        public void read() {          if (flag) {                //3              int i =  a * a;        //4              ……          }      }  }

在上面的代碼中，單線程執行時，read方法能夠獲得flag的值進行判斷，獲得預期結果。但在多線程的情況下就可能出現不同的結果。

比如，當線程A進行write操作時，由於指令重排，write方法中的代碼執行順序可能會變成下面這樣：

flag = true;             //2  a = 1;                   //1

也就是說可能會先對flag賦值，然後再對a賦值。這在單線程中並不影響最終輸出的結果。

但如果與此同時，B線程在調用read方法，那麼就有可能出現flag為true但a還是0，這時進入第4步操作的結果就為0，而不是預期的1了。

請記住，指令重排只會保證單線程中串行語義執行的一致性，不會關心多線程間語義的一致性。這也是為什麼在寫單例模式時需要考慮添加volatile關鍵詞來修飾，就是為了防止指令重排導致的問題。

JMM提供的解決方案

在了解了原子性、可見性以及有序性問題後，看看JMM是提供了什麼機制來保證這些特性的。

原子性問題，除了JVM自身提供的對基本數據類型讀寫操作的原子性外，對於方法級別或者代碼塊級別的原子性操作，可以使用synchronized關鍵字或者重入鎖(ReentrantLock)保證程序執行的原子性。

而工作內存與主內存同步延遲現象導致的可見性問題，可以使用synchronized關鍵字或者volatile關鍵字解決。它們都可以使一個線程修改後的變量立即對其他線程可見。

對於指令重排導致的可見性問題和有序性問題，則可以利用volatile關鍵字解決。volatile的另一個作用就是禁止重排序優化。

除了靠sychronized和volatile關鍵字之外，JMM內部還定義一套happens-before（先行發生）原則來保證多線程環境下兩個操作間的原子性、可見性以及有序性。

先行發生原則

如果僅靠sychronized和volatile關鍵字來保證原子性、可見性以及有序性，那麼編寫並發程序會十分麻煩。為此在Java內存模型中，還提供了happens-before原則來輔助保證程序執行的原子性、可見性以及有序性的問題。該原則是判斷數據是否存在競爭、線程是否安全的依據。

happens-before規則：

程序次序規則：在一個線程內，程序前面的操作先於後面的操作。
監視器鎖規則：一個unlock操作先於後面對同一個鎖的lock操作發生。
volatile變量規則：對一個volatile變量的寫操作先行發生於後面對這個變量的讀操作，也就是說讀取的值肯定是最新的。
線程啟動規則：Thread對象的start()方法調用先行發生於此線程的每一個動作。
線程加入規則：Thread對象的結束先行發生於join()方法返回。
線程中斷規則：對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生，可以通過interrupted()方法檢測到是否有中斷髮生。
對象終結規則：一個對象的初始化完成（構造函數執行結束）先行發生於它的finalize()方法的開始。
傳遞性：如果操作A先行發生於操作B，操作B先行發生於操作C，那麼操作A先行發生於操作C。

還拿上面的具體代碼來進行說明：

class ReOrderDemo {      int a = 0;      boolean flag = false;        public void write() {          a = 1;                   //1          flag = true;             //2      }        public void read() {          if (flag) {                //3              int i =  a * a;        //4              ……          }      }  }

線程A調用write()方法，線程B調用read()方法，線程A先(時間上的先後)於線程B啟動，那麼線程B讀取到a的值是多少呢？

現在依據8條原則來進行對照。

兩個方法分別由線程A和線程B調用，不在同一個線程中，因此程序次序原則不適用。

沒有write()方法和read()方法都沒有使用同步手段，監視器鎖規則不適用。

沒有使用volatile關鍵字，volatile變量原則不適用。

與線程啟動、終止、中斷、對象終結規則、傳遞性都沒有關係，不適用。

因此，線程A和線程B的啟動時間雖然有先後，但線程B執行結果卻是不確定，也是說上述代碼沒有適合8條原則中的任意一條，所以線程B讀取的值自然也是不確定的，換句話說就是線程不安全的。

修復這個問題的方式很簡單，要麼給write()方法和read()方法添加同步手段，如synchronized。或者給變量flag添加volatile關鍵字，確保線程A修改的值對線程B總是可見。

小結

在這篇文章中介紹了Java內存模型中一些原則，及其衍生出來保證這些原則的方式和方法。也是為我們下面學習volatile這個面試官最愛問的關鍵字的做好鋪墊。歡迎關注微信公眾號「程序新視界」繼續學習。

原文鏈接：《Java內存模型相關原則詳解》

《面試官》系列文章：

程序新視界：精彩和成長都不容錯過