Java內存模型相關原則詳解

  • 2019 年 11 月 6 日
  • 筆記

在《Java內存模型(JMM)詳解》一文中我們已經講到了Java內存模型的基本結構以及相關操作和規則。而Java內存模型又是圍繞着在並發過程中如何處理原子性、可見性以及有序性這三個特徵來構建的。本篇文章就帶大家了解一下相關概念、原則等內容。

原子性

原子性即一個操作或一系列是不可中斷的。即使是在多個線程的情況下,操作一旦開始,就不會被其他線程干擾。

比如,對於一個靜態變量int x兩條線程同時對其賦值,線程A賦值為1,而線程B賦值為2,不管線程如何運行,最終x的值要麼是1,要麼是2,線程A和線程B間的操作是沒有干擾的,這就是原子性操作,不可被中斷的。

Java內存模型對以下操作保證其原子性:read,load,assign,use,store,write。我們可以大致認為基本數據類型的訪問讀寫是具備原子性的(前面也提到了long和double類型的「半個變量」情況,不過幾乎不會發生)。

從Java內存模型底層來看有上面的原子性操作,但針對用戶來說,也就是我們編寫Java的程序,如果需要更大範圍的原子性保障,就需要同步關鍵字——synchronized來保障了。也就是說synchronized中的操作也具有原子性。

可見性

可見性是指當一個線程修改了共享變量的值,其他線程能夠立即得知這個修改。

Java內存模型是通過變量修改後將新值同步回主內存,在變量讀取前從主內存刷新變量值,將主內存作為傳遞媒介。可回顧一下上篇文章的圖。

JMM

無論普通變量還是volatile變量都是如此,只不過volatile變量保證新值能夠立馬同步到主內存,使用時也立即從主內存刷新,保證了多線程操作時變量的可見性。而普通變量不能夠保證。

除了volatile,synchronized和final也能夠實現可見性。

synchronized實現的可見性是通過「對一個變量執行unlock操作之前,必須先把此變量同步回主內存中」來保證的。

主要有兩個原則:線程解鎖前,必須把共享變量的最新值刷新到主內存中;線程加鎖時,將清空工作內存中共享變量的值,從而使用共享變量時需要從主內存中重新讀取最新的值。

final的可見性是指:被final修飾的字段在構造器中一旦初始化完成,並且構造器沒有把「this」的引用傳遞出去,那在其他線程中就能看見final的值。

有序性

在Java內存模型中有序性可歸納為這樣一句話:如果在本線程內觀察,所有操作都是有序的,如果在一個線程中觀察另一個線程,所有操作都是無序的。

有序性是指對於單線程的執行代碼,執行是按順序依次進行的。但在多線程環境中,則可能出現亂序現象,因為在編譯過程會出現「指令重排」,重排後的指令與原指令的順序未必一致。

因此,上面歸納的前半句指的是線程內保證串行語義執行,後半句則指指「令重排現」象和「工作內存與主內存同步延遲」現象。

同樣,Java語言提供了volatile和synchronized兩個關鍵字來保證線程之間操作的有序性。

指令重排

計算機執行指令經過編譯之後形成指令序列。一般情況,指令序列是會輸出確定的結果,且每一次的執行都有確定的結果。

CPU和編譯器為了提升程序執行的效率,會按照一定的規則允許進行指令優化。但代碼邏輯之間是存在一定的先後順序,並發執行時按照不同的執行邏輯會得到不同的結果。

  • 編譯器優化重排序:編譯器在不改變單線程程序語義的前提下,重新安排語句執行順序。
  • 指令級並行重排序:處理器採用了指令級並行技術來將多條指令重疊執行。如果不存在數據依賴性,處理器可以改變語句對應及其的執行順序。
  • 內存系統的重排序:處理器使用緩存和讀/寫緩衝區,使得加載和存儲操作看上去可能是亂序執行。

舉個例來說明一下多線程中可能出現的重排現象:

class ReOrderDemo {      int a = 0;      boolean flag = false;        public void write() {          a = 1;                   //1          flag = true;             //2      }        public void read() {          if (flag) {                //3              int i =  a * a;        //4              ……          }      }  }

在上面的代碼中,單線程執行時,read方法能夠獲得flag的值進行判斷,獲得預期結果。但在多線程的情況下就可能出現不同的結果。

比如,當線程A進行write操作時,由於指令重排,write方法中的代碼執行順序可能會變成下面這樣:

flag = true;             //2  a = 1;                   //1

也就是說可能會先對flag賦值,然後再對a賦值。這在單線程中並不影響最終輸出的結果。

但如果與此同時,B線程在調用read方法,那麼就有可能出現flag為true但a還是0,這時進入第4步操作的結果就為0,而不是預期的1了。

請記住,指令重排只會保證單線程中串行語義執行的一致性,不會關心多線程間語義的一致性。這也是為什麼在寫單例模式時需要考慮添加volatile關鍵詞來修飾,就是為了防止指令重排導致的問題。

JMM提供的解決方案

在了解了原子性、可見性以及有序性問題後,看看JMM是提供了什麼機制來保證這些特性的。

原子性問題,除了JVM自身提供的對基本數據類型讀寫操作的原子性外,對於方法級別或者代碼塊級別的原子性操作,可以使用synchronized關鍵字或者重入鎖(ReentrantLock)保證程序執行的原子性。

而工作內存與主內存同步延遲現象導致的可見性問題,可以使用synchronized關鍵字或者volatile關鍵字解決。它們都可以使一個線程修改後的變量立即對其他線程可見。

對於指令重排導致的可見性問題和有序性問題,則可以利用volatile關鍵字解決。volatile的另一個作用就是禁止重排序優化。

除了靠sychronized和volatile關鍵字之外,JMM內部還定義一套happens-before(先行發生)原則來保證多線程環境下兩個操作間的原子性、可見性以及有序性。

先行發生原則

如果僅靠sychronized和volatile關鍵字來保證原子性、可見性以及有序性,那麼編寫並發程序會十分麻煩。為此在Java內存模型中,還提供了happens-before原則來輔助保證程序執行的原子性、可見性以及有序性的問題。該原則是判斷數據是否存在競爭、線程是否安全的依據。

happens-before規則:

  • 程序次序規則:在一個線程內,程序前面的操作先於後面的操作。
  • 監視器鎖規則:一個unlock操作先於後面對同一個鎖的lock操作發生。
  • volatile變量規則:對一個volatile變量的寫操作先行發生於後面對這個變量的讀操作,也就是說讀取的值肯定是最新的。
  • 線程啟動規則:Thread對象的start()方法調用先行發生於此線程的每一個動作。
  • 線程加入規則:Thread對象的結束先行發生於join()方法返回。
  • 線程中斷規則:對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生,可以通過interrupted()方法檢測到是否有中斷髮生。
  • 對象終結規則:一個對象的初始化完成(構造函數執行結束)先行發生於它的finalize()方法的開始。
  • 傳遞性:如果操作A先行發生於操作B,操作B先行發生於操作C,那麼操作A先行發生於操作C。

還拿上面的具體代碼來進行說明:

class ReOrderDemo {      int a = 0;      boolean flag = false;        public void write() {          a = 1;                   //1          flag = true;             //2      }        public void read() {          if (flag) {                //3              int i =  a * a;        //4              ……          }      }  }

線程A調用write()方法,線程B調用read()方法,線程A先(時間上的先後)於線程B啟動,那麼線程B讀取到a的值是多少呢?

現在依據8條原則來進行對照。

兩個方法分別由線程A和線程B調用,不在同一個線程中,因此程序次序原則不適用。

沒有write()方法和read()方法都沒有使用同步手段,監視器鎖規則不適用。

沒有使用volatile關鍵字,volatile變量原則不適用。

與線程啟動、終止、中斷、對象終結規則、傳遞性都沒有關係,不適用。

因此,線程A和線程B的啟動時間雖然有先後,但線程B執行結果卻是不確定,也是說上述代碼沒有適合8條原則中的任意一條,所以線程B讀取的值自然也是不確定的,換句話說就是線程不安全的。

修復這個問題的方式很簡單,要麼給write()方法和read()方法添加同步手段,如synchronized。或者給變量flag添加volatile關鍵字,確保線程A修改的值對線程B總是可見。

小結

在這篇文章中介紹了Java內存模型中一些原則,及其衍生出來保證這些原則的方式和方法。也是為我們下面學習volatile這個面試官最愛問的關鍵字的做好鋪墊。歡迎關注微信公眾號「程序新視界」繼續學習。

原文鏈接:《Java內存模型相關原則詳解

《面試官》系列文章:

程序新視界:精彩和成長都不容錯過

程序新視界-微信公眾號