每日三道面試題,通往自由的道路10——JMM篇

茫茫人海千千萬萬,感謝這一秒你看到這裡。希望我的面試題系列能對你的有所幫助!共勉!

願你在未來的日子,保持熱愛,奔赴山海!

每日三道面試題,成就更好自我

今天我們還是繼續聊聊多線程的一些其他話題吧!

1. 你知道JVM內存模型嗎?

在Java的並發中採用的就是JVM內存共享模型即JMM(Java Memory Model),它其實是是JVM規範中所定義的一種內存模型,跟計算機的CPU緩存內存模型類似,是基於CPU緩存內存模型來建立的,Java內存模型是標準化的,屏蔽掉了底層不同計算機的區別。

那我們先來講下計算機的內存模型:

其實早期計算機中CPU和內存的速度是差不多的,但在現代計算機中,CPU的指令速度遠超內存的存取速度,由於計算機的存儲設備與處理器的運算速度有幾個數量級的差距,所以現代計算機系統都不得不加入一層讀寫速度儘可能接近處理器運算速度的高速緩存(Cache)來作為內存與處理器之間的緩衝。

將運算需要使用到的數據複製到緩存中,讓運算能快速進行,當運算結束後再從緩存同步回內存之中,這樣處理器就無須等待緩慢的內存讀寫了。

基於高速緩存的存儲交互很好地解決了處理器與內存的速度矛盾,但是也為計算機系統帶來更高的複雜度,因為它引入了一個新的問題:緩存一致性(CacheCoherence)。

在多處理器系統中,每個處理器都有自己的高速緩存,而它們又共享同一主內存(MainMemory)。

而我們可以打開任務管理器,可以進入性能 –> CPU中可以看到L1緩存、L2緩存和L3緩存。

可以看到我們CPU跟我們計算機之間交互的高速緩存。一般的流程,就是計算機會先從硬盤從讀取數據到主內存中,又會從主內存讀取數據到高速緩存中,而CPU讀取的數據就是高速緩存中的數。

我們現在再來看看JMM:

JMM是定義了線程和主內存之間的抽象關係:線程之間的共享變量存在主內存(MainMemory)中,每個線程都有一個私有的本地內存(LocalMemory)即共享變量副本,本地內存中存儲了該線程以讀、寫共享變量的副本。本地內存是Java內存模型的一個抽象概念,並不真實存在。它涵蓋了緩存、寫緩衝區、寄存器等。

JMM模型圖:

我們可以發現在JMM模型中:

  1. 所有的共享變量都存在主內存中。
  2. 每個線程都保存了一份該線程使用到的共享變量的副本。
  3. 線程A是無法直接訪問到線程B的本地內存的,只能訪問主內存。
  4. 線程對共享變量的所有操作都必須在自己的本地內存中進行,不能直接從主內存中讀取。
  5. 並發的三要素:可見性、原子性、有序性,而JMM就主要體現在這三方面。

注意 :因為線程之間無法相互訪問,而一旦某個線程將共享變量進行修改,而線程B是無法發現到這個更新值的,所以可能會出現可見性問題。而這裡的可見性問題就是一個線程對共享變量的修改,另一個線程能夠立刻看到,但此時無法看到更新後的內存,因為訪問的是自己的共享變量副本。

解決方案有

  1. 加鎖,加synchronized、Lock,保存一個線程只能等另一個線程結束後才能再訪問變量。
  2. 對共享變量加上volatile關鍵字,保證了這個變量是可見的。

不錯呀!看來難不住你呀,那咱們繼續

2. 你知道重排序是什麼嗎?

重排序是指計算機在執行程序時,為了提高性能,編譯器和處理器常常會對指令做重排。

首先我們來看看為什麼指令重排序可以提高性能?

每一個指令都會包含多個步驟,每個步驟可能使用不同的硬件,而現代處理器會設計為一個時鐘周期完成一條執行時間最長的指令,為什麼會這樣呢?

主要原理就是可以指令1還沒有執行完,就可以開始執行指令2,而不用等到指令1執行結束之後再執行指令2,這樣就大大提高了效率。

例如:每條指令拆分為五個階段:

想這樣如果是按順序串行執行指令,那可能相對比較慢,因為需要等待上一條指令完成後,才能等待下一步執行:

而如果發生指令重排序呢,實際上雖然不能縮短單條指令的執行時間,但是它變相地提高了指令的吞吐量,可以在一個時鐘周期內同時運行五條指令的不同階段。

我們來分析下代碼的執行情況,並思考下:

a = b + c;

d = e - f ;

按原先的思路,會先加載b和c,再進行b+c操作賦值給a,接下來就會加載e和f,最後就是進行e-f操作賦值給d。

這裡有什麼優化的空間呢?我們在執行b+c操作賦值給a時,可能需要等待b和c加載結束,才能再進行一個求和操作,所以這裡可能出現了一個停頓等待時間,依次後面的代碼也可能會出現停頓等待時間,這降低了計算機的執行效率。

為了去減少這個停頓等待時間,我們可以先加載e和f,然後再去b+c操作賦值給a,這樣做對程序(串行)是沒有影響的,但卻減少了停頓等待時間。既然b+c操作賦值給a需要停頓等待時間,那還不如去做一些有意義的事情。

總結:指令重排對於提高CPU處理性能十分必要。雖然由此帶來了亂序的問題,但是這點犧牲是值得的。

重排序的類型有以下幾種:

指令重排一般分為以下三種:

  • 編譯器優化重排

    編譯器在不改變單線程程序語義的前提下,可以重新安排語句的執行順序。

  • 指令並行重排

    現代處理器採用了指令級並行技術來將多條指令重疊執行。如果不存在數據依賴性(即後一個執行的語句無需依賴前面執行的語句的結果),處理器可以改變語句對應的機器指令的執行順序。

  • 內存系統重排

    由於處理器使用緩存和讀寫緩存沖區,這使得加載(load)和存儲(store)操作看上去可能是在亂序執行,因為三級緩存的存在,導致內存與緩存的數據同步存在時間差。

而在重排序中還需要一個概念的東西:as-if-serial

不管如何重排序,都必須保證代碼在單線程下的運行正確,連單線程下都無法正確,更不用討論多線程並發的情況,所以就提出了一個as-if-serial的概念。

as-if-serial語義的意思是:

  • 不管怎麼重排序,程序的執行結果不能被改變。編譯器、runtime和處理器都必須遵守as-if-serial語義。

  • 為了遵守as-if-serial語義,編譯器和處理器不會對存在數據依賴關係的操作做重排序,因為這種重排序會改變執行結果。(強調一下,這裡所說的數據依賴性僅針對單個處理器中執行的指令序列和單個線程中執行的操作,不同處理器之間和不同線程之間的數據依賴性不被編譯器和處理器考慮)。但是,如果操作之間不存在數據依賴關係,這些操作依然可能被編譯器和處理器重排序。

真的不錯呀,本來我也不是很懂,聽你這麼一講,瞬間恍然大悟呀。那還是最後問你最後一道:

3. happens-before是什麼,和as-if-serial有什麼區別

happens-before的概念:

一方面,程序員需要JMM提供一個強的內存模型來編寫代碼;另一方面,編譯器和處理器希望JMM對它們的束縛越少越好,這樣它們就可以最可能多的做優化來提高性能,希望的是一個弱的內存模型。

JMM考慮了這兩種需求,並且找到了平衡點,對編譯器和處理器來說,只要不改變程序的執行結果(單線程程序和正確同步了的多線程程序),編譯器和處理器怎麼優化都行。

而對於程序員,JMM提供了happens-before規則(JSR-133規範),在JMM中,如果一個線程執行的結果需要對另一個操作進行可見,那麼這兩個操作直接必須存在happens-before關係。

JMM使用happens-before的概念來定製兩個操作之間的執行順序。這並不意味着前一個操作必須要在後一個操作之前執行!happens-before僅僅要求前一個操作(執行的結果)對後一個操作可見,且前一個操作按順序排在第二個操作之前 。

happens-before關係的定義如下:

  1. 如果一個操作happens-before另一個操作,那麼第一個操作的執行結果將對第二個操作可見,而且第一個操作的執行順序排在第二個操作之前。
  2. 兩個操作之間存在happens-before關係,並不意味着Java平台的具體實現必須要按照happens-before關係指定的順序來執行。如果重排序之後的執行結果,與按happens-before關係來執行的結果一致,那麼JMM也允許這樣的重排序。
  3. happens-before關係保證正確同步的多線程程序的執行結果不被重排序改變。

在Java中,有以下天然的Happens-Before規則:

  • 程序順序規則:一個線程中的每一個操作,happens-before於該線程中的任意後續操作。
  • 監視器鎖規則:對一個鎖的解鎖,happens-before於隨後對這個鎖的加鎖。
  • volatile變量規則:對一個volatile域的寫,happens-before於任意後續對這個volatile域的讀。
  • 傳遞性:如果A happens-before B,且B happens-before C,那麼A happens-before C。
  • start規則:如果線程A執行操作ThreadB.start()啟動線程B,那麼A線程的ThreadB.start()操作happens-before於線程B中的任意操作、
  • join規則:如果線程A執行操作ThreadB.join()並成功返回,那麼線程B中的任意操作happens-before於線程A從ThreadB.join()操作成功返回。
  • 線程中斷規則:對線程interrupt()方法的調用happens-before於被中斷線程的代碼檢測到中斷事件的發生。

Happens-Before和as-if-serial的關係實質上是一回事。

  • as-if-serial語義保證單線程內重排序後的執行結果和程序代碼本身應有的結果是一致的,happens-before關係保證正確同步的多線程程序的執行結果不被重排序改變。
  • as-if-serial語義和happens-before這麼做的目的,都是為了在不改變程序執行結果的前提下,儘可能地提高程序執行的並行度。

小夥子不錯嘛!今天就到這裡,期待你明天的到來,希望能讓我繼續保持驚喜!

參考資料:重排序與happens-before

注: 如果文章有任何錯誤和建議,請各位大佬盡情留言!如果這篇文章對你也有所幫助,希望可愛親切的您給個三連關注下,非常感謝啦!