「重磅開篇」形成完善的多線程世界觀
🎓 盡人事,聽天命。博主東南大學碩士在讀,熱愛健身和籃球,樂於分享技術相關的所見所得,關注公眾號 @ 飛天小牛肉,第一時間獲取文章更新,成長的路上我們一起進步
🎁 本文已收錄於 「CS-Wiki」Gitee 官方推薦項目,現已累計 1.6k+ star,致力打造完善的後端知識體系,在技術的路上少走彎路,歡迎各位小夥伴前來交流學習
🍉 如果各位小夥伴春招秋招沒有拿得出手的項目的話,可以參考我寫的一個項目「開源社區系統 Echo」Gitee 官方推薦項目,目前已累計 600+ star,基於 SpringBoot + MyBatis + MySQL + Redis + Kafka + Elasticsearch + Spring Security + … 並提供詳細的開發文檔和配套教程。公眾號後台回復 Echo 可以獲取配套教程,目前尚在更新中
關於這篇文章我很早就想寫了,也一直不敢寫,一方面是早先知識儲備不足,另一方面主要是多線程這部分內容確實比較高深而且每個知識點之間比較零散,讓人摸不着頭腦,不知道該從哪裡下手。而且對於我們學生群體來講,很少有機會接觸到高並發這方面的真實場景,平常自己敲代碼也基本不會用到,所以也導致我們大部分同學都是面向面經學習,你問 synchronized,叭叭叭我能說一堆,你問 volatile,叭叭叭我也能說一堆,但總感覺差點意思,就是這些知識點是零散的,沒有那麼一根線把它們很好的串聯起來。
所以今天我斗膽造一根線,站在小白的角度,講講多線程這部分我們到底要學啥,按照什麼樣的順序去學,幫助各位建立一個比較完善的知識體系,形成正確的多線程世界觀。後續的文章我也基本上會按照這根線寫下來。
然後,我目前也沒有踏入工作崗位,也沒有實際的高並發經驗,所以只是在紙上談兵,學識尚淺,大佬們若覺得有問題懇請評論區或者私聊我指正,晚輩感激不盡(抱拳)。
鍊氣
首先,學習多線程,你肯定得知道線程是啥吧,包括線程的一些基礎概念(比如上下文切換),那麼說到線程,肯定離不開進程。OK,進程和線程這兩個概念其實我們在操作系統這門課中都接觸過,當然並行和並發、同步與異步等這種基本概念咱也默認你學過,那麼你還需要去了解一下 Java 線程和操作系統的線程有啥區別。
另外,容易被大家忽視的一點是,一項技術的出現必定不是憑空捏造的,他一定是為了某個目的而來,在某個成熟的時機應運而生。因此,你需要知道我們為啥要使用多線程,多線程的出現解決了什麼問題。
掌握上面這一步,我們稱之為鍊氣,所謂煉精化氣,起步階段需一心一意、沉心靜氣。
築基
現在我們已經知道線程是啥了,那在 Java 中如何創建線程呢?為此你會接觸到三種創建線程(Thread)的方式:
- 直接使用 Thread
- Thread + Runnable
- Thread + Callable + FutureTask
學會了如何創建線程,我們去翻一翻 Thread 類的源碼,你會發現其中定義了 Java 線程的六種狀態,也就是所謂的生命周期,它和操作系統中線程的五態模型又有啥區別和聯繫呢?
既然都翻了 Thread 源碼,豈有不深究的道理?我們接下來去學習一下 Thread 類給我們提供了哪些控制線程的方法,它們分別能幹啥,怎樣影響了線程的狀態:
- start / run
- sleep / yield
- join / join(long n)
- interrupt
- setDaemon 守護線程
這一階段的學習,也就是入門階段後的第一步,我們稱之為築基。基礎不牢,地動山搖。
金丹
誠然,一個程序順序的運行多個線程本身是沒有問題的,但是如果多個線程同時訪問了某個共享資源,就可能會發生不可預知的現象,也就是我們常說的線程安全問題,要了解這些問題產生的根本原因,我們就需要去深刻的了解 Java 內存模型(Java Memory Model,JMM)。
為此,我們會學習到和線程安全息息相關的三大性質:
1)原子性:一個操作是不可中斷的,要麼全部執行成功要麼全部執行失敗(也可以說是提供互斥訪問,同一時刻只能有一個線程對數據進行操作)
2)可見性:當一個線程修改了共享變量後,其他線程能夠立即得知這個修改
3)有序性(或者說重排序):重排序是編譯器和處理器為了優化程序性能而對指令序列進行重新排序的一種手段。由於重排序的存在,可能導致多線程環境下程序運行結果出錯的問題。
那麼編譯器和處理器在重排序時會遵守什麼原則呢?為此你會了解到數據依賴性和 as-if-serial,這裡簡單介紹一下這兩個概念:
- 編譯器和處理器在重排序時,會遵守數據依賴性,它們不會改變存在數據依賴性關係的兩個操作的執行順序
- as-if-serial 語義的意思是:不管怎麼重排序,程序的執行結果不能被改變。編譯器,runtime 和處理器都必須遵守 as-if-serial 語義
事實上,可見性和有序性其實是互相矛盾的兩點。一方面,對於程序員來說,我們希望內存模型易於理解、易於編程,為此 JMM 的設計者要為程序員提供足夠強的內存可見性保證,專業術語稱之為 「強內存模型」。而另一方面,編譯器和處理器則希望內存模型對它們的束縛越少越好,這樣它們就可以做儘可能多的優化(比如重排序)來提高性能,因此 JMM 的設計者對編譯器和處理器的限制要儘可能地放鬆,專業術語稱之為 「弱內存模型」。
當然,對於這個問題,JMM 的設計者找到了一個很好的平衡點,那就是 happens-before,這是 JMM 最核心的概念!理解 happens-before 是理解 JMM 的關鍵。
知其然而知其所以然,這一階段,我們稱為金丹。
渡劫
具體到 Java 語言層面,是怎麼保證線程安全的呢?也就是如何保證原子性、可見性和有序性呢?(保證有序性上文已經說過了,就是使用 happens-before 原則)。
1)對於可見性,可以使用 volatile
關鍵字來保證。不僅如此,volatile
還能起到禁止指令重排的作用;
2)對於原子性,我們可以使用 鎖 和 java.util.concurrent.atomic
包中的原子類來保證。(給萌新解釋一下,java.util.concurrent,簡稱 J.U.C,就是一個包,也成為並發包。現在網上大部分博客都會直接說 JUC,對萌新不是很友好),我們可以看看 juc.atomic 中有哪些類:
當然, atomic 包下這些原子操作類保證原子性最關鍵的原因還是因為它們使用了 CAS 操作,於是,你需要先去深入學習一下 CAS,了解 CAS 存在的三個問題,然後再去挖一挖這些原子類的底層原理。
另外,上面我們提到的鎖這個話題其實又是一個非常核心的知識點,在深入學習之前,你需要了解一下各種鎖的概念:
- 悲觀鎖和樂觀鎖
- 重量級鎖和輕量級鎖
- 自旋鎖
- 偏向鎖
- 重入鎖和不可重入鎖
- 公平鎖和非公平鎖
- 共享鎖和排他鎖
另外,與鎖相關的概念的還有臨界區、競態條件等,這些你都是要去了解的。
那麼鎖在 Java 中具體是怎麼實現的呢?早先 Java 程序是靠 synchronized
關鍵字實現鎖功能的,在我們掌握了 synchronized
的使用方式以及底層原理後,你還會接觸到與 synchronized
配套的 wait/notify/notifyAll
方法。
在 Java SE 5 之後,並發包 JUC 中新增了 Lock
接口以及相關實現類(放在 java.util.concurrent.locks
包下)也可以用來實現鎖功能。
為什麼會新增這樣一個 Lock
接口及其相關實現類呢?因為使用 synchronized
關鍵字會隱式地獲取鎖,但是它將鎖的獲取和釋放固化了,也就是先獲取再釋放。當然,這種方式簡化了同步的管理,可是擴展性沒有顯示的鎖獲取和釋放來的好。
例如,針對一個場景,手把手進行鎖獲取和釋放,先獲得鎖 A,然後再獲取鎖 B,當鎖 B 獲得後,釋放鎖 A 同時獲取鎖 C,當鎖 C 獲得後,再釋放 B 同時獲取鎖 D,以此類推。這種場景下,如果使用 synchronized
關鍵字就不那麼容易實現了,而使用 Lock
卻容易許多。
它提供了與 synchronized
關鍵字類似的同步功能,只是在使用時需要顯式地獲取和釋放鎖。雖然它缺少了隱式獲取釋放鎖的便捷性,但是卻擁有了鎖獲取與釋放的可操作性、可中斷的獲取鎖以及超時獲取鎖等多種 synchronized
關鍵字所不具備的同步特性。
另外,還有一點非常重要的是!我們可以去翻一翻實現了 Lock
接口的類,比如 ReentrantLock
(大部分文章都會直接把它翻譯成重入鎖),你會驚訝的發現它並沒有多少代碼,基本所有的方法都是調用了其靜態內部類 Sync
中的方法,而 Sync
類繼承了 AbstractQueuedSynchronizer
類(也就是大名鼎鼎的 AQS,譯為隊列同步器,簡稱同步器)。
可以把 AQS 理解為一個用來構建鎖和同步器(工具類)的框架,locks 包中的各種鎖以及接下來我們會學習的 JUC 中的工具類都是基於 AQS 來實現的。
OK,關於 AQS 這篇文章就不再多說了。上面我們提到了兩個並發關鍵字,synchronized
和 volatile
,其實還有一個,那就是 final
,可能很多小夥伴都不知道,啥?final
和並發有啥關係?當然,這些,後續文章都會寫的。
本階段的知識非常重要,並且相對來說知識點比較多也比較難,因此我們稱之為渡劫。
大乘
渡劫完畢,走到這一步各位對多線程基本的知識架構已經有了一定的認知,世界觀已經初步形成,最後,就是補強的過程了,我們來看看 J.U.C 這個包還有什麼東西(下圖沒有截全):
JUC 其實可以分為五大類:
- Lock 框架(locks 包)
- 原子類(atomic 包)
- 並發集合
- 線程池
- 工具類
後面三種正是我們在這一階段需要學習的。並發集合和線程池就沒啥好說的了,它們的知識點都比較集中,學習目標也很明確,網絡上很容易就能找到一篇條理清晰的文章。
然後常用的工具類還是有必要學習下:
CountDownLatch
CyclicBarrier
Semaphore
Exchanger
所謂工具類嘛,那一定是封裝了某些比較複雜的操作,使我們可以很簡單的去完成這些操作。以 CountDownLatch 為例:在多線程協作完成業務功能時,有時候需要等待其他多個線程完成任務之後,主線程才能繼續往下執行業務功能,在這種的業務場景下,通常可以使用 Thread 類的 join 方法,讓主線程等待被 join 的線程執行完之後,主線程才能繼續往下執行。而 Java 並發工具類中為我們提供了這樣一個類似 「倒計時」 的工具類 CountDownLatch,可以十分方便的完成這種業務場景。
另外,還有一個比較重要的類,我也不知道怎麼給它分類,就是 ThreadLocal
,江湖人稱線程隔離術,必問高階考點。
OK,學完了本階段,多線程世界觀已完整形成,我們稱之為大乘,忘我之境,全在己心。
🎉 關注公眾號 | 飛天小牛肉,即時獲取更新
- 博主東南大學碩士在讀,利用課餘時間運營一個公眾號『 飛天小牛肉 』,2020/12/29 日開通,專註分享計算機基礎(數據結構 + 算法 + 計算機網絡 + 數據庫 + 操作系統 + Linux)、Java 基礎和面試指南的相關原創技術好文。本公眾號的目的就是讓大家可以快速掌握重點知識,有的放矢。希望大家多多支持哦,和小牛肉一起成長 😃
- 並推薦個人維護的開源教程類項目: CS-Wiki(Gitee 推薦項目,現已累計 1.6k+ star), 致力打造完善的後端知識體系,在技術的路上少走彎路,歡迎各位小夥伴前來交流學習 ~ 😊
- 如果各位小夥伴春招秋招沒有拿得出手的項目的話,可以參考我寫的一個項目「開源社區系統 Echo」Gitee 官方推薦項目,目前已累計 600+ star,基於 SpringBoot + MyBatis + MySQL + Redis + Kafka + Elasticsearch + Spring Security + … 並提供詳細的開發文檔和配套教程。公眾號後台回復 Echo 可以獲取配套教程,目前尚在更新中。