硬核剖析ThreadLocal源碼,面試官看了直呼內行
工作面試中經常遇到ThreadLocal,但是很多同學並不了解ThreadLocal實現原理,到底為什麼會發生記憶體泄漏也是一知半解?今天一燈帶你深入剖析ThreadLocal源碼,總結ThreadLocal使用規範,解析ThreadLocal高頻面試題。
1. ThreadLocal是什麼
ThreadLocal是執行緒本地變數,就是執行緒的私有變數,不同執行緒之間相互隔離,無法共享,相當於每個執行緒拷貝了一份變數的副本。
目的就是在多執行緒環境中,無需加鎖,也能保證數據的安全性。
2. ThreadLocal的使用
/**
* @author 一燈架構
* @apiNote ThreadLocal示例
**/
public class ThreadLocalDemo {
// 1. 創建ThreadLocal
static ThreadLocal<String> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
// 2. 給ThreadLocal賦值
threadLocal.set("關注公眾號:一燈架構");
// 3. 從ThreadLocal中取值
String result = threadLocal.get();
System.out.println(result); // 輸出 關注公眾號:一燈架構
// 4. 刪除ThreadLocal中的數據
threadLocal.remove();
System.out.println(threadLocal.get()); // 輸出null
}
}
ThreadLocal的用法非常簡單,創建ThreadLocal的時候指定泛型類型,然後就是賦值、取值、刪除值的操作。
不同執行緒之間,ThreadLocal數據是隔離的,測試一下:
/**
* @author 一燈架構
* @apiNote ThreadLocal示例
**/
public class ThreadLocalDemo {
// 1. 創建ThreadLocal
static ThreadLocal<Integer> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
IntStream.range(0, 5).forEach(i -> {
// 創建5個執行緒,分別給threadLocal賦值、取值
new Thread(() -> {
// 2. 給ThreadLocal賦值
threadLocal.set(i);
// 3. 從ThreadLocal中取值
System.out.println(Thread.currentThread().getName()
+ "," + threadLocal.get());
}).start();
});
}
}
輸出結果:
Thread-2,2
Thread-4,4
Thread-1,1
Thread-0,0
Thread-3,3
可以看出不同執行緒之間的ThreadLocal數據相互隔離,互不影響,這樣的實現效果有哪些應用場景呢?
3. ThreadLocal應用場景
ThreadLocal的應用場景主要分為兩類:
-
避免對象在方法之間層層傳遞,打破層次間約束。
比如用戶資訊,在很多地方都需要用到,層層往下傳遞,比較麻煩。這時候就可以把用戶資訊放到ThreadLocal中,需要的地方可以直接使用。
-
拷貝對象副本,減少初始化操作,並保證數據安全。
比如資料庫連接、Spring事務管理、SimpleDataFormat格式化日期,都是使用的ThreadLocal,即避免每個執行緒都初始化一個對象,又保證了多執行緒下的數據安全。
使用ThreadLocal保證SimpleDataFormat格式化日期的執行緒安全,程式碼類似下面這樣:
/**
* @author 一燈架構
* @apiNote ThreadLocal示例
**/
public class ThreadLocalDemo {
// 1. 創建ThreadLocal
static ThreadLocal<SimpleDateFormat> threadLocal =
ThreadLocal.withInitial(() -> new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"));
public static void main(String[] args) {
IntStream.range(0, 5).forEach(i -> {
// 創建5個執行緒,分別從threadLocal取出SimpleDateFormat,然後格式化日期
new Thread(() -> {
try {
System.out.println(threadLocal.get().parse("2022-11-11 00:00:00"));
} catch (ParseException e) {
throw new RuntimeException(e);
}
}).start();
});
}
}
4. ThreadLocal實現原理
ThreadLocal底層使用ThreadLocalMap存儲數據,而ThreadLocalMap內部是一個數組,數組裡面存儲的是Entry對象,Entry對象裡面使用key-value存儲數據,key是ThreadLocal實例對象本身,value是ThreadLocal的泛型對象值。
4.1 ThreadLocalMap源碼
static class ThreadLocalMap {
// Entry對象,WeakReference是弱引用,當沒有引用指向時,會被GC回收
static class Entry extends WeakReference<ThreadLocal<?>> {
// ThreadLocal泛型對象值
Object value;
// 構造方法,傳參是key-value
// key是ThreadLocal對象實例,value是ThreadLocal泛型對象值
Entry(ThreadLocal<?> k, Object v) {
super(k);
value = v;
}
}
// Entry數組,用來存儲ThreadLocal數據
private Entry[] table;
// 數組的默認容量大小
private static final int INITIAL_CAPACITY = 16;
// 擴容的閾值,默認是數組大小的三分之二
private int threshold;
private void setThreshold(int len) {
threshold = len * 2 / 3;
}
}
4.2 set方法源碼
// 給ThreadLocal設值
public void set(T value) {
// 獲取當前執行緒對象
Thread t = Thread.currentThread();
// 獲取此執行緒對象中的ThreadLocalMap對象
ThreadLocalMap map = getMap(t);
// 如果ThreadLocal已經設過值,直接設值,否則初始化
if (map != null)
// 設值的key就是當前ThreadLocal對象實例,value是ThreadLocal泛型對象值
map.set(this, value);
else
// 初始化ThreadLocalMap
createMap(t, value);
}
再看一下實際的set方法源碼:
// key就是當前ThreadLocal對象實例,value是ThreadLocal泛型對象值
private void set(ThreadLocal<?> key, Object value) {
// 獲取ThreadLocalMap中的Entry數組
Entry[] tab = table;
int len = tab.length;
// 計算key在數組中的下標,也就是ThreadLocal的hashCode和數組大小-1取余
int i = key.threadLocalHashCode & (len - 1);
// 查找流程:從下標i開始,判斷下標位置是否有值,
// 如果有值判斷是否等於當前ThreadLocal對象實例,等於就覆蓋,否則繼續向後遍曆數組,直到找到空位置
for (Entry e = tab[i];
e != null;
// nextIndex 就是讓在不超過數組長度的基礎上,把數組的索引位置 + 1
e = tab[i = nextIndex(i, len)]) {
ThreadLocal<?> k = e.get();
// 如果等於當前ThreadLocal對象實例,直接覆蓋
if (k == key) {
e.value = value;
return;
}
// 當前key是null,說明ThreadLocal對象實例已經被GC回收了,直接覆蓋
if (k == null) {
replaceStaleEntry(key, value, i);
return;
}
}
// 找到空位置,創建Entry對象
tab[i] = new Entry(key, value);
int sz = ++size;
// 當數組大小大於等於擴容閾值(數組大小的三分之二)時,進行擴容
if (!cleanSomeSlots(i, sz) && sz >= threshold)
rehash();
}
set方法具體流程如下:
從源碼和流程圖中得知,ThreadLocal是通過線性探測法解決哈希衝突的,線性探測法具體賦值流程如下:
- 通過key的hashcode找到數組下標
- 如果數組下標位置是空或者等於當前ThreadLocal對象,直接覆蓋值結束
- 如果不是空,就繼續向下遍歷,遍歷到數組結尾後,再從頭開始遍歷,直到找到數組為空的位置,在此位置賦值結束
線性探測法這種特殊的賦值流程,導致取值的時候,也要走一遍類似的流程。
4.3 get方法源碼
// 從ThreadLocal從取值
public T get() {
// 獲取當前執行緒對象
Thread t = Thread.currentThread();
// 獲取此執行緒對象中的ThreadLocalMap對象
ThreadLocalMap map = getMap(t);
if (map != null) {
// 通過ThreadLocal實例對象作為key,在Entry數組中查找數據
ThreadLocalMap.Entry e = map.getEntry(this);
// 如果不為空,表示找到了,直接返回
if (e != null) {
T result = (T)e.value;
return result;
}
}
// 如果ThreadLocalMap是null,就執行初始化ThreadLocalMap操作
return setInitialValue();
}
再看一下具體的遍歷Entry數組的邏輯:
// 具體的遍歷Entry數組的方法
private Entry getEntry(ThreadLocal<?> key) {
// 通過hashcode計算數組下標位置
int i = key.threadLocalHashCode & (table.length - 1);
Entry e = table[i];
// 如果下標位置對象不為空,並且等於當前ThreadLocal實例對象,直接返回
if (e != null && e.get() == key)
return e;
else
// 如果不是,需要繼續向下遍歷Entry數組
return getEntryAfterMiss(key, i, e);
}
再看一下線性探測法特殊的取值方法:
// 如果不是,需要繼續向下遍歷Entry數組
private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
Entry[] tab = table;
int len = tab.length;
// 循環遍曆數組,直到找到ThreadLocal對象,或者遍歷到數組為空的位置
while (e != null) {
ThreadLocal<?> k = e.get();
// 如果等於當前ThreadLocal實例對象,表示找到了,直接返回
if (k == key)
return e;
// key是null,表示ThreadLocal實例對象已經被GC回收,就幫忙清除value
if (k == null)
expungeStaleEntry(i);
else
// 索引位置+1,表示繼續向下遍歷
i = nextIndex(i, len);
e = tab[i];
}
return null;
}
// 索引位置+1,表示繼續向下遍歷,遍歷到數組結尾,再從頭開始遍歷
private static int nextIndex(int i, int len) {
return ((i + 1 < len) ? i + 1 : 0);
}
ThreadLocal的get方法流程如下:
4.4 remove方法源碼
remove方法流程跟set、get方法類似,都是遍曆數組,找到ThreadLocal實例對象後,刪除key、value,再刪除Entry對象結束。
public void remove() {
// 獲取當前執行緒的ThreadLocalMap對象
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null)
m.remove(this);
}
// 具體的刪除方法
private void remove(ThreadLocal<?> key) {
ThreadLocal.ThreadLocalMap.Entry[] tab = table;
int len = tab.length;
// 計算數組下標
int i = key.threadLocalHashCode & (len - 1);
// 遍曆數組,直到找到空位置,
// 或者值等於當前ThreadLocal對象,才結束
for (ThreadLocal.ThreadLocalMap.Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
// 找到後,刪除key、value,再刪除Entry對象
if (e.get() == key) {
e.clear();
expungeStaleEntry(i);
return;
}
}
}
5. ThreadLocal使用注意事項
使用ThreadLocal結束,一定要調用remove方法,清理掉threadLocal數據。具體流程類似下面這樣:
/**
* @author 一燈架構
* @apiNote ThreadLocal示例
**/
public class ThreadLocalDemo {
// 1. 創建ThreadLocal
static ThreadLocal<User> threadLocal = new ThreadLocal<>();
public void method() {
try {
User user = getUser();
// 2. 給threadLocal賦值
threadLocal.set(user);
// 3. 執行其他業務邏輯
doSomething();
} finally {
// 4. 清理threadLocal數據
threadLocal.remove();
}
}
}
如果忘了調用remove方法,可能會導致兩個嚴重的問題:
-
導致記憶體溢出
如果執行緒的生命周期很長,一直往ThreadLocal中放數據,卻沒有刪除,最終產生OOM
-
導致數據錯亂
如果使用了執行緒池,一個執行緒執行完任務後並不會被銷毀,會繼續執行下一個任務,導致下個任務訪問到了上個任務的數據。
6. 常見面試題剖析
看完了ThreadLocal源碼,再回答幾道面試題,檢驗一下學習成果怎麼樣。
6.1 ThreadLocal是怎麼保證數據安全性的?
ThreadLocal底層使用的ThreadLocalMap存儲數據,而ThreadLocalMap是執行緒Thread的私有變數,不同執行緒之間數據隔離,所以即使ThreadLocal的set、get、remove方法沒有加鎖,也能保證執行緒安全。
6.2 ThreadLocal底層為什麼使用數組?而不是一個對象?
因為在一個執行緒中可以創建多個ThreadLocal實例對象,所以要用數組存儲,而不是用一個對象。
6.3 ThreadLocal是怎麼解決哈希衝突的?
ThreadLocal使用的線性探測法法解決哈希衝突,線性探測法法具體賦值流程如下:
- 通過key的hashcode找到數組下標
- 如果數組下標位置是空或者等於當前ThreadLocal對象,直接覆蓋值結束
- 如果不是空,就繼續向下遍歷,遍歷到數組結尾後,再從頭開始遍歷,直到找到數組為空的位置,在此位置賦值結束
6.4 ThreadLocal為什麼要用線性探測法解決哈希衝突?
我們都知道HashMap採用的是鏈地址法(也叫拉鏈法)解決哈希衝突,為什麼ThreadLocal要用線性探測法解決哈希衝突?而不用鏈地址法呢?
我的猜想是可能是創作者偷懶、嫌麻煩,或者是ThreadLocal使用量較少,出現哈希衝突概率較低,不想那麼麻煩。
使用鏈地址法需要引入鏈表和紅黑樹兩種數據結構,實現更複雜。而線性探測法沒有引入任何額外的數據結構,直接不斷遍曆數組。
結果就是,如果一個執行緒中使用很多個ThreadLocal,發生哈希衝突後,ThreadLocal的get、set性能急劇下降。
線性探測法相比鏈地址法優缺點都很明顯:
優點: 實現簡單,無需引入額外的數據結構。
缺點: 發生哈希衝突後,ThreadLocal的get、set性能急劇下降。
6.5 ThreadLocalMap的key為什麼要設計成弱引用?
先說一下弱引用的特點:
弱引用的對象擁有更短暫的生命周期,在垃圾回收器執行緒掃描它所管轄的記憶體區域的過程中,一旦發現了只具有弱引用的對象,不管當前記憶體空間足夠與否,都會回收它的記憶體。 不過,由於垃圾回收器是一個優先順序很低的執行緒,因此不一定會很快發現那些只具有弱引用的對象。
ThreadLocalMap的key設計成弱引用後,會不會我們正在使用,就被GC回收了?
這個是不會的,因為我們一直在強引用著ThreadLocal實例對象。
/**
* @author 一燈架構
* @apiNote ThreadLocal示例
**/
public class ThreadLocalDemo {
// 1. 創建ThreadLocal
static ThreadLocal<String> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
// 2. 給ThreadLocal賦值
threadLocal.set("關注公眾號:一燈架構");
// 3. 從ThreadLocal中取值
String result = threadLocal.get();
// 手動觸發GC
System.gc();
System.out.println(result); // 輸出 關注公眾號:一燈架構
}
}
由上面程式碼中得知,如果我們一直在使用threadLocal,觸發GC後,並不會threadLocal實例對象。
ThreadLocalMap的key設計成弱引用的目的就是:
防止我們在使用完ThreadLocal後,忘了調用remove方法刪除數據,導致數組中ThreadLocal數據一直不被回收。
/**
* @author 一燈架構
* @apiNote ThreadLocal示例
**/
public class ThreadLocalDemo {
// 1. 創建ThreadLocal
static ThreadLocal<String> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
// 2. 給ThreadLocal賦值
threadLocal.set("關注公眾號:一燈架構");
// 3. 使用完threadLocal,設置成null,模仿生命周期結束
threadLocal = null;
// 觸發GC,這時候ThreadLocalMap的key就會被回收,但是value還沒有被回收。
// 只有等到下次執行get、set方法遍曆數組,遍歷到這個位置,才會刪除這個無效的value
System.gc();
}
}
6.6 ThreadLocal為什麼會出現記憶體泄漏?
ThreadLocal出現記憶體泄漏的原因,就是我們使用完ThreadLocal沒有執行remove方法刪除數據。
具體是哪些數據過多導致的記憶體泄漏呢?
一個是數組的Entry對象,Entry對象中key、value分別是ThreadLocal實例對象和泛型對象值。
因為我們在使用ThreadLocal的時候,總愛把ThreadLocal設置成類的靜態變數,直到執行緒生命周期結束,ThreadLocal對象數據才會被回收。
另一個是數組中Entry對象的value值,也就是泛型對象值。雖然ThreadLocalMap的key被設置成弱引用,會被GC回收,但是value並沒有被回收。需要等到下次執行get、set方法遍曆數組,遍歷到這個位置,才會刪除這個無效的value。這也是造成記憶體泄漏的原因之一。
6.7 怎麼實現父子執行緒共享ThreadLocal數據?
只需要InheritableThreadLocal即可,當初始化子執行緒的時候,會從父執行緒拷貝ThreadLocal數據。
/**
* @author 一燈架構
* @apiNote ThreadLocal示例
**/
public class ThreadLocalDemo {
// 1. 創建可被子執行緒繼承數據的ThreadLocal
static ThreadLocal<String> threadLocal = new InheritableThreadLocal<>();
public static void main(String[] args) {
// 2. 給ThreadLocal賦值
threadLocal.set("關注公眾號:一燈架構");
// 3. 啟動一個子執行緒,看是否能獲取到主執行緒數據
new Thread(() -> {
System.out.println(threadLocal.get()); // 輸出 關注公眾號:一燈架構
}).start();
}
}
我是「一燈架構」,如果本文對你有幫助,歡迎各位小夥伴點贊、評論和關注,感謝各位老鐵,我們下期見