自己動手寫線程池——向JDK線程池進發
自己動手寫線程池——向JDK線程池進發
前言
在前面的文章自己動手寫乞丐版線程池中,我們寫了一個非常簡單的線程池實現,這個只是一個非常簡單的實現,在本篇文章當中我們將要實現一個和JDK內部實現的線程池非常相似的線程池。
JDK線程池一瞥
我們首先看一個JDK給我們提供的線程池ThreadPoolExecutor
的構造函數的參數:
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)
參數解釋:
- corePoolSize:這個參數你可以理解為線程池當中至少需要 corePoolSize 個線程,初始時線程池當中線程的個數為0,當線程池當中線程的個數小於 corePoolSize 每次提交一個任務都會創建一個線程,並且先執行這個提交的任務,然後再去任務隊列裏面去獲取新的任務,然後再執行。
- maximumPoolSize:這個參數指的是線程池當中能夠允許的最大的線程的數目,當任務隊列滿了之後如果這個時候有新的任務想要加入隊列當中,當發現隊列滿了之後就創建新的線程去執行任務,但是需要滿足最大的線程的個數不能夠超過 maximumPoolSize 。
- keepAliveTime 和 unit:這個主要是用於時間的表示,當隊列當中多長時間沒有數據的時候線程自己退出,前面談到了線程池當中任務過多的時候會超過 corePoolSize ,當線程池閑下來的時候這些多餘的線程就可以退出了。
- workQueue:這個就是用於保存任務的阻塞隊列。
- threadFactory:這個參數倒不是很重要,線程工廠。
- handler:這個表示拒絕策略,JDK給我們提供了四種策略:
- AbortPolicy:拋出異常。
- DiscardPolicy:放棄這個任務。
- CallerRunPolicy:提交任務的線程執行。
- DiscardOldestPolicy:放棄等待時間最長的任務。
如果上面的參數你不能夠理解,可以先閱讀這篇文章自己動手寫乞丐版線程池。基於上面談到的參數,線程池當中提交任務的流程大致如下圖所示:
自己動手實現線程池
根據前面的參數分析我們自己實現的線程池需要實現一下功能:
- 能夠提交Runnable的任務和Callable的任務。
- 線程池能夠自己實現動態的擴容和所容,動態調整線程池當中線程的數目,當任務多的時候能夠增加線程的數目,當任務少的時候多出來的線程能夠自動退出。
- 有自己的拒絕策略,當任務隊列滿了,線程數也達到最大的時候,需要拒絕提交的任務。
線程池參數介紹
private AtomicInteger ct = new AtomicInteger(0); // 當前在執行任務的線程個數
private int corePoolSize;
private int maximumPoolSize;
private long keepAliveTime;
private TimeUnit unit;
private BlockingQueue<Runnable> taskQueue;
private RejectPolicy policy;
private ArrayList<Worker> workers = new ArrayList<>();
private volatile boolean isStopped;
private boolean useTimed;
參數解釋如下:
-
ct:表示當前線程池當中線程的個數。
-
corePoolSize:線程池當中核心線程的個數,意義和上面談到的JDK的線程池意義一致。
-
maximumPoolSize:線程池當中最大的線程個數,意義和上面談到的JDK的線程池意義一致。
-
keepAliveTime 和 unit:和JDK線程池的參數意義一致。
-
taskQueue:任務隊列,用不保存提交的任務。
-
policy:拒絕策略,主要有一下四種策略:
public enum RejectPolicy {
ABORT,
CALLER_RUN,
DISCARD_OLDEST,
DISCARD
}
- workers:用於保存工作線程。
- isStopped:線程池是否被關閉了。
- useTimed:主要是用於表示是否使用上面的 keepAliveTime 和 unit,如果使用就是在一定的時間內,如果沒有從任務隊列當中獲取到任務,線程就從線程池退出,但是需要保證線程池當中最小的線程個數不小於 corePoolSize 。
實現Runnable
// 下面這個方法是向線程池提交任務
public void execute(Runnable runnable) throws InterruptedException {
checkPoolState();
if (addWorker(runnable, false) // 如果能夠加入新的線程執行任務 加入成功就直接返回
|| !taskQueue.offer(runnable) // 如果 taskQueue.offer(runnable) 返回 false 說明提交任務失敗 任務隊列已經滿了
|| addWorker(runnable, true)) // 使用能夠使用的最大的線程數 (maximumPoolSize) 看是否能夠產生新的線程
return;
// 如果任務隊列滿了而且不能夠加入新的線程 則拒絕這個任務
if (!taskQueue.offer(runnable))
reject(runnable);
}
在上面的代碼當中:
- checkPoolState函數是檢查線程池的狀態,當線程池被停下來之後就不能夠在提交任務:
private void checkPoolState() {
if (isStopped) {
// 如果線程池已經停下來了,就不在向任務隊列當中提交任務了
throw new RuntimeException("thread pool has been stopped, so quit submitting task");
}
}
- addWorker函數是往線程池當中提交任務並且產生一個線程,並且這個線程執行的第一個任務就是傳遞的參數。max表示線程的最大數目,max == true 的時候表示使用 maximumPoolSize 否則使用 corePoolSize,當返回值等於 true 的時候表示執行成功,否則表示執行失敗。
/**
*
* @param runnable 需要被執行的任務
* @param max 是否使用 maximumPoolSize
* @return boolean
*/
public synchronized boolean addWorker(Runnable runnable, boolean max) {
if (ct.get() >= corePoolSize && !max)
return false;
if (ct.get() >= maximumPoolSize && max)
return false;
Worker worker = new Worker(runnable);
workers.add(worker);
Thread thread = new Thread(worker, "ThreadPool-" + "Thread-" + ct.addAndGet(1));
thread.start();
return true;
}
實現Callable
這個函數其實比較簡單,只需要將傳入的Callable對象封裝成一個FutureTask對象即可,因為FutureTask實現了Callable和Runnable兩個接口,然後將這個結果返回即可,得到這個對象,再調用對象的 get 方法就能夠得到結果。
public <V> RunnableFuture<V> submit(Callable<V> task) throws InterruptedException {
checkPoolState();
FutureTask<V> futureTask = new FutureTask<>(task);
execute(futureTask);
return futureTask;
}
拒絕策略的實現
根據前面提到的各種策略的具體實現方式,具體的代碼實現如下所示:
private void reject(Runnable runnable) throws InterruptedException {
switch (policy) {
case ABORT:
throw new RuntimeException("task queue is full");
case CALLER_RUN:
runnable.run();
case DISCARD: // 直接放棄這個任務
return;
case DISCARD_OLDEST:
// 放棄等待時間最長的任務 也就是隊列當中的第一個任務
taskQueue.poll();
execute(runnable); // 重新執行這個任務
}
}
線程池關閉實現
一共兩種方式實現線程池關閉:
- 直接關閉線程池,不管任務隊列當中的任務是否被全部執行完成。
- 安全關閉線程池,先等待任務隊列當中所有的任務被執行完成,再關閉線程池,但是在這個過程當中不允許繼續提交任務了,這一點已經在函數 checkPoolState 當中實現了。
// 強制關閉線程池
public synchronized void stop() {
isStopped = true;
for (Worker worker : workers) {
worker.stopWorker();
}
}
public synchronized void shutDown() {
// 先表示關閉線程池 線程就不能再向線程池提交任務
isStopped = true;
// 先等待所有的任務執行完成再關閉線程池
waitForAllTasks();
stop();
}
private void waitForAllTasks() {
// 當線程池當中還有任務的時候 就不退出循環
while (taskQueue.size() > 0) {
Thread.yield();
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
工作線程的工作實現
@Override
public void run() {
// 先執行傳遞過來的第一個任務 這裡是一個小的優化 讓線程直接執行第一個任務 不需要
// 放入任務隊列再取出來執行了
firstTask.run();
thisThread = Thread.currentThread();
while (!isStopped) {
try {
// 是否使用時間就在這裡顯示出來了
Runnable task = useTimed ? taskQueue.poll(keepAliveTime, unit) : taskQueue.take();
if (task == null) {
int i;
boolean exit = true;
// 如果當前線程數大於核心線程數 則使用 CAS 去退出 用於保證在線程安全下的退出
// 且保證線程的個數不小於 corePoolSize 下面這段代碼需要仔細分析一下
if (ct.get() > corePoolSize) {
do{
i = ct.get();
if (i <= corePoolSize) {
exit = false;
break;
}
}while (!ct.compareAndSet(i, i - 1));
if (exit) {
return;
}
}
}else {
task.run();
}
} catch (InterruptedException e) {
// do nothing
}
}
}
我們現在來仔細分析一下,線程退出線程池的時候是如何保證線程池當中總的線程數是不小於 corePoolSize 的!首先整體的框架是使用 CAS 進行實現,具體代碼為 do … while 操作,然後在 while 操作裏面使用 CAS 進行測試替換,如果沒有成功再次獲取 ,當線程池當中核心線程的數目小於等於 corePoolSize 的時候也需要退出循環,因為線程池當中線程的個數不能小於 corePoolSize 。因此使用 break 跳出循環的線程是不會退出線程池的。
線程池實現的BUG
在我們自己實現的線程池當中當線程退出的時候,workers 當中還保存這指向這個線程的對象,但是當線程退出的時候我們還沒有在 workers 當中刪除這個對象,因此這個線程對象不會被垃圾回收器收集掉,但是我們這個只是一個線程池實現的例子而已,並不用於生產環境,只是為了幫助大家理解線程池的原理。
完整代碼
package cscore.concurrent.java.threadpoolv2;
import java.util.ArrayList;
import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;
public class ThreadPool {
private AtomicInteger ct = new AtomicInteger(0); // 當前在執行任務的線程個數
private int corePoolSize;
private int maximumPoolSize;
private long keepAliveTime;
private TimeUnit unit;
private BlockingQueue<Runnable> taskQueue;
private RejectPolicy policy;
private ArrayList<Worker> workers = new ArrayList<>();
private volatile boolean isStopped;
private boolean useTimed;
public int getCt() {
return ct.get();
}
public ThreadPool(int corePoolSize, int maximumPoolSize, TimeUnit unit, long keepAliveTime, RejectPolicy policy
, int maxTasks) {
// please add -ea to vm options to make assert keyword enable
assert corePoolSize > 0;
assert maximumPoolSize > 0;
assert keepAliveTime >= 0;
assert maxTasks > 0;
this.corePoolSize = corePoolSize;
this.maximumPoolSize = maximumPoolSize;
this.unit = unit;
this.policy = policy;
this.keepAliveTime = keepAliveTime;
taskQueue = new ArrayBlockingQueue<Runnable>(maxTasks);
useTimed = keepAliveTime != 0;
}
/**
*
* @param runnable 需要被執行的任務
* @param max 是否使用 maximumPoolSize
* @return boolean
*/
public synchronized boolean addWorker(Runnable runnable, boolean max) {
if (ct.get() >= corePoolSize && !max)
return false;
if (ct.get() >= maximumPoolSize && max)
return false;
Worker worker = new Worker(runnable);
workers.add(worker);
Thread thread = new Thread(worker, "ThreadPool-" + "Thread-" + ct.addAndGet(1));
thread.start();
return true;
}
// 下面這個方法是向線程池提交任務
public void execute(Runnable runnable) throws InterruptedException {
checkPoolState();
if (addWorker(runnable, false) // 如果能夠加入新的線程執行任務 加入成功就直接返回
|| !taskQueue.offer(runnable) // 如果 taskQueue.offer(runnable) 返回 false 說明提交任務失敗 任務隊列已經滿了
|| addWorker(runnable, true)) // 使用能夠使用的最大的線程數 (maximumPoolSize) 看是否能夠產生新的線程
return;
// 如果任務隊列滿了而且不能夠加入新的線程 則拒絕這個任務
if (!taskQueue.offer(runnable))
reject(runnable);
}
private void reject(Runnable runnable) throws InterruptedException {
switch (policy) {
case ABORT:
throw new RuntimeException("task queue is full");
case CALLER_RUN:
runnable.run();
case DISCARD:
return;
case DISCARD_OLDEST:
// 放棄等待時間最長的任務
taskQueue.poll();
execute(runnable);
}
}
private void checkPoolState() {
if (isStopped) {
// 如果線程池已經停下來了,就不在向任務隊列當中提交任務了
throw new RuntimeException("thread pool has been stopped, so quit submitting task");
}
}
public <V> RunnableFuture<V> submit(Callable<V> task) throws InterruptedException {
checkPoolState();
FutureTask<V> futureTask = new FutureTask<>(task);
execute(futureTask);
return futureTask;
}
// 強制關閉線程池
public synchronized void stop() {
isStopped = true;
for (Worker worker : workers) {
worker.stopWorker();
}
}
public synchronized void shutDown() {
// 先表示關閉線程池 線程就不能再向線程池提交任務
isStopped = true;
// 先等待所有的任務執行完成再關閉線程池
waitForAllTasks();
stop();
}
private void waitForAllTasks() {
// 當線程池當中還有任務的時候 就不退出循環
while (taskQueue.size() > 0) {
Thread.yield();
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
class Worker implements Runnable {
private Thread thisThread;
private final Runnable firstTask;
private volatile boolean isStopped;
public Worker(Runnable firstTask) {
this.firstTask = firstTask;
}
@Override
public void run() {
// 先執行傳遞過來的第一個任務 這裡是一個小的優化 讓線程直接執行第一個任務 不需要
// 放入任務隊列再取出來執行了
firstTask.run();
thisThread = Thread.currentThread();
while (!isStopped) {
try {
Runnable task = useTimed ? taskQueue.poll(keepAliveTime, unit) : taskQueue.take();
if (task == null) {
int i;
boolean exit = true;
if (ct.get() > corePoolSize) {
do{
i = ct.get();
if (i <= corePoolSize) {
exit = false;
break;
}
}while (!ct.compareAndSet(i, i - 1));
if (exit) {
return;
}
}
}else {
task.run();
}
} catch (InterruptedException e) {
// do nothing
}
}
}
public synchronized void stopWorker() {
if (isStopped) {
throw new RuntimeException("thread has been interrupted");
}
isStopped = true;
thisThread.interrupt();
}
}
}
線程池測試
package cscore.concurrent.java.threadpoolv2;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.RunnableFuture;
import java.util.concurrent.TimeUnit;
public class Test {
public static void main(String[] args) throws InterruptedException, ExecutionException {
var pool = new ThreadPool(2, 5, TimeUnit.SECONDS, 10, RejectPolicy.ABORT, 100000);
for (int i = 0; i < 10; i++) {
RunnableFuture<Integer> submit = pool.submit(() -> {
System.out.println(Thread.currentThread().getName() + " output a");
try {
Thread.sleep(10);
} catch (InterruptedException e) {
e.printStackTrace();
}
return 0;
});
System.out.println(submit.get());
}
int n = 15;
while (n-- > 0) {
System.out.println("Number Threads = " + pool.getCt());
Thread.sleep(1000);
}
pool.shutDown();
}
}
上面測試代碼的輸出結果如下所示:
ThreadPool-Thread-2 output a
ThreadPool-Thread-1 output a
ThreadPool-Thread-3 output a
ThreadPool-Thread-4 output a
Number Threads = 5
ThreadPool-Thread-5 output a
ThreadPool-Thread-2 output a
ThreadPool-Thread-1 output a
ThreadPool-Thread-3 output a
ThreadPool-Thread-4 output a
ThreadPool-Thread-5 output a
ThreadPool-Thread-2 output a
ThreadPool-Thread-1 output a
ThreadPool-Thread-4 output a
ThreadPool-Thread-3 output a
ThreadPool-Thread-5 output a
ThreadPool-Thread-2 output a
ThreadPool-Thread-1 output a
ThreadPool-Thread-4 output a
Number Threads = 5
Number Threads = 5
Number Threads = 5
Number Threads = 5
Number Threads = 5
Number Threads = 5
Number Threads = 5
Number Threads = 5
Number Threads = 5
Number Threads = 3
Number Threads = 2
Number Threads = 2
Number Threads = 2
Number Threads = 2
從上面的代碼可以看出我們實現了正確的任務實現結果,同時線程池當中的核心線程數從 2 變到了 5 ,當線程池當中任務隊列全部別執行完成之後,線程的數目重新降下來了,這確實是我們想要達到的結果。
總結
在本篇文章當中主要給大家介紹了如何實現一個類似於JDK中的線程池,裏面有非常多的實現細節,大家可以仔細捋一下其中的流程,對線程池的理解將會非常有幫助。
以上就是本篇文章的所有內容了,我是LeHung,我們下期再見!!!更多精彩內容合集可訪問項目://github.com/Chang-LeHung/CSCore
關注公眾號:一無是處的研究僧,了解更多計算機(Java、Python、計算機系統基礎、算法與數據結構)知識。