源碼解析Synchronous Queue 這種特立獨行的隊列
摘要:Synchronous Queue 是一種特立獨行的隊列,其本身是沒有容量的,比如調用者放一個數據到隊列中,調用者是不能夠立馬返回的,調用者必須等待別人把我放進去的數據消費掉了,才能夠返回。
本文分享自華為雲社區《Synchronous Queue 源碼解析》,作者: JavaEdge。
1 簡介
Synchronous Queue 是一種特立獨行的隊列,其本身是沒有容量的,比如調用者放一個數據到隊列中,調用者是不能夠立馬返回的,調用者必須等待別人把我放進去的數據消費掉了,才能夠返回。Synchronous Queue 在 MQ 中被大量使用,本文就讓我們從源碼來看下 Synchronous Queue 到底是如何實現這種功能的呢。
2 整體架構
不像ArrayBlockingQueue、LinkedBlockingDeque之類的阻塞隊列使用AQS實現並發,SynchronousQueue直接使用CAS操作實現數據的安全訪問,因此源碼中充斥着大量的CAS代碼。
SynchronousQueue 的整體設計比較抽象,在內部抽象出了兩種算法實現,一種是先入先出的隊列,一種是後入先出的堆棧,兩種算法被兩個內部類實現,而直接對外的 put,take 方法的實現就非常簡單,都是直接調用兩個內部類的 transfer 方法進行實現,整體的調用關係如下圖所示:
2.1 類注釋
隊列不存儲數據,所以沒有大小,也無法迭代;插入操作的返回必須等待另一個線程完成對應數據的刪除操作,反之亦然;
隊列由兩種數據結構組成,分別是後入先出的堆棧和先入先出的隊列,堆棧是非公平的,隊列是公平的。
第二點是如何做到的?堆棧又是如何實現的呢?接下來我們一點一點揭曉。
2.2 類圖
SynchronousQueue 整體類圖和 LinkedBlockingQueue 相似,都實現了 BlockingQueue 接口,但因為其不儲存數據結構,有一些方法是沒有實現的,比如說 isEmpty、size、contains、remove 和迭代等方法,這些方法都是默認實現,如下截圖:
2.3 結構細節
SynchronousQueue 底層結構和其它隊列完全不同,有着獨特的兩種數據結構:隊列和堆棧,我們一起來看下數據結構:
// 堆棧和隊列共同的接口 // 負責執行 put or take abstract static class Transferer<E> { // e 為空的,會直接返回特殊值,不為空會傳遞給消費者 // timed 為 true,說明會有超時時間 abstract E transfer(E e, boolean timed, long nanos); } // 堆棧 後入先出 非公平 // Scherer-Scott 算法 static final class TransferStack<E> extends Transferer<E> { } // 隊列 先入先出 公平 static final class TransferQueue<E> extends Transferer<E> { } private transient volatile Transferer<E> transferer; // 無參構造器默認為非公平的 public SynchronousQueue(boolean fair) { transferer = fair ? new TransferQueue<E>() : new TransferStack<E>(); }
從源碼中我們可以得到幾點:
堆棧和隊列都有一個共同的接口,叫做 Transferer,該接口有個方法:transfer,該方法很神奇,會承擔 take 和 put 的雙重功能;
在我們初始化的時候,是可以選擇是使用堆棧還是隊列的,如果你不選擇,默認的就是堆棧,類注釋中也說明了這一點,堆棧的效率比隊列更高。
接下來我們來看下堆棧和隊列的具體實現。
3 非公平的堆棧
3.1 堆棧的結構
首先我們來介紹下堆棧的整體結構,如下:
從上圖中我們可以看到,我們有一個大的堆棧池,池的開口叫做堆棧頭,put 的時候,就往堆棧池中放數據。take 的時候,就從堆棧池中拿數據,兩者操作都是在堆棧頭上操作數據,從圖中可以看到,越靠近堆棧頭,數據越新,所以每次 take 的時候,都會拿到堆棧頭的最新數據,這就是我們說的後入先出,也就是非公平的。
圖中 SNode 就是源碼中棧元素的表示,我們看下源碼:
- volatile SNode next
棧的下一個,就是被當前棧壓在下面的棧元素 - volatile SNode match
節點匹配,用來判斷阻塞棧元素能被喚醒的時機 - 比如我們先執行 take,此時隊列中沒有數據,take 被阻塞了,棧元素為 SNode1
當有 put 操作時,會把當前 put 的棧元素賦值給 SNode1 的 match 屬性,並喚醒 take 操作
當 take 被喚醒,發現 SNode1 的 match 屬性有值時,就能拿到 put 進來的數據,從而返回 - volatile Thread waiter
棧元素的阻塞是通過線程阻塞來實現的,waiter 為阻塞的線程 - Object item
未投遞的消息,或者未消費的消息
3.2 入棧和出棧
- 入棧
使用 put 等方法,將數據放到堆棧池中 - 出棧
使用 take 等方法,把數據從堆棧池中拿出來
操作的對象都是堆棧頭,雖然兩者的一個是從堆棧頭拿數據,一個是放數據,但底層實現的方法卻是同一個,源碼如下:
transfer 方法思路比較複雜,因為 take 和 put 兩個方法都揉在了一起A
@SuppressWarnings("unchecked") E transfer(E e, boolean timed, long nanos) { SNode s = null; // constructed/reused as needed // e 為空: take 方法,非空: put 方法 int mode = (e == null) ? REQUEST : DATA; // 自旋 for (;;) { // 頭節點情況分類 // 1:為空,說明隊列中還沒有數據 // 2:非空,並且是 take 類型的,說明頭節點線程正等着拿數據 // 3:非空,並且是 put 類型的,說明頭節點線程正等着放數據 SNode h = head; // 棧頭為空,說明隊列中還沒有數據。 // 棧頭非空且棧頭的類型和本次操作一致 // 比如都是 put,那麼就把本次 put 操作放到該棧頭的前面即可,讓本次 put 能夠先執行 if (h == null || h.mode == mode) { // empty or same-mode // 設置了超時時間,並且 e 進棧或者出棧要超時了, // 就會丟棄本次操作,返回 null 值。 // 如果棧頭此時被取消了,丟棄棧頭,取下一個節點繼續消費 if (timed && nanos <= 0) { // 無法等待 // 棧頭操作被取消 if (h != null && h.isCancelled()) // 丟棄棧頭,把棧頭的後一個元素作為棧頭 casHead(h, h.next); // 將取消的節點彈棧 // 棧頭為空,直接返回 null else return null; // 沒有超時,直接把 e 作為新的棧頭 } else if (casHead(h, s = snode(s, e, h, mode))) { // e 等待出棧,一種是空隊列 take,一種是 put SNode m = awaitFulfill(s, timed, nanos); if (m == s) { // wait was cancelled clean(s); return null; } // 本來 s 是棧頭的,現在 s 不是棧頭了,s 後面又來了一個數,把新的數據作為棧頭 if ((h = head) != null && h.next == s) casHead(h, s.next); // help s's fulfiller return (E) ((mode == REQUEST) ? m.item : s.item); } // 棧頭正在等待其他線程 put 或 take // 比如棧頭正在阻塞,並且是 put 類型,而此次操作正好是 take 類型,走此處 } else if (!isFulfilling(h.mode)) { // try to fulfill // 棧頭已經被取消,把下一個元素作為棧頭 if (h.isCancelled()) // already cancelled casHead(h, h.next); // pop and retry // snode 方法第三個參數 h 代表棧頭,賦值給 s 的 next 屬性 else if (casHead(h, s=snode(s, e, h, FULFILLING|mode))) { for (;;) { // loop until matched or waiters disappear // m 就是棧頭,通過上面 snode 方法剛剛賦值 SNode m = s.next; // m is s's match if (m == null) { // all waiters are gone casHead(s, null); // pop fulfill node s = null; // use new node next time break; // restart main loop } SNode mn = m.next; // tryMatch 非常重要的方法,兩個作用: // 1 喚醒被阻塞的棧頭 m,2 把當前節點 s 賦值給 m 的 match 屬性 // 這樣棧頭 m 被喚醒時,就能從 m.match 中得到本次操作 s // 其中 s.item 記錄著本次的操作節點,也就是記錄本次操作的數據 if (m.tryMatch(s)) { casHead(s, mn); // pop both s and m return (E) ((mode == REQUEST) ? m.item : s.item); } else // lost match s.casNext(m, mn); // help unlink } } } else { // help a fulfiller SNode m = h.next; // m is h's match if (m == null) // waiter is gone casHead(h, null); // pop fulfilling node else { SNode mn = m.next; if (m.tryMatch(h)) // help match casHead(h, mn); // pop both h and m else // lost match h.casNext(m, mn); // help unlink } } } }
總結一下操作思路:
- 判斷是 put 方法還是 take 方法
- 判斷棧頭數據是否為空,如果為空或者棧頭的操作和本次操作一致,是的話走 3,否則走 5
- 判斷操作有無設置超時時間,如果設置了超時時間並且已經超時,返回 null,否則走 4
- 如果棧頭為空,把當前操作設置成棧頭,或者棧頭不為空,但棧頭的操作和本次操作相同,也把當前操作設置成棧頭,並看看其它線程能否滿足自己,不能滿足則阻塞自己。比如當前操作是 take,但隊列中沒有數據,則阻塞自己
- 如果棧頭已經是阻塞住的,需要別人喚醒的,判斷當前操作能否喚醒棧頭,可以喚醒走 6,否則走 4
- 把自己當作一個節點,賦值到棧頭的 match 屬性上,並喚醒棧頭節點
- 棧頭被喚醒後,拿到 match 屬性,就是把自己喚醒的節點的信息,返回。
在整個過程中,有一個節點阻塞的方法,源碼如下:
當一個 節點/線程 將要阻塞時,它會設置其 waiter 字段,然後在真正 park 之前至少再檢查一次狀態,從而涵蓋了競爭與實現者的關係,並注意到 waiter 非空,因此應將其喚醒。
當由出現在調用點位於堆棧頂部的節點調用時,對停放的調用之前會進行旋轉,以避免在生產者和消費者及時到達時阻塞。 這可能只足以在多處理器上發生。
從主循環返回的檢查順序反映了這樣一個事實,即優先級: 中斷 > 正常的返回 > 超時。 (因此,在超時時,在放棄之前要進行最後一次匹配檢查。)除了來自非定時SynchronousQueue的調用。{poll / offer}不會檢查中斷,根本不等待,因此陷入了轉移方法中 而不是調用awaitFulfill。
/** * 旋轉/阻止,直到節點s通過執行操作匹配。 * @param s 等待的節點 * @param timed true if timed wait * @param nanos 超時時間 * @return 匹配的節點, 或者是 s 如果被取消 */ SNode awaitFulfill(SNode s, boolean timed, long nanos) { // deadline 死亡時間,如果設置了超時時間的話,死亡時間等於當前時間 + 超時時間,否則就是 0 final long deadline = timed ? System.nanoTime() + nanos : 0L; Thread w = Thread.currentThread(); // 自旋的次數,如果設置了超時時間,會自旋 32 次,否則自旋 512 次。 // 比如本次操作是 take 操作,自旋次數後,仍無其他線程 put 數據 // 就會阻塞,有超時時間的,會阻塞固定的時間,否則一致阻塞下去 int spins = (shouldSpin(s) ? (timed ? maxTimedSpins : maxUntimedSpins) : 0); for (;;) { // 當前線程有無被打斷,如果過了超時時間,當前線程就會被打斷 if (w.isInterrupted()) s.tryCancel(); SNode m = s.match; if (m != null) return m; if (timed) { nanos = deadline - System.nanoTime(); // 超時了,取消當前線程的等待操作 if (nanos <= 0L) { s.tryCancel(); continue; } } // 自選次數減1 if (spins > 0) spins = shouldSpin(s) ? (spins-1) : 0; // 把當前線程設置成 waiter,主要是通過線程來完成阻塞和喚醒 else if (s.waiter == null) s.waiter = w; // establish waiter so can park next iter else if (!timed) // 通過 park 進行阻塞,這個我們在鎖章節中會說明 LockSupport.park(this); else if (nanos > spinForTimeoutThreshold) LockSupport.parkNanos(this, nanos); } }
可以發現其阻塞策略,並不是一上來就阻塞住,而是在自旋一定次數後,仍然沒有其它線程來滿足自己的要求時,才會真正的阻塞。
隊列的實現策略通常分為公平模式和非公平模式,本文我們重點介紹公平模式。
4 公平隊列
4.1元素組成
- volatile QNode next
當前元素的下一個元素 - volatile Object item // CAS』ed to or from null
當前元素的值,如果當前元素被阻塞住了,等其他線程來喚醒自己時,其他線程會把自己 set 到 item 裏面 - volatile Thread waiter // to control park/unpark
可以阻塞住的當前線程 - final boolean isData
true 是 put,false 是 take
公平隊列主要使用的是 TransferQueue 內部類的 transfer 方法,看源碼:
E transfer(E e, boolean timed, long nanos) { QNode s = null; // constructed/reused as needed // true : put false : get boolean isData = (e != null); for (;;) { // 隊列頭和尾的臨時變量,隊列是空的時候,t=h QNode t = tail; QNode h = head; // tail 和 head 沒有初始化時,無限循環 // 雖然這種 continue 非常耗cpu,但感覺不會碰到這種情況 // 因為 tail 和 head 在 TransferQueue 初始化的時候,就已經被賦值空節點了 if (t == null || h == null) continue; // 首尾節點相同,說明是空隊列 // 或者尾節點的操作和當前節點操作一致 if (h == t || t.isData == isData) { QNode tn = t.next; // 當 t 不是 tail 時,說明 tail 已經被修改過了 // 因為 tail 沒有被修改的情況下,t 和 tail 必然相等 // 因為前面剛剛執行賦值操作: t = tail if (t != tail) continue; // 隊尾後面的值還不為空,t 還不是隊尾,直接把 tn 賦值給 t,這是一步加強校驗。 if (tn != null) { advanceTail(t, tn); continue; } //超時直接返回 null if (timed && nanos <= 0) // can't wait return null; //構造node節點 if (s == null) s = new QNode(e, isData); //如果把 e 放到隊尾失敗,繼續遞歸放進去 if (!t.casNext(null, s)) // failed to link in continue; advanceTail(t, s); // swing tail and wait // 阻塞住自己 Object x = awaitFulfill(s, e, timed, nanos); if (x == s) { // wait was cancelled clean(t, s); return null; } if (!s.isOffList()) { // not already unlinked advanceHead(t, s); // unlink if head if (x != null) // and forget fields s.item = s; s.waiter = null; } return (x != null) ? (E)x : e; // 隊列不為空,並且當前操作和隊尾不一致 // 也就是說當前操作是隊尾是對應的操作 // 比如說隊尾是因為 take 被阻塞的,那麼當前操作必然是 put } else { // complementary-mode // 如果是第一次執行,此處的 m 代表就是 tail // 也就是這行代碼體現出隊列的公平,每次操作時,從頭開始按照順序進行操作 QNode m = h.next; // node to fulfill if (t != tail || m == null || h != head) continue; // inconsistent read Object x = m.item; if (isData == (x != null) || // m already fulfilled x == m || // m cancelled // m 代表棧頭 // 這裡把當前的操作值賦值給阻塞住的 m 的 item 屬性 // 這樣 m 被釋放時,就可得到此次操作的值 !m.casItem(x, e)) { // lost CAS advanceHead(h, m); // dequeue and retry continue; } // 當前操作放到隊頭 advanceHead(h, m); // successfully fulfilled // 釋放隊頭阻塞節點 LockSupport.unpark(m.waiter); return (x != null) ? (E)x : e; } } }
線程被阻塞住後,當前線程是如何把自己的數據傳給阻塞線程的。
假設線程 1 從隊列中 take 數據 ,被阻塞,變成阻塞線程 A 然後線程 2 開始往隊列中 put 數據 B,大致的流程如下:
- 線程 1 從隊列 take 數據,發現隊列內無數據,於是被阻塞,成為 A
- 線程 2 往隊尾 put 數據,會從隊尾往前找到第一個被阻塞的節點,假設此時能找到的就是節點 A,然後線程 B 把將 put 的數據放到節點 A 的 item 屬性裏面,並喚醒線程 1
- 線程 1 被喚醒後,就能從 A.item 裏面拿到線程 2 put 的數據了,線程 1 成功返回。
在這個過程中,公平主要體現在,每次 put 數據的時候,都 put 到隊尾上,而每次拿數據時,並不是直接從堆頭拿數據,而是從隊尾往前尋找第一個被阻塞的線程,這樣就會按照順序釋放被阻塞的線程。
4.2 圖解公平隊列模型
公平模式下,底層實現使用的是 TransferQueue 隊列,它有一個head和tail指針,用於指向當前正在等待匹配的線程節點。
初始化時,TransferQueue的狀態如下:
1.線程put1執行 put(1)操作,由於當前沒有配對的消費線程,所以put1線程入隊列,自旋一小會後睡眠等待,這時隊列狀態如下:
2.接着,線程put2執行了put(2)操作,跟前面一樣,put2線程入隊列,自旋一小會後睡眠等待,這時隊列狀態如下:
3.這時候,來了一個線程take1,執行了 take操作,由於tail指向put2線程,put2線程跟take1線程配對了(一put一take),這時take1線程不需要入隊,但是請注意了,這時候,要喚醒的線程並不是put2,而是put1。
為何? 大家應該知道我們現在講的是公平策略,所謂公平就是誰先入隊了,誰就優先被喚醒,我們的例子明顯是put1應該優先被喚醒。有的同學可能會有一個疑問,明明是take1線程跟put2線程匹配上了,結果是put1線程被喚醒消費,怎麼確保take1線程一定可以和次首節點(head.next)也是匹配的呢?其實大家可以拿個紙畫一畫,就會發現真的就是這樣的。
公平策略總結下來就是:隊尾匹配隊頭出隊。
執行後put1線程被喚醒,take1線程的 take()方法返回了1(put1線程的數據),這樣就實現了線程間的一對一通信,這時候內部狀態如下:
4.最後,再來一個線程take2,執行take操作,這時候只有put2線程在等候,而且兩個線程匹配上了,線程put2被喚醒,take2線程take操作返回了2(線程put2的數據),這時候隊列又回到了起點,如下所示:
以上便是公平模式下,SynchronousQueue的實現模型。總結下來就是:隊尾匹配隊頭出隊,先進先出,體現公平原則。
5 非公平模式
5.1 元素組成
- 棧頂
- volatile SNode next
棧中的下一個元素 - volatile Object item // data; or null for REQUESTs
當前元素的值,如果當前元素被阻塞住了,等其他線程來喚醒自己時,其他線程會把自己 set 到 item 裏面 - volatile Thread waiter
可以阻塞住的當前線程
5.2 圖解非公平模型
還是使用跟公平模式下一樣的操作流程,對比兩種策略下有何不同。
非公平模式底層的實現使用的是TransferStack,一個棧,實現中用head指針指向棧頂,接着我們看看它的實現模型:
1.線程put1執行 put(1)操作,由於當前沒有配對的消費線程,所以put1線程入棧,自旋一小會後睡眠等待,這時棧狀態如下
2.接着,線程put2再次執行了put(2)操作,跟前面一樣,put2線程入棧,自旋一小會後睡眠等待,這時棧狀態如下:
3.這時候,來了一個線程take1,執行了take操作,這時候發現棧頂為put2線程,匹配成功,但是實現會先把take1線程入棧,然後take1線程循環執行匹配put2線程邏輯,一旦發現沒有並發衝突,就會把棧頂指針直接指向 put1線程
4.最後,再來一個線程take2,執行take操作,這跟步驟3的邏輯基本是一致的,take2線程入棧,然後在循環中匹配put1線程,最終全部匹配完畢,棧變為空,恢復初始狀態,如下圖所示:
可以從上面流程看出,雖然put1線程先入棧了,但是卻是後匹配,這就是非公平的由來。
5 總結
SynchronousQueue 源碼比較複雜,建議大家進行源碼的 debug 來學習源碼,為大家準備了調試類:SynchronousQueueDemo,大家可以下載源碼自己調試一下,這樣學起來應該會更加輕鬆一點。
- SynchronousQueue內沒有容器為什麼能夠存儲一個元素?
內部沒有容器指的是沒有像數組那樣的內存空間存多個元素,但是是有單地址內存空間,用於交換數據
SynchronousQueue由於其獨有的線程一一配對通信機制,在大部分平常開發中,可能都不太會用到,但線程池技術中會有所使用,由於內部沒有使用AQS,而是直接使用CAS,所以代碼理解起來會比較困難,但這並不妨礙我們理解底層的實現模型,在理解了模型的基礎上,再翻閱源碼,就會有方向感,看起來也會比較容易!