CAS 算法與 Java 原子類
樂觀鎖
一般而言,在並發情況下我們必須通過一定的手段來保證數據的準確性,如果沒有做好並發控制,就可能導致臟讀、幻讀和不可重複度等一系列問題。樂觀鎖是人們為了應付並發問題而提出的一種思想,具體的實現則有多種方式。
樂觀鎖假設數據一般情況下不會造成衝突,只在數據進行提交更新時,才會正式對數據的衝突與否進行檢測,如果發現衝突了,則返回給用戶錯誤的信息,讓用戶決定如何去做。樂觀鎖適用於讀操作多的場景,可以提高程序的吞吐量。
CAS
CAS(Compare And Swap)比較並交換,是一種實現了樂觀鎖思想的並發控制技術。CAS 算法的過程是:它包含 3 個參數 CAS(V,E,N),V 表示要更新的變量(內存值),E 表示舊的預期值,N 表示即將更新的預期值。當且僅當 V 值等於 E 值時,才會將 V 的值設為 N,如果 V 值和 E 值不同,說明已經有其他線程做了更新,則當前線程什麼也不做,並返回當前 V 的真實值。整個操作是原子性的。
當多個線程同時使用 CAS 操作一個變量時,只有一個會勝出,並成功更新,其餘均會失敗。失敗的線程不會被掛起,僅是被告知失敗,並允許再次嘗試,當然也可以放棄本次操作,所以 CAS 算法是非阻塞的。基於上述原理,CAS 操作可以在不藉助鎖的情況下實現合適的並發處理。
ABA 問題
ABA 問題是 CAS 算法的一個漏洞。CAS 算法實現的一個重要前提是:取出內存中某時刻的數據,並在下一時刻比較並替換,在這個時間差內可能會導致數據的變化。
假設有兩個線程,分別要對內存中某一變量做 CAS 操作,線程一先從內存中取出值 A,線程二也從內存中取出值 A,並把值從 A 變為 B 寫回,然後又把值從 B 變為 A 寫回,這時候線程一進行 CAS 操作,發現內存中的值還是 A,於是認為和預期值一致,操作成功。儘管線程一的 CAS 操作成功,但並不代表這個過程就沒有問題。
ABA 問題會帶來什麼隱患呢?維基百科給出了詳細的示例:假設現有一個用單鏈表實現的堆棧,棧頂為 A,A.next = B,現有線程一希望用 CAS 把棧頂替換為 B,但在此之前,線程二介入,將 A、B 出棧,再壓入 D、C、A,整個過程如下
此時 B 處於遊離轉態,輪到線程一執行 CAS 操作,發現棧頂仍為 A,CAS 成功,棧頂變為 B,但實際上 B.next = null,即堆棧中只有 B 一個元素,C 和 D 並不在堆棧中,平白無故就丟了。簡單來說,ABA 問題使我們漏掉某一段時間的數據監控,誰知道在這段時間內會發生什麼有趣(可怕)的事呢?
可以通過版本號的方式來解決 ABA 問題,每次執行數據修改操作時,都會帶上一個版本號,如果版本號和數據的版本一致,對數據進行修改操作並對版本號 +1,否則執行失敗。因為每次操作的版本號都會隨之增加,所以不用擔心出現 ABA 問題。
使用 Java 模擬 CAS 算法
這僅僅是基於 Java 層面上的模擬,真正的實現要涉及到底層(我學不會)
public class TestCompareAndSwap {
private static CompareAndSwap cas = new CompareAndSwap();
public static void main(String[] args) {
for (int i = 0; i < 10; i++) {
new Thread(new Runnable() {
public void run() {
// 獲取預估值
int expectedValue = cas.get();
boolean b = cas.compareAndSet(expectedValue, (int) (Math.random() * 101));
System.out.println(b);
}
});
}
}
}
class CompareAndSwap {
private int value;
// 獲取內存值
public synchronized int get() {
return value;
}
// 比較
public synchronized int compareAndSwap(int expectedValue, int newValue) {
// 讀取內存值
int oldValue = value;
// 比較
if (oldValue == expectedValue) {
this.value = newValue;
}
return oldValue;
}
// 設置
public synchronized boolean compareAndSet(int expectedValue, int newValue) {
return expectedValue == compareAndSwap(expectedValue, newValue);
}
}
原子類
原子包 java.util.concurrent.atomic 提供了一組原子類,原子類的操作具有原子性,一旦開始,就一直運行直到結束,中間不會有任何線程上下文切換。原子類的底層正是基於 CAS 算法實現線程安全。
Java 為我們提供了十六個原子類,可以大致分為以下四種:
1. 基本類型
-
AtomicBoolean
原子更新布爾類型,內部使用 int 類型的 value 存儲 1 和 0 表示 true 和 false,底層也是對 int 類型的原子操作
-
AtomicInteger
原子更新 int 類型
-
AtomicLong
原子更新 long 類型
2. 引用類型
-
AtomicReference
原子更新引用類型,通過泛型指定要操作的類
-
AtomicMarkableReference
原子更新引用類型,內部維護一個 Pair 類型(靜態內部類)的成員屬性,其中有一個 boolean 類型的標誌位,避免 ABA 問題
private static class Pair<T> { final T reference; final boolean mark; private Pair(T reference, boolean mark) { this.reference = reference; this.mark = mark; } static <T> Pair<T> of(T reference, boolean mark) { return new Pair<T>(reference, mark); } } private volatile Pair<V> pair;
-
AtomicStampedReference
原子更新引用類型,內部維護一個 Pair 類型(靜態內部類)的成員屬性,其中有一個 int 類型的郵戳(版本號),避免 ABA 問題
private static class Pair<T> { final T reference; final int stamp; private Pair(T reference, int stamp) { this.reference = reference; this.stamp = stamp; } static <T> Pair<T> of(T reference, int stamp) { return new Pair<T>(reference, stamp); } } private volatile Pair<V> pair;
3. 數組類型
-
AtomicIntegerArray
原子更新 int 數組中的元素
-
AtomicLongArray
原子更新 long 數組中的元素
-
AtomicReferenceArray
原子更新 Object 數組中的元素
4. 對象屬性類型
用於解決對象的屬性的原子操作
-
AtomicIntegerFieldUpdater
原子更新對象中的 int 類型字段
-
AtomicLongFieldUpdater
原子更新對象中的 long 類型字段
-
AtomicReferenceFieldUpdater
原子更新對象中的引用類型字段
之前提到的三種類型的使用都比較簡單,查閱對應 API 即可,而對象屬性類型則有一些限制:
- 字段必須是 volatile 類型的,在線程之間共享變量時保證立即可見
- 只能是實例變量,不能是類變量,也就是說不能加 static 關鍵字
- 只能是可修改變量,不能使用 final 變量
- 該對象字段能夠被直接操作,因為它是基於反射實現的
5. 高性能原子類
Java8 新增的原子類,使用分段的思想,把不同的線程 hash 到不同的段上去更新,最後再把這些段的值相加得到最終的值。以下四個類都繼承自 Striped64,對並發的優化在 Striped64 中實現
-
LongAccumulator
long 類型的聚合器,需要傳入一個 long 類型的二元操作,可以用來計算各種聚合操作,包括加乘等
-
LongAdder
long 類型的累加器,LongAccumulator 的特例,只能用來計算加法,且從 0 開始計算
-
DoubleAccumulator
double 類型的聚合器,需要傳入一個 double 類型的二元操作,可以用來計算各種聚合操作,包括加乘等
-
DoubleAdder
double 類型的累加器,DoubleAccumulator 的特例,只能用來計算加法,且從 0 開始計算