Java高性能編程之CAS與ABA及解決方法

  • 2019 年 10 月 3 日
  • 筆記

Java高性能編程之CAS與ABA及解決方法

前言

如果喜歡暗色調的介面或者想換換介面,可以看看我在個人部落格發布的 Java高性能編程之CAS與ABA及解決方法

CAS概念

CAS,全稱Compare And Swap,比較與交換。

屬於硬體級別的同步原語,從處理器層面提供了記憶體操作的原子性。

從概念上,我們可以得出三點。第一,CAS的運作方式(通過比較與交換實現)。第二,硬體層面支援,性能肯定不低(當然它也不是銀彈)。第三,提供原子性,那麼它的功能肯定是確保原子性,從而確保執行緒安全。

實際使用中,CAS操作需要輸入兩個數值,一個舊值A(期望操作前的值)和一個新值B,在操作期間先將舊值A與實際記憶體中的值進行比較,如果沒有發生變化,才將實際記憶體中的值交換成新值B,如果發生了變化則不交換。

CAS應用場景

既然CAS的功能是提供原子性,那麼從這個角度出發思考,如計數器,賬戶轉賬等。

那麼提到計數器,就不得不提到JUC包下的atomic包了。其中提供了大量原子操作了,如Integer類型的值變化,Long類型的值變化,Boolean類型的值變化。

說到這裡,某些人就要一句「球多麻袋」,Integer類型的值變化,不就一句程式碼嘛(如i = i + 1;),不就是原子操作嘛。即使有賦值操作,也可以寫成(i++;),這樣不就一個操作了嘛。當然學習過彙編或對電腦指令有一定了解的朋友可能就知道原因了。很多時候,我們在程式中的一段程式碼,編譯到底層執行時,往往是多個語句(誰讓CPU只能執行非常簡單的操作呢)。如i++操作編譯成Java指令後是以下四句:

  1. getfield
  2. iconst_1
  3. iadd
  4. putfield

具體的意思,我就不解讀了(不是今天的重點),感興趣的,可以百度或者@我。

話題回到JUC包下的atomic包,我之所以提它,就是因為其原子性的實現就是依靠CAS實現的。

AtomicInteger類:

      /**       * Atomically sets to the given value and returns the old value.       *       * @param newValue the new value       * @return the previous value       */      public final int getAndSet(int newValue) {          return unsafe.getAndSetInt(this, valueOffset, newValue);      }  

Unsafe類:

      public final int getAndSetInt(Object var1, long var2, int var4) {          int var5;          do {              var5 = this.getIntVolatile(var1, var2);          } while(!this.compareAndSwapInt(var1, var2, var5, var4));            return var5;      }  
      public final native boolean compareAndSwapInt(Object var1,           long var2, int var4, int var5);  

通過上述三段源碼,可以清楚看出,AtomicInteger中getAndSet這一原子方法是通過Unsafe中的原生方法compareAndSwapInt方法完成CAS機制,從而確保操作的原子性。

CAS還涉及到Java中鎖的實現,這個也留到鎖專題再細說,畢竟這次的主題是CAS,ABA及解決之道。

Why need CAS

那麼為什麼需要CAS呢,畢竟Java已經有了多種手段來保證執行緒安全的原子性問題,最廣為人知的除了Atomic包(底層是CAS),就是synchronized鎖了。

原因很簡單,因為synchronized鎖什麼的太重了。這裡所說的重,是指其消耗的系統資源較多(所以又稱為重量級鎖)。所以有著底層硬體支援的CAS才會那麼受歡迎。當然CAS也有著自己的問題,這個後面會談到。

CAS應用:

說得再多,不如來點實際程式碼,看看具體效果。

以下程式碼,包含四個類:一個主類,用於調用實現類,展示效果(注釋中有執行結果)。三個實現類,分別展示了沒有處理,使用Atomic包,使用CAS三種方式來多線陳增加全局計數器的效果。

AtomicityWithNoDeal

未做任何處理,通過100個子執行緒分別執行10000次計數器+1操作。

      package tech.jarry.learning.netease;        /**       * @Description:       * @Author: jarry       */      public class AtomicityWithNoDeal {            private volatile int i = 0;            private void add(){              i++;          }            public void run() throws InterruptedException {              for (int j = 0; j < 100; j++){                  new Thread(new Runnable() {                      @Override                      public void run() {                          for (int m = 0; m< 10000; m++){                              add();                          }                          System.out.println(Thread.currentThread().getName()+" has run finished !");                      }                  }).start();              }                Thread.sleep(2000);              System.out.println("i: "+i);          }      }  

AtomicityWithAtomic

進行Atomic包處理,通過100個子執行緒分別執行10000次計數器+1操作。

      package tech.jarry.learning.netease;        import java.util.concurrent.atomic.AtomicInteger;        /**       * @Description:       * @Author: jarry       */      public class AtomicityWithAtomic {            private AtomicInteger atomicInteger = new AtomicInteger(0);            private void add(){              atomicInteger.incrementAndGet();          }            public void run() throws InterruptedException {                for (int j = 0; j < 100; j++){                  new Thread(new Runnable() {                      @Override                      public void run() {                          for (int m = 0; m< 10000; m++){                              add();                          }                          System.out.println(Thread.currentThread().getName()+" has run finished !");                      }                  }).start();              }                Thread.sleep(2000);              System.out.println("atomicInteger: "+atomicInteger.get());          }      }  

AtomicityWithCAS

進行手寫的CAS處理,通過100個子執行緒分別執行10000次計數器+1操作。

      package tech.jarry.learning.netease;        import sun.misc.Unsafe;        import java.lang.reflect.Field;        /**       * @Description:       * @Author: jarry       */      public class AtomicityWithCAS {            // 建立全局計數器,用於觀察CAS原子性特點          volatile int k = 0;          // 定義Unsafe引用對象          private static Unsafe unsafe = null;          // 定義k的記憶體偏移量(可以理解為k在記憶體中地址,當然實際與C指針的記憶體地址是完全不同的)          private static long valueOffset;            static {              try {                  // 利用反射獲取Unsafe實例對象(正常途徑是無法獲取的)                  Field field = Unsafe.class.getDeclaredField("theUnsafe");                  field.setAccessible(true);                  // 由於unsafe是靜態對象,所以傳入null。想想也對,畢竟不同的實例對象的非靜態對象當然是不同的,當然需要傳入實例對象作為參數嘍。                  // 另外吐槽一句,我查看這段資料的時候,發現百度第一頁的各個部落格,幾乎都是一樣的示例程式碼。。。                  unsafe = (Unsafe)field.get(null);                    // 獲取當前對象中全局計數器k的記憶體地址偏移                  Field kField = AtomicityWithCAS.class.getDeclaredField("k");                  kField.setAccessible(true);                  valueOffset = unsafe.objectFieldOffset(kField);                } catch (NoSuchFieldException e) {                  e.printStackTrace();              } catch (IllegalAccessException e) {                  e.printStackTrace();              }          }            /**           * 執行全局計數器k+1的方法           */          private void add(){              // 當CAS執行失敗時,需要重新執行相關操作,直到執行成功。故CAS是一個自旋鎖。              while(true) {                  // 獲取CAS操作所需的舊值                  int current = unsafe.getIntVolatile(this,valueOffset);                  // 進行CAS操作                  if (unsafe.compareAndSwapInt(this,valueOffset,current,current+1)){                      // 執行成功,就跳出循環                      break;                  }              }          }            /**           * 為了體現效果,這裡開啟了100個執行緒循環執行add()操作           * @throws InterruptedException           */          public void run() throws InterruptedException {              for (int j = 0; j < 100; j++){                  new Thread(new Runnable() {                      @Override                      public void run() {                          // 每個執行緒執行10000次add()操作                          for (int m = 0; m< 10000; m++){                              add();                          }                          System.out.println(Thread.currentThread().getName()+" has run finished !");                      }                  }).start();              }                // 當前執行緒休眠2s,確保所有子執行緒執行完畢              Thread.sleep(2000);              System.out.println("k: "+k);          }      }  

Main主函數

主執行緒調用同一包下的AtomicityWithNoDeal,AtomicityWithAtomic,AtomicityWithCAS三個類,觀察運行效果。

      package tech.jarry.learning.netease;        public class Main {            public static void main(String[] args) throws InterruptedException {        //      (new AtomicityWithNoDeal()).run();              /**               * 運行結果:               * Thread-1 has run finished !               * 。。。。。。(略98個執行緒)               * Thread-83 has run finished !               * i: 440239               */        //      (new AtomicityWithAtomic()).run();              /**               * 運行結果:               * Thread-0 has run finished !               * 。。。。。。(略98個執行緒)               * Thread-69 has run finished !               * atomicInteger: 1000000               */        //      (new AtomicityWithCAS()).run();              /**               * 運行結果:               * Thread-1 has run finished !               * 。。。。。。(略98個執行緒)               * Thread-80 has run finished !               * k: 1000000               */            }      }  

注釋

其實上述程式碼中,重要的地方,我都寫上了相關的注釋。如果還有什麼不清楚的地方,可以@我。

CAS缺點

CAS當然是有缺點的,否則就沒Synchronized什麼事情了。

  1. 從概念及程式碼示例中可以看出,當CAS操作執行失敗時,會繼續進入下一個循環執行,直到CAS操作執行成功,這種行為稱為自旋。自旋的實現讓所有執行緒都處於高頻運行,爭搶CPU執行時間的狀態。如果操作長時間不成功,會帶來很大的CPU資源消耗(所以Java有鎖的粗化/升級)。
  2. CAS僅能針對單個變數進行操作,不能用於多個變數來實現原子操作。
  3. ABA問題。

正如,我之前所提到的,看待技術問題要找到其特性的最初來源。如第二點中CAS之所以不能支援多個變數的原子操作,是因為CAS操作的原子性來源於硬體的支撐,而硬體只支援單個變數的原子操作,故CAS只能針對單個變數的原子操作進行操作。而有些文章或程式碼中提到通過CAS執行多個變數的原子操作,其實本質並不是針對多個變數,而是針對這些變數的集合或者總的對象的Reference操作的。這有點抽象,舉個栗子。我將通過CAS操作轉變了某個數組的引用變數的指向,看起來我實現了整個數組內多個元素轉變的原子操作。但實際是我通過改變當前引用變數的指向實現的,CAS的原子操作針對的是這個指向Reference。具體程式碼可以參照Atomic包中的AtomicIntegerArray與AtomicReference等實現。

至於第一點,細究起來有非常多的內容,如鎖的粗化,自旋是否可以優化等。其實CAS的自旋操作實際是確保了一定有CAS操作在執行,但這是通過犧牲CPU實現的。舉個栗子,為了能夠監聽硬體串口返回的消息,我通過while(true)來不斷獲取串口發送過來的數據,直到我獲得了一個完整數據包。

話頭收回來,讓我們談談第三點-ABA問題。

ABA概念

ABA問題,說白了就是鑽了CAS機制的空子。

為了更好地說明這個問題,我們設定兩個執行緒,同時對變數i進行操作。

正常場景:

初始i=0;

執行緒-1(打算對i進行CAS操作)

執行緒-1:獲取i的舊值-0;

執行緒-1:設定i的新值-2;

執行緒-1:對i進行CAS操作,舊值i=0符合實際記憶體中i現有的值,執行swap操作,i=2;

看似正常的場景:

執行緒-1(打算對i進行CAS操作)

執行緒-1:獲取i的舊值-0;

執行緒-2:對i進行了CAS操作,將i改為10;

執行緒-1:設定i的新值-2;

執行緒-2:對i進行了CAS操作,將i重新改為0;

執行緒-1:對i進行CAS操作,舊值i=0符合實際記憶體中i現有的值,執行swap操作,i=2;

上述的兩個場景中執行緒-1都完成了想要完成的CAS操作,區別就是其中執行緒2曾經進行過一些操作。

當然這裡肯定有朋友要說,這對程式的結果沒有任何的影響。是的,在現有的例子中確實對程式的運行結果毫無影響。

這裡我舉出兩個大佬給出的非常經典的例子,分別是極簡與複雜的代表。

極簡:你從銀行取出一箱子錢,放在了車上。結果你一個轉頭,小偷將裝滿錢的箱子拿走,並在原來的位置放了一個看起來一模一樣,但裝滿廢紙的箱子。你並沒有發現這一切,拿著這個箱子開開心心地回家了。囧。

複雜:通過單向鏈表展現ABA的潛在威脅。由於例子比較複雜,我就不在這裡贅述。感興趣的朋友,可以看看。

其實這兩個例子本質都是一樣的,想表達的就是我們CAS操作的不是簡簡單單的數值,更有著其背後的深層資訊(然後通過記憶體,鏈表,引用來證明觀點)。

這裡我要開始表達我的觀點了:現有的大部分部落格或者文章都解釋得或多或少有一定問題。。只有部分大佬的部落格提到了核心,但是為了說了核心,又舉了很多例子(ABA問題的例子本來就不好舉,例子大多容易被誤解,後面會談到),導致核心論點被忘卻。然後又有很多人去借鑒,或者直接拿來這些例子,但是又不能很好地通過這些例子說明ABA,然後就通過自己的理解解釋了一番(更好理解,但是卻開始歪了),不斷有人進入這個圈子,然後解釋越來越歪。造成很多剛了解ABA的小白一臉茫然,看著那套看似正確的解釋,就入坑(雖然這個坑影響不那麼大,起碼對於絕大部分人員都沒太大影響。就像很多Java開發者不懂JMM,工作做得不也還可以嘛)了。。。
(這裡插句題外話,那就是有關部落格抄襲複製的問題。其實我不反對技術的之間的借鑒,畢竟重複造輪子是不可取的,只有有效的思想碰撞才可以產生推動力嘛。但是通過爬蟲無腦爬取,或者直接複製粘貼全文,就真的有些過分了。之所以有這種感慨,是因為我現在有時候在百度查詢一些資料,十多篇部落格看下來,居然大部分都是一樣的,太影響效率了)

當然,說話要講道理的,不能只做「批評家」。就上述兩個經典例子存在一個很大的問題,那就是即使脫離了CAS,上述兩個例子中存在的問題,還是存在。另外一點佐證就是很多時候,我們需要解決的就是簡單的數值的CAS問題,這個數值不牽涉什麼複雜的依賴關係。關於這點佐證的最有力說明就是輕量級鎖的CAS為什麼不需要考慮ABA問題(因為其根本就不涉及什麼複雜依賴)。

話說回來,其實上述兩個例子,以及我的兩點說明,其實更傾向於表現ABA,距離ABA問題的本質,還差了那麼一句畫龍點睛的總結。

總結:ABA問題的本質就是由於對多執行緒下CAS流程式控制制的缺乏,而導致的資訊缺失。表現出來的就是由於缺乏必要資訊(小偷對箱子進行了操作),而產生了隱患

如果你還是有些無法理解這個結論,那你還記得程式的一個重要原則-程式置於控制下。如果你都無法控制你的程式的行為,那麼無疑,你的程式是有問題的。

ABA示例:

接下來通過銀行非法洗錢的例子,來簡單闡述由資訊缺失,造成的問題。

ABATest

這是一個產生了ABA問題的示例。示例中銀行無法發現客戶賬戶上的非法洗錢行為。

      package tech.jarry.learning.netease.casWithABA;        import sun.misc.Unsafe;      import tech.jarry.learning.netease.test.CounterUnsafe;        import java.lang.reflect.Field;        /**       * @Description:       * @Author: jarry       */      public class ABATest {            volatile int k = 10;          private static Unsafe unsafe = null;          private static long valueOffset;            static {              try {                  Field field = Unsafe.class.getDeclaredField("theUnsafe");                  field.setAccessible(true);                  unsafe = (Unsafe)field.get(null);                    Field iField = CounterUnsafe.class.getDeclaredField("i");                  iField.setAccessible(true);                  valueOffset = unsafe.objectFieldOffset(iField);              } catch (NoSuchFieldException e) {                  e.printStackTrace();              } catch (IllegalAccessException e) {                  e.printStackTrace();              }          }            private void transferOld() throws InterruptedException {              System.out.println("開始轉賬(舊系統:存在ABA問題)");              while(true) {                  int current = unsafe.getIntVolatile(this,valueOffset);                  System.out.println("由於CPU搶佔問題,轉賬程式阻塞100ms(為了將可能出現的ABA問題,變成肯定出現)");                  Thread.sleep(100);                  if (unsafe.compareAndSwapInt(this,valueOffset,current,current+1)){                      System.out.println("銀行轉賬"+1+"元,成功。餘額:"+k);                      break;                  }                  System.err.println("警告:賬戶存在交易記錄以外的資金流動");              }          }            private void cleanMoneySub() {              while(true) {                  int current = unsafe.getIntVolatile(this,valueOffset);                  if (unsafe.compareAndSwapInt(this,valueOffset,current,current-2)){                      break;                  }              }              System.out.println("非法組織洗錢,盜走2元,餘額:"+k);          }            private void cleanMoneyAdd(){              while(true) {                  int current = unsafe.getIntVolatile(this,valueOffset);                  if (unsafe.compareAndSwapInt(this,valueOffset,current,current+2)){                      break;                  }              }              System.out.println("非法組織洗錢,加入2元,餘額:"+k);          }            public void oldSystemTransfer() throws InterruptedException {              ABATest abaTest = new ABATest();              System.out.println("賬戶餘額:"+k);                new Thread(new Runnable() {                  @Override                  public void run() {                      try {                          abaTest.transferOld();                      } catch (InterruptedException e) {                          e.printStackTrace();                      }                  }              }).start();                Thread.sleep(20);              abaTest.cleanMoneyAdd();              Thread.sleep(20);              abaTest.cleanMoneySub();                Thread.sleep(200);              System.out.println("銀行卡原來餘額為10,接收轉賬1元,故期望餘額為11元。實際餘額:"+abaTest.k);          }            public static void main(String[] args) throws InterruptedException {              ABATest abaTest = new ABATest();              abaTest.oldSystemTransfer();              /**               * 運行結果:               * 賬戶餘額:10               * 開始轉賬(舊系統:存在ABA問題)               * 由於CPU搶佔問題,轉賬程式阻塞100ms(為了將可能出現的ABA問題,變成肯定出現)               * 非法組織洗錢,加入2元,餘額:12               * 非法組織洗錢,盜走2元,餘額:10               * 銀行轉賬1元,成功。餘額:11               * 銀行卡原來餘額為10,接收轉賬1元,故期望餘額為11元。實際餘額:11               */          }      }  

ABAResolveTest

這是一個修復了ABA問題的示例。示例中銀行正常發現客戶賬戶上的非法洗錢行為。

      package tech.jarry.learning.netease.casWithABA;        import java.util.concurrent.atomic.AtomicStampedReference;        /**       * @Description:       * @Author: jarry       */      public class ABAResolveTest {            private AtomicStampedReference<Integer> kReference = new AtomicStampedReference<>(10,0);            private void transferNew() throws InterruptedException {              System.out.println("開始轉賬(新系統:解決了ABA問題)");              while(true) {                  Integer currentReference = kReference.getReference();                  int stamp = kReference.getStamp();                  System.out.println("由於CPU搶佔問題,轉賬程式阻塞100ms");                  Thread.sleep(100);                  if (kReference.compareAndSet(currentReference,currentReference+1,stamp,stamp+1)){                      System.out.println("銀行轉賬"+1+"元,成功。餘額:"+kReference.getReference());                      break;                  }                  System.err.println("警告:賬戶存在交易記錄以外的資金流動");              }          }            private void cleanMoneySub(){              int stamp = kReference.getStamp();              kReference.set(kReference.getReference()+2,stamp+1);              System.out.println("非法組織洗錢,盜走2元,餘額:"+kReference.getStamp());          }            private void cleanMoneyAdd(){              int stamp = kReference.getStamp();              kReference.set(kReference.getReference()-2,stamp+1);              System.out.println("非法組織洗錢,加入2元,餘額:"+kReference.getStamp());          }            private void newSystemTransfer() throws InterruptedException {              ABAResolveTest abaResolveTest = new ABAResolveTest();              System.out.println("賬戶餘額:"+abaResolveTest.kReference.getReference());                new Thread(new Runnable() {                  @Override                  public void run() {                      try {                          abaResolveTest.transferNew();                      } catch (InterruptedException e) {                          e.printStackTrace();                      }                  }              }).start();                Thread.sleep(20);              abaResolveTest.cleanMoneyAdd();              Thread.sleep(20);              abaResolveTest.cleanMoneySub();                Thread.sleep(200);              System.out.println("銀行卡原來餘額為10,接收轉賬1元,故期望餘額為11元。實際餘額:"+abaResolveTest.kReference.getReference());          }            public static void main(String[] args) throws InterruptedException {              ABAResolveTest abaResolveTest = new ABAResolveTest();              abaResolveTest.newSystemTransfer();              /**               * 運行結果:               * 賬戶餘額:10               * 開始轉賬(新系統:解決了ABA問題)               * 由於CPU搶佔問題,轉賬程式阻塞100ms               * 非法組織洗錢,加入2元,餘額:1               * 非法組織洗錢,盜走2元,餘額:2               * 警告:賬戶存在交易記錄以外的資金流動               * 由於CPU搶佔問題,轉賬程式阻塞100ms               * 銀行轉賬1元,成功。餘額:11               * 銀行卡原來餘額為10,接收轉賬1元,故期望餘額為11元。實際餘額:11               */          }      }  

上述的兩個例子,也許不是最適合的,但確實闡述了我想要表達的想法。

話說回來,只有到自己寫demo時,才能理解大佬寫ABA的demo時內心的掙扎啊。囧

ABA問題的解決

ABA問題的解決,說白了就是通過引入版本號,從而解決ABA問題的造成的隱患。

用我的話說呢,就是通過引入版本號,了解到執行緒執行操作時,是否有別的執行緒做了類似ABA的事情,從而使得本執行緒的CAS操作重新執行。這裡為什麼重新執行,因為簡單啊。當然,也可以如我那樣打個輸出或者注釋什麼的(可能會浪費系統資源)。不管怎麼處理,起碼這次我知道有這麼個問題了。囧。

小結

至此,CAS機制,ABA問題及解決方案,都已經敘述完畢了。

核心總結:

ABA問題的本質就是由於對多執行緒下CAS流程式控制制的缺乏,而導致的資訊缺失。表現出來的就是由於缺乏必要資訊,而產生了隱患

該說的差不多都說了,簡單回顧一下:

  • 凡事都有其利弊,往往弊端就是由於其優點帶來的。如CAS的硬體支援。
  • 技術的學習,需要追尋技術特性的真正來源,才可以一步步走向架構師。
  • 學習,一方面需要尋求多方資料,另一方面也需要自己的理解與驗證。
  • 遇到無法理解或者無法解讀的事物時,就去尋找它的定義,它的原則。