Java 並發編程(二):如何保證共享變量的原子性?

  • 2019 年 10 月 3 日
  • 筆記

線程安全性是我們在進行 Java 並發編程的時候必須要先考慮清楚的一個問題。這個類在單線程環境下是沒有問題的,那麼我們就能確保它在多線程並發的情況下表現出正確的行為嗎?

我這個人,在沒有副業之前,一心撲在工作上面,所以處理的蠻得心應手,心態也一直保持的不錯;但有了副業之後,心態就變得像坐過山車一樣。副業收入超過主業的時候,人特別亢奮,像打了雞血一樣;副業遲遲打不開局面的時候,人就變得惶惶不可終日。

彷彿我就只能是個單線程,副業和主業並行開啟多線程模式的時候,我就變得特別沒有安全感,儘管整體的收入比沒有副業之前有了很大的改善。

怎麼讓我自己變得有安全感,我還沒想清楚(你要是有好的方法,請一定要告訴我)。但怎麼讓一個類在多線程的環境下是安全的,有 3 條法則,讓我來告訴你:

1、不在線程之間共享狀態變量。
2、將狀態變量改為不可變。
3、訪問狀態變量時使用同步。

那你可能要問,狀態變量是什麼?

我們先來看一個沒有狀態變量的類吧,代碼示例如下。

class Chenmo {
    public void write() {
        System.out.println("我尋了半生的春天,你一笑便是了。");
    }
}

Chenmo 這個類就是無狀態變量的,它只有一個方法,既沒有成員變量,也沒有類變量。任何訪問它的線程都不會影響另外一個線程的結果,因為兩個線程之間沒有共享任何的狀態變量。所以可以下這樣一個結論:無狀態變量的類一定是線程安全的

然後我們再來看一個有狀態變量的類。假設沉默(Chenmo 類)每寫一行字(write() 方法),就要做一次統計,這樣好找出版社索要稿費。我們為 Chenmo 類增加一個統計的字段,代碼示例如下。

class Chenmo {
    private long count = 0;
    public void write() {
        System.out.println("我尋了半生的春天,你一笑便是了。");
        count++;
    }
}

Chenmo 類在單線程環境下是可以準確統計出行數的,但多線程的環境下就不行了。因為遞增運算 count++ 可以拆分為三個操作:讀取 count,將 count 加 1,將計算結果賦值給 count。多線程的時候,這三個操作發生的時序可能是混亂的,最終統計出來的 count 值就會比預期的值小。

PS:具體的原因可以回顧上一節《Java 並發編程(一):摩拳擦掌

寫作不易,咱不能虧待了沉默,對不對?那就想點辦法吧。

假定線程 A 正在修改 count 變量,這時候就要防止線程 B 或者線程 C 使用這個變量,從而保證線程 B 或者線程 C 在使用 count 的時候是線程 A 修改過後的狀態。

怎麼防止呢?可以在 write() 方法上加一個 synchronized 關鍵字。代碼示例如下。

class Chenmo {
    private long count = 0;
    public synchronized void write() {
        System.out.println("我尋了半生的春天,你一笑便是了。");
        count++;
    }
}

關鍵字 synchronized 是一種最簡單的同步機制,可以確保同一時刻只有一個線程可以執行 write(),也就保證了 count++ 在多線程環境下是安全的。

在編寫並發應用程序時,我們必須要保持一種正確的觀念,那就是——首先要確保代碼能夠正確運行,然後再是如何提高代碼的性能。

但眾所周知,synchronized 的代價是昂貴的,多個線程之間訪問 write() 方法是互斥的,線程 B 訪問的時候必須要等待線程 A 訪問結束,這無法體現出多線程的核心價值。

java.util.concurrent.atomic.AtomicInteger 是一個提供原子操作的 Integer 類,它提供的加減操作是線程安全的。於是我們可以這樣修改 Chenmo 類,代碼示例如下。

class Chenmo {
    private AtomicInteger count = new AtomicInteger(0);
    public void write() {
        System.out.println("我尋了半生的春天,你一笑便是了。");
        count.incrementAndGet();
    }
}

write() 方法不再需要 synchronized 關鍵字保持同步,於是多線程之間就不再需要以互斥的方式來調用該方法,可以在一定程度上提升統計的效率。

某一天,出版社統計稿費的形式變了,不僅要統計行數,還要統計字數,於是 Chenmo 類就需要再增加一個成員變量了。代碼示例如下。

class Chenmo {
    private AtomicInteger lineCount = new AtomicInteger(0);
    private AtomicInteger wordCount = new AtomicInteger(0);
    public void write() {
        String words = "我這一輩子,走過許多地方的路,行過許多地方的橋,看過許多次的雲,喝過許多種類的酒,卻只愛過一個正當年齡的人。";
        System.out.println(words);
        lineCount.incrementAndGet();
        wordCount.addAndGet(words.length());
    }
}

你覺得這段代碼是線程安全的嗎?

結果顯而易見,這段代碼不是線程安全的。因為 lineCount 和 wordCount 是兩個變量,儘管它們各自是線程安全的,但線程 A 進行 lineCount 加 1 的時候,並不能夠保證線程 B 是在線程 A 執行完 wordCount 統計後開始 lineCount 加 1 的。

 

 

該怎麼辦呢?方法也很簡單,代碼示例如下。

class Chenmo {
    private int lineCount = 0;
    private int wordCount = 0;
    public void write() {
        String words = "我這一輩子,走過許多地方的路,行過許多地方的橋,看過許多次的雲,喝過許多種類的酒,卻只愛過一個正當年齡的人。";
        System.out.println(words);

        synchronized (this) {
            lineCount++;
            wordCount++;
        }
    }
}

對行數統計(lineCount++)和字數統計(wordCount++)的代碼進行加鎖,保證這兩行代碼是原子性的。也就是說,線程 B 在進行統計的時候,必須要等待線程 A 統計完之後再開始。

synchronized (lock) {...} 是 Java 提供的一種簡單的內置鎖機制,用於保證代碼塊的原子性。線程在進入加鎖的代碼塊之前自動獲取鎖,並且退出代碼塊的時候釋放鎖,可以保證一組語句作為一個不可分割的單元被執行。


上一篇:Java 並發編程(一):摩拳擦掌