關於同步方法裏面調用異步方法的探究

  • 2020 年 4 月 30 日
  • 筆記

前言

我在寫代碼的時候(.net core)有時候會碰到void方法里,調用async方法並且Wait,而且我還看到別人這麼寫了。而且我這麼寫的時候,編譯器沒有提示任何警告。但是看了dudu的文章:一碼阻塞,萬碼等待:ASP.NET Core 同步方法調用異步方法「死鎖」的真相 了解了,這樣寫是有問題的。但是為什麼會有問題呢?我又閱讀了dudu文章里提到的一篇博文:.NET Threadpool starvation, and how queuing makes it worse 加上自己親手實驗,寫下自己的理解,算是對dudu博文的一個補充和豐富吧。

同步方法里調用異步方法

同步方法里調用異步方法,一種是wait() 一種是不wait()

void fun()
{  
    funAsync.Wait();
    funAsync();
}

這兩種場景都沒有編譯錯誤。
首先我們來看一下,在 void里調用 async 方法,並且要等待async的結果出來之後,才能進行後續的操作。

using System;
using System.Threading;
using System.Threading.Tasks;

namespace ConsoleTool2
{
    class Program
    {
        static void Main(string[] args)
        {
            Producer();
        }

        static void Producer()
        {
            var result = Process().Result;
            //或者
            //Process().Wait();
        }

        static async Task<bool> Process()
        {
            await Task.Run(() =>
            {
                Thread.Sleep(1000);
            });

            Console.WriteLine("Ended - " + DateTime.Now.ToLongTimeString());
            return true;
        }
    }
}

咱們看這個Producer,這是一個void方法,裏面調用了異步方法Process(),其中Process()是一個執行1秒的異步方法,調用的方式是Process().Result 或者Process().Wait()。咱們來運行一遍。

沒有任何問題。看起來,這樣寫完全沒有問題啊,不報錯,運行也是正常的。
接下來,我們修改一下代碼,讓代碼更加接近生產環境的狀態。

using System;
using System.Threading;
using System.Threading.Tasks;

namespace ConsoleTool2
{
    class Program
    {
        static void Main(string[] args)
        {
            while (true)
            {
                Task.Run(Producer);
                Thread.Sleep(200);
            }
        }

        static void Producer()
        {
            var result = Process().Result;
        }

        static async Task<bool> Process()
        {
            await Task.Run(() =>
            {
                Thread.Sleep(1000);
            });

            Console.WriteLine("Ended - " + DateTime.Now.ToLongTimeString());
            return true;
        }
    }
}

我們在Main函數里加了for循環,並且1秒鐘執行5次Producer(),使用Task.Run(),1秒鐘有5個Task產生。相當於生產環境的qps=5。
接下來我們再執行下,看看結果:

在第一秒里只執行了兩次Task,就卡住了。我們再看下進程信息:

沒有CPU消耗,但是線程數一直增加,直到突破一台電腦的最大線程數,導致服務器宕機。
這明顯出現問題了,線程肯定發生了死鎖,而且還在不斷產生新的線程。
至於為什麼只執行了兩次Task,我們可以猜測是因為程序中初始的TreadPool 中只有兩個線程,所以執行了兩次Task,然後就發生了死鎖。

現在我們定義一個Produce2() 這是一個正常的方法,異步函數調用異步函數。

 static async Task Producer2()
        {
            await Process();
        }

我們再Main函數的循環里,執行Producer2() ,執行信息如下:

仔細觀察這個圖,我們發現第一秒執行了一個Task,第二秒執行了三個Task,從第三秒開始,就穩定執行了4-5次Task,這裡的時間統計不是很精確,但是可以肯定從某個時間開始,程序達到了預期效果,TreadPool中的線程每秒中都能穩定的完成任務。而且我們還能觀察到,在最開始,程序是反應很慢的,那個時候線程不夠用,同時應該在申請新的線程,直到後來線程足夠處理這樣的情況了。咱們再看看這個時候的進程信息:

線程數一直穩定在25個,也就是說25個線程就能滿足這個程序的運行了。
到此我們可以證明,在同步方法里調用異步方法確實是不安全的,尤其在並發量很高的情況下。

探究原因

我們再深層次討論下為什麼同步方法里調用異步方法會卡死,而異步方法調用異步方法則很安全呢?

咱們回到一開始的代碼里,我們加上一個初始化線程數量的代碼,看看這樣是否還是會出現卡死的狀況。
由於前面的分析我們知道,這個程序在一秒中並行執行5個Task,每個Task裏面也就是Producer 都會執行一個Processer 異步方法,所以粗略估計需要10個線程。於是我們就初始化線程數為10個。

using System;
using System.Threading;
using System.Threading.Tasks;

namespace ConsoleTool2
{
    class Program
    {
        static void Main(string[] args)
        {
            ThreadPool.SetMinThreads(10, 10);
           
            while (true)
            {
                Task.Run(Producer2);
                Thread.Sleep(200);
            }
        }

        static void Producer()
        {
            var result = Process().Result;
        }

        static async Task Producer2()
        {
            await Process();
        }

        static async Task<bool> Process()
        {
            await Task.Run(() =>
            {
                Thread.Sleep(1000);
            });

            Console.WriteLine("Ended - " + DateTime.Now.ToLongTimeString());
            return true;
        }
    }
}

運行一下發現,是沒問題的。說明一開始設置多的線程是有用的,經過實驗發現,只要初始線程小於10個,都會出現死鎖。而.net core的默認初始線程是肯定小於10個的。

那麼當初始線程小於10個的時候,發生什麼了?發生了大家都聽說過的名詞,線程飢餓。就是線程不夠用了,這個時候ThreadPool生產新的線程滿足需求。

然後我們再關注下,同步方法里調用異步方法並且.Wait()的情況下會發生什麼。

void Producer()
{
    Process().Wait()
}

首先有一個線程A ,開始執行Producer , 它執行到了Process 的時候,新產生了一個的線程 B 去執行這個Task。這個時候 A 會掛起,一直等 B 結束,B被釋放,然後A繼續執行剩下的過程。這樣執行一次Producer 會用到兩個線程,並且A 一直掛起,一直不工作,一直在等B。這個時候線程A 就會阻塞。

Task Producer()
{
   await Process();
}

這個和上面的區別就是,同時線程A,它執行到Producer的時候,產生了一個新的線程B執行 Process。但是 A 並沒有等B,而是被ThreadPool拿來做別的事情,等B結束之後,ThreadPool 再拿一個線程出來執行剩下的部分。所以這個過程是沒有線程阻塞的。

再結合線程飢餓的情況,也就是ThreadPool 中發生了線程阻塞+線程飢餓,會發生什麼呢?
假設一開始只有8個線程,第一秒中會並行執行5個Task Producer, 5個線程被拿來執行這5個Task,然後這個5個線程(A)都在阻塞,並且ThreadPool 被要求再拿5個線程(B)去執行Process,但是線程池只剩下3個線程,所以ThreadPool 需要再產生2個線程來滿足需求。但是ThreadPool 1秒鐘最多生產2個線程,等這2個線程被生產出來以後,又過去了1秒,這個時候無情又進來5個Task,又需要10個線程了。別忘了執行第一波Task的一些線程應該釋放了,釋放多少個呢?應該是3個Task佔有的線程,因為有2個在等TreadPool生產新線程嘛。所以釋放了6個線程,5個Task,6個線程,計算一下,就可以知道,只有一個Task可以被完全執行,其他4個都因為沒有新的線程執行Process而阻塞。
於是ThreadPool 又要去產生4個新的線程去滿足4個被阻塞的Task,花了2秒時間,終於生產完了。但是糟糕又來了10個Task,需要20個線程,而之前釋放的線程已經不足以讓任何一個Task去執行Process了,因為這些不足的線程都被分配到了Producer上,沒有線程再可以去執行Process了(經過上面的分析一個Task需要2個線程A,B,並且A阻塞,直到B執行Process完成)。
所以隨着時間的流逝,要執行的Task越來越多卻沒有一個能執行結束,而線程也在不斷產生,就產生了我們上面所說的情況。

我們該怎麼辦?

經過上面的分析我們知道,在線程飢餓的情況下,使用同步方法調用異步方法並且wait結果,是會出問題的,那麼我們應該怎麼辦呢?
首先當然是應該避免這種有風險的做法。

其次,還有一種方法。經過實驗,我發現,使用專有線程

Task.Run(Producer);
改成
Task.Factory.StartNew(
          Producer,
          TaskCreationOptions.LongRunning
   );

就是TaskCreationOptions.LongRunning 選項,就是開闢一個專用線程,而不是在ThreadPool中拿線程,這樣是不會發生死鎖的。
因為ThreadPool 不管理專用線程,每一個Task進來,都會有專門的線程執行,而Process 則是由ThreadPool 中的線程執行,這樣TheadPool中的線程其實是不存在阻塞的,因此也不存在死鎖。

結語

關於ThreadPool 中的線程調用算法,其實很簡單,每個線程都有一個自己的工作隊列local queue,此外線程池中還有一個global queue全局工作隊列,首先一個線程被創建出來後,先看看自己的工作隊列有沒有被分配task,如果沒有的話,就去global queue找task,如果還沒有的話,就去別的線程的工作隊列找Task。

第二種情況:在同步方法里調用異步方法,不wait()
如果這個異步方法進入的是global Task 則在線程飢餓的情況下,也會發生死鎖的情況。至於為什麼,可以看那篇博文里的解釋,因為global Task的優先級很高,所有新產生的線程都去執行global Task,而global task又需要一個線程去執行local task,所以產生了死鎖。