Linux系統編程 —時序競態

  • 2020 年 10 月 5 日
  • 筆記

時序競態

什麼是時序競態?將同一個程式執行兩次,正常情況下,前後兩次執行得到的結果應該是一樣的。但由於系統資源競爭的原因,前後兩次執行的結果有可能得到不一樣的結果,這個現象就是時序競態

pause函數

函數原型:

int pause(void);

函數作用:

進程調用pause函數時,會造成進程主動掛起(處於阻塞狀態,並主動放棄CPU),並且等待訊號將其喚醒。

返回值:

我們知道,訊號的處理方式有三種:1. 默認動作;2. 忽略處理;3. 捕捉。進程收到一個訊號後,會先處理響應訊號,再喚醒pause函數。於是有下面幾種情況:

① 如果訊號的默認處理動作是終止進程,則進程將被終止,也就是說一收到訊號進程就終止了,pause函數根本就沒有機會返回;

② 如果訊號的默認處理動作是忽略,則進程將直接忽略該訊號,相當於沒收到這個訊號,進程繼續處於掛起狀態,pause函數不返回;

③ 如果訊號的處理動作是捕捉,則進程調用完訊號處理函數之後,pause返回-1,errno設置為EINTR,表示「被訊號中斷」。

④ pause收到的訊號不能被屏蔽,如果被屏蔽,那麼pause就不能被喚醒。

因為alarm函數可以在設定的時間之後發送SIGALRM訊號,pause函數又可以將進程掛起等待訊號,則二者結合可以自己寫一個sleep函數,如下:

 1#include <unistd.h>
 2#include <signal.h>
 3#include <stdio.h>
 4
 5void sig_alrm(int signo)
 6{
 7    /* nothing to do */
 8}
 9
10unsigned int mysleep(unsigned int nsecs)
11{
12    unsigned int unslept;
13
14    signal(SIGALRM, &sig_alrm);
15    unslept = alarm(nsecs); 
16    pause();
17
18    return unslept;
19}
20
21
22int main(void)
23{
24    while(1){
25        mysleep(2);
26        printf("Two seconds passed\n");
27    }
28
29    return 0;
30}

時序競態前導例

在講時序競態具體現象之前,我們先來看一個生活中常見的場景:

想午睡10分鐘,於是定了個10分鐘的鬧鐘,希望10分鐘後鬧鐘將自己叫醒。

正常情況:定好鬧鐘,午睡,10分鐘後鬧鐘叫醒自己;

異常情況:定好鬧鐘,躺下睡覺2分鐘,被同學叫醒去打球,打了20分鐘後回來繼續睡覺。但在打球期間,鬧鐘早就響過了,將不會再喚醒自己。

這個例子與之後要講的時序競態有很大的相似之處。

時序競態問題分析

我們再回過頭來看上面所寫的mysleep程式。這個函數有可能是下面的時序:

  1. SIGALRM默認動作是終止進程,因此我們要將其捕捉,對SIGALRM註冊訊號處理函數;

  2. 調用alarm(1)函數定時1秒鐘;

  3. alarm(1)調用結束,定時器開始計時。就在這時,進程失去CPU,進入就緒態等待CPU(相當於被同學叫醒去打球)。失去CPU的方式有可能是內核調度了優先順序更高的進程取代了當前進程,使得當前進程無法獲得CPU;

  4. 我們知道,alarm函數如果採用自然定時法的話,定時器將一直計時,與進程狀態無關。於是,1秒後,鬧鐘定時時間到,內核向當前進程發送SIGALRM訊號。高優先順序進程尚未執行完畢,當前進程仍然無法獲得CPU,繼續處於就緒態,訊號無法處理(處於未決狀態);

  5. 優先順序高的進程執行完畢,當前進程獲得CPU資源,內核調度回當前進程執行。SIGALRM訊號遞達,並被進程處理;

  6. 訊號處理完畢後,返回當前主控流程,並調用pause()函數,掛起等待alarm函數發送的SIGALRM訊號將自己喚醒;

  7. 但實際SIGALRM訊號已經處理完畢,pause()函數永遠不會等到。

解決時序競態問題

通過以上時序分析,我們可以看出,造成時序競態的原因就是SIGALRM訊號在進程失去CPU的時候就已經發送過來。為了防止這個現象出現,我們可以先將該訊號阻塞,將其「抓住」,再在解除阻塞的時候立刻調用pause函數掛起等待。這樣即使在調用alarm就失去CPU,也可以在進程重新獲得CPU時將抓到的SIGALRM訊號重新「放出來」,並將之後的pause函數喚醒。

但在解除阻塞與pause等待掛起訊號之間,還是有可能失去CPU,除非將這兩個步驟做成一個「原子操作」。Linux系統提供的sigsuspend函數就具備這個功能。所以,在時序要求比較嚴格的場合下都應該使用sigsuspend函數,而非pause函數。

函數原型:

int sigsuspend(const sigset_t *mask);

函數作用:

掛起等待訊號;

函數參數:

mask,傳入參數,sigsuspend函數調用期間,進程訊號屏蔽字由參數mask指定。

具體用法:可將某個訊號(如SIGALRM)從臨時訊號屏蔽字mask中刪除,也就是在調用sigsuspend函數時對該訊號解除屏蔽,然後掛起等待訊號。但我們此時已經改變了進程的訊號屏蔽字,所以調用完sigsuspend函數之後,應將進程的訊號屏蔽字恢復原樣。

 1#include <unistd.h>
 2#include <signal.h>
 3#include <stdio.h>
 4
 5void sig_alrm(int signo)
 6{
 7    /* nothing to do */
 8}
 9
10unsigned int mysleep(unsigned int nsecs)
11{
12    struct sigaction newact, oldact;
13    sigset_t newmask, oldmask, suspmask;
14    unsigned int unslept;
15
16    //1.為SIGALRM設置捕捉函數,一個空函數
17    newact.sa_handler = sig_alrm;
18    sigemptyset(&newact.sa_mask);
19    newact.sa_flags = 0;
20    sigaction(SIGALRM, &newact, &oldact);
21
22    //2.設置阻塞訊號集,阻塞SIGALRM訊號
23    sigemptyset(&newmask);
24    sigaddset(&newmask, SIGALRM);
25   sigprocmask(SIG_BLOCK, &newmask, &oldmask);   //訊號屏蔽字 mask
26
27    //3.定時n秒,到時後可以產生SIGALRM訊號
28    alarm(nsecs);
29
30    /*4.構造一個調用sigsuspend臨時有效的阻塞訊號集,
31     *  在臨時阻塞訊號集里解除SIGALRM的阻塞*/
32    suspmask = oldmask;
33    sigdelset(&suspmask, SIGALRM);
34
35    /*5.sigsuspend調用期間,採用臨時阻塞訊號集suspmask替換原有阻塞訊號集
36     *  這個訊號集中不包含SIGALRM訊號,同時掛起等待,
37     *  當sigsuspend被訊號喚醒返回時,恢復原有的阻塞訊號集*/
38    sigsuspend(&suspmask); 
39
40    unslept = alarm(0);
41    //6.恢復SIGALRM原有的處理動作,呼應前面注釋1
42    sigaction(SIGALRM, &oldact, NULL);
43
44    //7.解除對SIGALRM的阻塞,呼應前面注釋2
45    sigprocmask(SIG_SETMASK, &oldmask, NULL);
46
47    return(unslept);
48}
49
50int main(void)
51{
52    while(1){
53        mysleep(2);
54        printf("Two seconds passed\n");
55    }
56
57    return 0;
58}

可重入函數/不可重入函數

一個函數在被調用執行期間尚未調用結束的時候,由於某種時序,該函數又被重複調用,這種情況稱為「重入」。如果從訊號處理程式返回,則繼續執行進程斷點處的正常指令序列,從重新恢復到斷點重新執行的過程中,函數所依賴的環境沒有發生改變,就說這個函數是可重入的,反之就是不可重入的。

如果要將函數做成可重入函數,則函數內不能含有全局變數及static變數,也不能使用malloc、free。

更多精彩內容,請關注公眾號良許Linux,公眾內回復1024可免費獲得5T技術資料,包括:Linux,C/C++,Python,樹莓派,嵌入式,Java,人工智慧,等等。公眾號內回復進群,邀請您進高手如雲技術交流群。

img


公眾號:良許Linux

有收穫?希望老鐵們來個三連擊,給更多的人看到這篇文章