關於Redis在windows上運行及fork函數問題

Redis在將數據庫進行持久化操作時,需要fork一個進程,但是windows並不支持fork,導致在持久化操作期間,Redis必須阻塞所有的客戶端直至持久化操作完成。微軟的一些工程師花費時間在解決在windows環境下Redis無法進行後台保存,並決定使用線程代替fork產生的子進程來對硬盤執行寫操作,但這給分支只提供了源碼並沒有提供預編譯二進制文件,並且微軟不保證它能否用於生產環境。

上面這段是我摘抄於黃健宏老師翻譯的《Redis實戰》這本書的。

下面我解釋一下fork函數的一些問題

  • fork函數

fork()函數通過系統調用創建一個與原來進程幾乎完全相同的進程。

下面的側重點在於fork與遞歸的區分。

創建fork_test1.c

我們可以touch fork_test1.c,

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>

int main(int argc, char **argv) {
    pid_t pid = fork();
    if (pid==0) {
        printf("我是父進程,pid是: %d\n",getpid());
        exit(0);
    } else if (pid > 0) {
        printf("我是子進程,pid是: %d\n",getpid());
    } else {
        printf("Error while forking\n");
        exit(EXIT_FAILURE);
    }
    return 0;
}

使用cc fork_test.c進行編譯。

執行可執行文件a.out

./a.out
我是子進程,pid是: 1492
我是父進程,pid是: 1493

為什麼沒有死遞歸

觀察執行結果會發現的子進程的返回值是0,至於為什麼是0,暫不討論。

我好奇的是程序為什麼沒有進行死遞歸,因為我認為程序會複製一份重新運行。

經過一番查閱後發現,因為,fork是複製父進程的數據段,堆,棧等,因此,父進程與子進程執行程序位置也是相同的,函數fork完之後,父進程與子進程同時執行到到了第一個if語句,因此子進程並不會重新執行fork()函數,因此沒有遞歸。

驗證一下

我們可以touch fork_test2.c,

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>

int main(int argc, char **argv) {
    printf("abcd");
    pid_t pid = fork();
    if (pid==0) {
        printf("我是父進程,pid是: %d\n",getpid());
        exit(0);
    } else if (pid > 0) {
        printf("我是子進程,pid是: %d\n",getpid());
    } else {
        printf("Error while forking\n");
        exit(EXIT_FAILURE);
    }
    return 0;
}

編譯

cc fork_test2.c

執行

./a.out

你會發現程序沒有死遞歸。

上面難道是錯的

但是觀察結果你會發現為什麼”abcd”輸出了兩次,不是兩個進程都執行到了第一個if語句嗎?為什麼子進程也會輸出。

上面講的並沒有錯,你應該注意到,fork()的複製就包括輸出緩衝區。

而程序並不會立即把輸出的數據顯示到屏幕上,而是先存儲在輸出緩衝區中,當滿足一定條件時才顯示出來。

輸出緩衝區類型

緩衝區的類型:

  緩衝區 分為三種類型:全緩衝、行緩衝和不帶緩衝。

  1、全緩衝

  在這種情況下,當填滿標準I/O緩存後才進行行實際I/O操作。全緩衝的典型代表是對磁盤文件的讀寫。

  2、行緩衝

  在這種情況下,當在輸入和輸出中遇到換行符時,執行真正的I/O操作。這時,我們輸入的字符先存放在緩衝區,等按下回車鍵換行時才進行實際的I/O操作。典型代表是鍵盤輸入數據。

  3、不帶緩衝

  也就是不進行緩衝,標準出錯情況stderr是典型代表,這使得出錯信息可以直接儘快地顯示出來。

所以,因為我們的fork_test2.c沒有觸發任何刷新緩衝區的操作,因此複製的時候子進程的緩衝區中也會有”abcd”,所以就會輸出兩次。

如何觸發緩衝區刷新

那麼我們就觸發緩衝區刷新的操作,如何觸發呢?

1、遇到\n
2、程序結束        
3、遇到輸入語句
4、當緩衝區滿時
5、fflush(stdout) 手動刷新

我們嘗試用第一種方法修改代碼,

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>

int main(int argc, char **argv) {
    printf("abcd\n");
    pid_t pid = fork();
    if (pid==0) {
        printf("我是父進程,pid是: %d\n",getpid());
        exit(0);
    } else if (pid > 0) {
        printf("我是子進程,pid是: %d\n",getpid());
    } else {
        printf("Error while forking\n");
        exit(EXIT_FAILURE);
    }
    return 0;
}

撥雲見日

然後重新編譯運行,你會發現”abcd”只會被輸出一次,子進程複製的輸出緩衝區為空。到此解釋了fork·與遞歸的一些問題。

如果有什麼問題大家可以在下面留言。