關於Redis在windows上運行及fork函數問題
Redis在將數據庫進行持久化操作時,需要fork一個進程,但是windows並不支持fork,導致在持久化操作期間,Redis必須阻塞所有的客戶端直至持久化操作完成。微軟的一些工程師花費時間在解決在windows環境下Redis無法進行後台保存,並決定使用線程代替fork產生的子進程來對硬盤執行寫操作,但這給分支只提供了源碼並沒有提供預編譯二進制文件,並且微軟不保證它能否用於生產環境。
上面這段是我摘抄於黃健宏老師翻譯的《Redis實戰》這本書的。
下面我解釋一下fork函數的一些問題
- fork函數
fork()函數通過系統調用創建一個與原來進程幾乎完全相同的進程。
下面的側重點在於fork與遞歸的區分。
創建fork_test1.c
我們可以touch fork_test1.c,
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>
int main(int argc, char **argv) {
pid_t pid = fork();
if (pid==0) {
printf("我是父進程,pid是: %d\n",getpid());
exit(0);
} else if (pid > 0) {
printf("我是子進程,pid是: %d\n",getpid());
} else {
printf("Error while forking\n");
exit(EXIT_FAILURE);
}
return 0;
}
使用cc fork_test.c進行編譯。
執行可執行文件a.out
./a.out
我是子進程,pid是: 1492
我是父進程,pid是: 1493
為什麼沒有死遞歸
觀察執行結果會發現的子進程的返回值是0,至於為什麼是0,暫不討論。
我好奇的是程序為什麼沒有進行死遞歸,因為我認為程序會複製一份重新運行。
經過一番查閱後發現,因為,fork是複製父進程的數據段,堆,棧等,因此,父進程與子進程執行程序位置也是相同的,函數fork完之後,父進程與子進程同時執行到到了第一個if語句,因此子進程並不會重新執行fork()函數,因此沒有遞歸。
驗證一下
我們可以touch fork_test2.c,
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>
int main(int argc, char **argv) {
printf("abcd");
pid_t pid = fork();
if (pid==0) {
printf("我是父進程,pid是: %d\n",getpid());
exit(0);
} else if (pid > 0) {
printf("我是子進程,pid是: %d\n",getpid());
} else {
printf("Error while forking\n");
exit(EXIT_FAILURE);
}
return 0;
}
編譯
cc fork_test2.c
執行
./a.out
你會發現程序沒有死遞歸。
上面難道是錯的
但是觀察結果你會發現為什麼”abcd”輸出了兩次,不是兩個進程都執行到了第一個if語句嗎?為什麼子進程也會輸出。
上面講的並沒有錯,你應該注意到,fork()的複製就包括輸出緩衝區。
而程序並不會立即把輸出的數據顯示到屏幕上,而是先存儲在輸出緩衝區中,當滿足一定條件時才顯示出來。
輸出緩衝區類型
緩衝區的類型:
緩衝區 分為三種類型:全緩衝、行緩衝和不帶緩衝。
1、全緩衝
在這種情況下,當填滿標準I/O緩存後才進行行實際I/O操作。全緩衝的典型代表是對磁盤文件的讀寫。
2、行緩衝
在這種情況下,當在輸入和輸出中遇到換行符時,執行真正的I/O操作。這時,我們輸入的字符先存放在緩衝區,等按下回車鍵換行時才進行實際的I/O操作。典型代表是鍵盤輸入數據。
3、不帶緩衝
也就是不進行緩衝,標準出錯情況stderr是典型代表,這使得出錯信息可以直接儘快地顯示出來。
所以,因為我們的fork_test2.c沒有觸發任何刷新緩衝區的操作,因此複製的時候子進程的緩衝區中也會有”abcd”,所以就會輸出兩次。
如何觸發緩衝區刷新
那麼我們就觸發緩衝區刷新的操作,如何觸發呢?
1、遇到\n
2、程序結束
3、遇到輸入語句
4、當緩衝區滿時
5、fflush(stdout) 手動刷新
我們嘗試用第一種方法修改代碼,
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/types.h>
int main(int argc, char **argv) {
printf("abcd\n");
pid_t pid = fork();
if (pid==0) {
printf("我是父進程,pid是: %d\n",getpid());
exit(0);
} else if (pid > 0) {
printf("我是子進程,pid是: %d\n",getpid());
} else {
printf("Error while forking\n");
exit(EXIT_FAILURE);
}
return 0;
}
撥雲見日
然後重新編譯運行,你會發現”abcd”只會被輸出一次,子進程複製的輸出緩衝區為空。到此解釋了fork·與遞歸的一些問題。
如果有什麼問題大家可以在下面留言。