網絡編程之並發編程——進程理論

  • 2019 年 10 月 3 日
  • 筆記

網絡編程之並發編程——進程理論

一、什麼是進程

進程:正在進行的一個過程或者說一個任務。而負責執行任務的則是CPU。

二、進程與程序的區別

程序僅僅只是一堆代碼而已,而進程指的是程序的運行過程。

需要強調的是:同一個程序執行兩次,那也是兩個進程,比如打開暴風影音,雖然都是同一個軟件,但是一個可以播放蒼進空,一個可以播放飯島愛。

三、並發與並行

無論是並行還是並發,在用戶看來都是「同時」運行的,不管是進程還是線程,都只是一個任務而已,真正幹活的是CPU,CPU來做這些任務,而一個CPU同一時刻只能執行一個任務。

1、並發:是偽並行,即看起來是同時運行。單個CPU加上多道技術就可以實現並發。 

舉例(單核+多道,實現多個進程的並發執行):

egon在一個時間段內有很多任務要做:python備課的任務,寫書的任務,交女朋友的任務,王者榮耀上分的任務,但egon同一時刻只能做一個任務(cpu同一時間只能幹一個活),如何才能玩出多個任務並發執行的效果?egon備一會課,再去跟李傑的女朋友聊聊天,再去打一會王者榮耀….這就保證了每個任務都在進行中。

2、並行:同時運行,只有具備多個CPU才能實現並行

單核下,可以利用多道技術,那麼多個核,每個核也都可以利用多道技術(多道技術是針對單核而言的)

有四個核,六個任務,這樣同一時間有四個任務被執行,假設分別被分配給了cpu1,cpu2,cpu3,cpu4,一旦任務1遇到I/O就被迫中斷執行,此時任務5就拿到cpu1的時間片去執行,這就是單核下的多道技術。而一旦任務1的I/O結束了,操作系統會重新調用它(需知進程的調度、分配給哪個cpu運行,由操作系統說了算),可能被分配給四個cpu中的任意一個去執行。

四、進程的創建(了解)

但凡是硬件,都需要有操作系統去管理,只要有操作系統,就有進程的概念,就需要有創建進程的方式,一些操作系統只為一個應用程序設計,比如微波爐中的控制器,一旦啟動微波爐,所有的進程都已經存在。而對於通用系統(跑很多應用程序),需要有系統運行過程中創建或撤銷進程的能力,主要分為4種形式創建新的進程。

1、系統初始化(查看進程在Linux中用ps命令,windows中用任務管理器,前台進程負責與用戶交互,後台運行的程序與用戶無關,運行在後台並且只在需要時才喚醒的進程,稱為守護進程,如電子郵件,web頁面,新聞,打印)

2、一個進程在運行過程中開啟了子進程(如nginx開啟多進程,os.fork,subprocess.Popen等)

3、用戶的交互式請求,而創建一個新進程(如用戶雙擊暴風影音)

4、一個批處理作業的初始化(只在大型機的批處理系統中應用)

無論哪一種,新進程的創建都是由一個已經存在的進程執行了一個用於創建進程的系統調用而創建的:

1、在UNIX中,該系統調用的是:fork,fork會創建一個與父進程一模一樣的副本,二者由相同的存儲映像、同樣的環境字符串和同樣的打開文件(在shell解釋器進程中,執行一個命令就會創建一個子進程)。

2、在windows中該系統調用是:CreateProcess,CreateProcess既處理進程的創建,也負責把正確的程序裝入新進程。

關於創建的子進程,UNIX和windows:

1、相同的是:進程創建後,父進程和子進程有各自不同的地址空間(多道技術要求物理層面實現進程之間內存的隔離),任何一個進程的在其地址空間中的修改都不會影響到另外一個進程。

2、不同的是:UNIX中,子進程的初始地址空間是父進程的一個副本(提示:子進程和父進程是可以有隻讀的共享內存區的。但是對於windows系統來說,從一開始父進程與子進程的地址空間就是不同的。)

五、進程的終止(了解)

1、正常退出(自願,如用戶點擊交互式頁面的叉號,或程序執行完畢調用發起系統調用正常退出,在Linux中eixt,在windows中用ExitProcess)。

2、出錯推出(自願,python a.py中a.py不存在)。

3、嚴重錯誤(非自願,執行非法指令,如引用不存在的內存,1/0等,可以捕捉異常,try…except…)。

4、被其它進程殺死(非自願,如kill -9)。

六、進程的層次結構

無論UNIX還是windows,進程只有一個父進程,不同的是:

1、在UNIX中所有的進程,都是以init進程為根,組成樹形結構。父子進程共同組成一個進程組,這樣,當從鍵盤發出一個信號時,該信號被送給當前與鍵盤相關的進程組中的所有成員。

2、在windows中,沒有進程層次的概念,所有的進程都是地位相同的,唯一類似於進程層次的暗示,是在創建進程時,父進程得到一個特別的令牌(稱為句柄),該句柄可以用來控制子進程,但是父進程有權把該句柄傳給其它子進程,這樣就沒有層次了。

七、進程的狀態

tail -f access.log |grep '404'

執行程序tail,開啟一個子進程,執行程序grep,開啟另外一個子進程,兩個進程之間基於管道|通訊,將tail的結果作為grep的輸入。

進程grep在等待輸入(即I/O)時的狀態稱為阻塞,此時grep命令都無法運行。

其實在兩種情況下會導致一個進程在邏輯上不能運行,

1、進程掛起是自身原因,遇到I/O阻塞,便要讓出CPU讓其它進程去執行,這樣保證CPU一直在工作。

2、與進程無關,是操作系統層面,可能會因為一個進程佔用時間過多,或者優先級等原因,而調用其它的進程去使用CPU。

因而一個進程由三種狀態:

八、進程並發的實現(了解)

進程並發的是現在在於,硬件中斷一個正在運行的進程,把此時進程運行的所有狀態保存下來,為此,操作系統維護一張表格,即進程表(process table),每個進程佔用一個進程表項(這些表項也稱為進程控制塊)

該表存放了進程狀態的重要信息:程序計數器、堆棧指針、內存分配狀況、所有打開文件的狀態、賬號和調度信息,以及其它在進程由運行態轉為就緒態或阻塞態時,必須保存的信息,從而保證該進程在再次啟動時,就像從未被中斷過一樣。