進程和計劃任務

一、程式

1.1什麼是程式

  • 是一組電腦能識別和執行的指令,運行於電子電腦上,滿足人們某種需求的資訊化工具
  • 用於描述進程要完成的功能,是控制進程執行的指令集

二、進程

2.1什麼是進程

運行中的程式的一個副本,是被載入記憶體的一個指令集合,是資源分配的單位

  • 進程ID(Process ID,PID)號碼被用來標記各個進程
  • UID、GID語境決定對文件系統的存取和訪問許可權
  • 通常從執行進程的用戶來繼承
  • 存在生命周期
  • 都由其父進程創建

進程創建:

  • CentOS6:是init第一個進程,CentOS7:是systemd第一個進程
  • 進程:都由其父進程創建

進程具有的特徵:

  • 動態性:進程是程式的一次執行過程,是臨時的,有生命期的,是動態產生,動態消亡的;
  • 並發性:任何進程都可以同其他進程一起並發執行;
  • 獨立性:進程是系統進行資源分配和調度的一個獨立單位;
  • 結構性:進程由程式、數據和進程式控制制塊三部分組成。

進程和執行緒的區別:

  • 執行緒是程式執行的最小單位,而進程是作業系統分配資源的最小單位;
  • 一個進程由一個或多個執行緒組成,執行緒是一個進程中程式碼的不同執行路線;
  • 進程之間相互獨立,但同一進程下的各個執行緒之間共享程式的記憶體空間(包括程式碼段、數據集、堆等)及一些進程級的資源(如打開文件和訊號),某進程內的執行緒在其它進程不可見;
  • 調度和切換:執行緒上下文切換比進程上下文切換要快得多;
怎麼查看進程中的執行緒?
第一步:先查看系統進程號:pstree -p
第二步:grep -i threads /proc/PID號/status

殭屍進程:
一個進程結束了,但是如果該進程的父進程先結束了,那麼該進程就不會變成殭屍進程,因為每個進程結束的時候,系統都會掃描當前系統中所運行的所有進程,看有沒有哪個進程是剛剛結束的這個進程的子進程,如果是的話,就由Init來接管它,成為它的父進程子進程退出後init會回收其佔用的相關資源。但是當子進程比父進程先結束,而父進程又沒有回收子進程,釋放子進程佔用的資源,此時子進程將成為一個僵廠進程。
父進程退出子進程沒有退出 ,那麼這些子進程就沒有父進程來管理了, 就變成殭屍進程。子進程已經結束了,父進程沒有意識到。

2.2進程使用記憶體的問題

  • 記憶體泄漏:指程式中用malloc或new申請了一塊記憶體,但是沒有用free或delete將記憶體釋放,導致這塊記憶體一直處於佔用狀態
  • 記憶體溢出:指程式申請了10M的空間,但是在這個空間寫入10M以上位元組的數據,就是溢出,類似紅杏出牆
  • 記憶體不足:原因給應用分配記憶體太少:

比如虛擬機本身可使用的記憶體(一般通過啟動時的VM參數指定)太少。
應用用的太多,並且用完沒釋放,浪費了。此時就會造成記憶體泄露或者記憶體溢出。
使用的解決辦法:
(1)限制java進程的max heap,並且降低java程式的worker數量,從而降低記憶體使用
(2)給系統增加swap空間

2.3進程狀態

進程更多的狀態:

  • 運行態:running
  • 就緒態:ready
  • 睡眠態:分為兩種:可中斷:interruptable;不可中斷:uninterruptable
  • 停止態:stopped,暫停於記憶體,但不會被調度,除非手動啟動
  • 僵死態:zombie,殭屍態,結束進程,父進程結束前,子進程不關閉,殺死父進程可以關閉僵死態的子進程

2.4進程之間通訊

同一主機:

  • pipe:管道,單向傳輸
  • socket:套接字文件,雙工通訊
  • Memory-maped file:文件映射,將文件中的一段數據映射到物理記憶體,多個進程共享這片記憶體
  • shm shared memory:共享記憶體
  • signal:訊號
  • Lock:對資源上鎖,如果資源已被某進程鎖住,則其它進程想修改甚至讀取這些資源,都將被阻塞,直到鎖被打開
  • semaphore:訊號量,一種計數器

不同主機:socket=IP和埠號

  • RPC:遠程調用
  • MQ:消息隊列,生產者和消費者。如:Kafka,RabbitMQ,ActiveMQ

2.5進程的優先順序OS

進程優先順序調整:

  • 靜態優先順序:100-139
  • 進程默認啟動時的nice值為0,優先順序為120
  • 只有根用戶才能降低nice值(提高優先性)

2.6進程分類

作業系統分類:
(1)協作式多任務:早期 windows 系統使用,即一個任務得到了CPU時間,除非它自己放棄使用CPU ,否則將完全霸佔CPU ,所以任務之間需要協作,使用一段時間的 CPU ,主動放棄使用。
(2)搶佔式多任務:Linux內核,CPU的總控制權在作業系統手中,作業系統會輪流詢問每一個任務是否需要使用 CPU ,需要使用的話就讓它用,不過在一定時間後,作業系統會剝奪當前任務的 CPU 使用權,把它排在詢問隊列的最後,再去詢問下一個任務。
進程類型分類:
(1)守護進程: daemon,在系統引導過程中啟動的進程,和終端無關進程
(2)前台進程:跟終端相關,通過終端啟動的進程
注意:兩者可相互轉化
按進程資源使用的分類:
(1)CPU-Bound:CPU 密集型,非交互
(2)IO-Bound:IO 密集型,交互

三、進程管理相關命令

3.1ps命令

ps可以查看進程當前狀態的快照,默認顯示當前終端中的進程,Linux系統各進程的相關資訊均保存在/proc/數字 目錄/status下的各文件中

 1 查看靜態的進程統計資訊
 2 "ps aux" 可以查看系統中所有的進程;
 3 "ps -le" 可以查看系統中所有的進程,而且還能看到進程的父進程的 PID 和進程優先順序;
 4 "ps -l" 只能看到當前 Shell 產生的進程;
 5 
 6 常用選項
 7 -a:顯示當前終端下的所有進程資訊,包括其他用戶的進程。與「x」選項結合時將示系統中所有的進程資訊。
 8 -u:使用以用戶為主的格式輸出進程資訊。
 9 -x:顯示當前用戶在所有終端下的進程資訊。
10 -e:顯示系統內的所有進程資訊。
11 -l:使用長(Long)格式顯示進程資訊。
12 -f:使用完整的(Full)格式顯示進程信
13 -k:對屬性排序,屬性前加 - 表示倒序
14 -o:顯示訂製的資訊 pid、cmd、%cpu、%mem

PRI (最終值) = PRI (原始值) + NI

修改 NI 值時有幾個注意事項:

  • NI範圍:是 -20~19,越小越好。
  • 普通用戶調整NI值的範圍是:0~19,而且只能調整自己的進程。
  • 普通用戶只能調高 NI 值,而不能降低。如原本 NI 值為 0,則只能調整為大於 0。
  • 只有 root 用戶才能設定進程 NI 值為負值,而且可以調整任何用戶的進程。

3.2top命令

top 命令可以動態地持續監聽進程地運行狀態,與此同時,該命令還提供了一個交互介面,用戶可以根據需要,人性化地訂製自己的輸出,進而更清楚地了進程的運行狀態。

 1 選項:
 2 -d 秒數:指定 top 命令每隔幾秒更新。默認是 3 秒;
 3 -b:使用批處理模式輸出。一般和"-n"選項合用,用於把 top 命令重定向到文件中;
 4 -n 次數:指定 top 命令執行的次數。一般和"-"選項合用;
 5 -p 進程PID:僅查看指定 ID 的進程;
 6 -s:使 top 命令在安全模式中運行,避免在交互模式中出現錯誤;
 7 -u 用戶名:只監聽某個用戶的進程;
 8 
 9 在 top 命令的顯示窗口中,還可以使用如下按鍵,進行一下交互操作:
10 ? 或 h:顯示交互模式的幫助;
11 c:按照 CPU 的使用率排序,默認就是此選項;
12 M:按照記憶體的使用率排序;
13 N:按照 PID 排序;
14 T:按照 CPU 的累積運算時間排序,也就是按照 TIME+ 項排序;
15 k:按照 PID 給予某個進程一個訊號。一般用於中止某個進程,訊號 9 是強制中止的訊號;
16 r:按照 PID 給某個進程重設優先順序(Nice)值;
17 q:退出 top 命令;

緩衝(buffer)和快取(cache)的區別:

  • 快取(cache)是在讀取硬碟中的數據時,把最常用的數據保存在記憶體的快取區中,再次讀取該數據時,就不去硬碟中讀取了,而在快取中讀取。
  • 緩衝(buffer)是在向硬碟寫入數據時,先把數據放入緩衝區,然後再一起向硬碟寫入,把分散的寫操作集中進行,減少磁碟碎片和硬碟的反覆尋道,從而提高系統性能。

簡單來說,快取(cache)是用來加速數據從硬碟中”讀取”的,而緩衝(buffer)是用來加速數據”寫入”硬碟的。

3.3pgrep命令

pgrep命令:查看指定的進程
-U 指定用戶
-l: 顯示進程名
-a: 顯示完整格式的進程名
-P:pid: 顯示指定進程的子進程

3.4pstree

pstree:以樹形結構列出進程資訊

1 常用選項:
2 -a:顯示啟動每個進程對應的完整指令,包括啟動進程的路徑、參數等
3 -p:顯示PID
4 -T:不顯示執行緒thread,默認顯示執行緒
5 -u:顯示用戶切換
6 -H:pid高亮顯示指定進程及其前輩進程

3.5lsof

lsof:是列舉系統中已經被打開的文件。通過 lsof 命令,我們就可以根據文件找到對應的進程資訊,也可以根據進程資訊找到進程打開的文件。

lsof [選項]

 實驗:刪除大文件不釋放空間

3.6監控系統資源vmstat

vmstat命令:可用來監控 CPU 使用、進程狀態、記憶體使用、虛擬記憶體使用、硬碟輸入/輸出狀態等資訊。

五大系統資源:

cpu利用率:怎麼查看(top,ps aux)

記憶體利用率:(free)

磁碟:(df,fdisk -l,lsblk)

磁碟讀寫性能:(dd,vmstat,iostat)

頻寬:網路資源

四、進程管理

4.1手動啟動(jobs,fg,bg)

  • 前台啟動:通過終端啟動,且啟動後一直佔據終端
  • 後台啟動:可通過終端啟動,但啟動後即轉入後台運行(釋放終端)

“命令&”,把命令放入後台執行(具有交互性質的命令不建議放入後台比如ping命令)

讓作業運行於後台(並行執行):
運行中的作業:Ctrl+z

jobs,fg,bs命令使用

 

4.2結束進程kill,killall

(1)kill

命令格式:
kill [訊號] PID 
kill 命令會向作業系統內核發送一個訊號(多是終止訊號)和目標進程的 PID,然後系統內核根據收到的訊號類型,對指定進程進行相應的操作。
  • kill -9:強制殺死進程
  • kill -18:運行進程
  • kill -19:停止進程

(2)killall

命令格式:
killall
[選項] [訊號] 進程名 killall 也是用於關閉進程的一個命令,但和 kill 不同的是,killall 命令不再依靠 PID 來殺死單個進程,而是通過程式的進程名來殺死一類進程,也正是由於這一點,該命令常與 ps、pstree 等命令配合使用 -i:互動式,詢問是否要殺死某個進程 -I:忽略進程名的大小寫

五、計劃任務

5.1at一次性

HH:MM YYYY-MM-DD:規定在某年某月的某一天的特殊時刻進行該項任務

5.2crontab周期

1 crontab [選項] [file]

 

在書寫 crontab 定時任務時,需要注意以下幾個事項:

  • 6 個選項都不能為空,必須填寫。如果不確定,則使用「*」代表任意時間。
  • crontab 定時任務的最小有效時間是分鐘,最大有效時間是月。
  • 在定義時間時,日期和星期最好不要在一條定時任務中出現,因為它們都以天為單位,非常容易讓管理員混淆。
  • 在定時任務中,不管是直接寫命令,還是在腳本中寫命令,最好都使用絕對路徑。有時使用相對路徑的命令會報錯。