進程和計劃任務
- 2022 年 10 月 11 日
- 筆記
- linux作業系統基礎知識
一、程式
1.1什麼是程式
- 是一組電腦能識別和執行的指令,運行於電子電腦上,滿足人們某種需求的資訊化工具
- 用於描述進程要完成的功能,是控制進程執行的指令集
二、進程
2.1什麼是進程
運行中的程式的一個副本,是被載入記憶體的一個指令集合,是資源分配的單位
- 進程ID(Process ID,PID)號碼被用來標記各個進程
- UID、GID語境決定對文件系統的存取和訪問許可權
- 通常從執行進程的用戶來繼承
- 存在生命周期
- 都由其父進程創建
進程創建:
- CentOS6:是init第一個進程,CentOS7:是systemd第一個進程
- 進程:都由其父進程創建
進程具有的特徵:
- 動態性:進程是程式的一次執行過程,是臨時的,有生命期的,是動態產生,動態消亡的;
- 並發性:任何進程都可以同其他進程一起並發執行;
- 獨立性:進程是系統進行資源分配和調度的一個獨立單位;
- 結構性:進程由程式、數據和進程式控制制塊三部分組成。
進程和執行緒的區別:
- 執行緒是程式執行的最小單位,而進程是作業系統分配資源的最小單位;
- 一個進程由一個或多個執行緒組成,執行緒是一個進程中程式碼的不同執行路線;
- 進程之間相互獨立,但同一進程下的各個執行緒之間共享程式的記憶體空間(包括程式碼段、數據集、堆等)及一些進程級的資源(如打開文件和訊號),某進程內的執行緒在其它進程不可見;
- 調度和切換:執行緒上下文切換比進程上下文切換要快得多;
怎麼查看進程中的執行緒?
第一步:先查看系統進程號:pstree -p
第二步:grep -i threads /proc/PID號/status
殭屍進程:
一個進程結束了,但是如果該進程的父進程先結束了,那麼該進程就不會變成殭屍進程,因為每個進程結束的時候,系統都會掃描當前系統中所運行的所有進程,看有沒有哪個進程是剛剛結束的這個進程的子進程,如果是的話,就由Init來接管它,成為它的父進程子進程退出後init會回收其佔用的相關資源。但是當子進程比父進程先結束,而父進程又沒有回收子進程,釋放子進程佔用的資源,此時子進程將成為一個僵廠進程。
父進程退出子進程沒有退出 ,那麼這些子進程就沒有父進程來管理了, 就變成殭屍進程。子進程已經結束了,父進程沒有意識到。
2.2進程使用記憶體的問題
- 記憶體泄漏:指程式中用malloc或new申請了一塊記憶體,但是沒有用free或delete將記憶體釋放,導致這塊記憶體一直處於佔用狀態
- 記憶體溢出:指程式申請了10M的空間,但是在這個空間寫入10M以上位元組的數據,就是溢出,類似紅杏出牆
- 記憶體不足:原因給應用分配記憶體太少:
比如虛擬機本身可使用的記憶體(一般通過啟動時的VM參數指定)太少。
應用用的太多,並且用完沒釋放,浪費了。此時就會造成記憶體泄露或者記憶體溢出。
使用的解決辦法:
(1)限制java進程的max heap,並且降低java程式的worker數量,從而降低記憶體使用
(2)給系統增加swap空間
2.3進程狀態
進程更多的狀態:
- 運行態:running
- 就緒態:ready
- 睡眠態:分為兩種:可中斷:interruptable;不可中斷:uninterruptable
- 停止態:stopped,暫停於記憶體,但不會被調度,除非手動啟動
- 僵死態:zombie,殭屍態,結束進程,父進程結束前,子進程不關閉,殺死父進程可以關閉僵死態的子進程
2.4進程之間通訊
同一主機:
- pipe:管道,單向傳輸
- socket:套接字文件,雙工通訊
- Memory-maped file:文件映射,將文件中的一段數據映射到物理記憶體,多個進程共享這片記憶體
- shm shared memory:共享記憶體
- signal:訊號
- Lock:對資源上鎖,如果資源已被某進程鎖住,則其它進程想修改甚至讀取這些資源,都將被阻塞,直到鎖被打開
- semaphore:訊號量,一種計數器
不同主機:socket=IP和埠號
- RPC:遠程調用
- MQ:消息隊列,生產者和消費者。如:Kafka,RabbitMQ,ActiveMQ
2.5進程的優先順序OS
進程優先順序調整:
- 靜態優先順序:100-139
- 進程默認啟動時的nice值為0,優先順序為120
- 只有根用戶才能降低nice值(提高優先性)
2.6進程分類
作業系統分類:
(1)協作式多任務:早期 windows 系統使用,即一個任務得到了CPU時間,除非它自己放棄使用CPU ,否則將完全霸佔CPU ,所以任務之間需要協作,使用一段時間的 CPU ,主動放棄使用。
(2)搶佔式多任務:Linux內核,CPU的總控制權在作業系統手中,作業系統會輪流詢問每一個任務是否需要使用 CPU ,需要使用的話就讓它用,不過在一定時間後,作業系統會剝奪當前任務的 CPU 使用權,把它排在詢問隊列的最後,再去詢問下一個任務。
進程類型分類:
(1)守護進程: daemon,在系統引導過程中啟動的進程,和終端無關進程
(2)前台進程:跟終端相關,通過終端啟動的進程
注意:兩者可相互轉化
按進程資源使用的分類:
(1)CPU-Bound:CPU 密集型,非交互
(2)IO-Bound:IO 密集型,交互
三、進程管理相關命令
3.1ps命令
ps可以查看進程當前狀態的快照,默認顯示當前終端中的進程,Linux系統各進程的相關資訊均保存在/proc/數字 目錄/status下的各文件中
1 查看靜態的進程統計資訊 2 "ps aux" 可以查看系統中所有的進程; 3 "ps -le" 可以查看系統中所有的進程,而且還能看到進程的父進程的 PID 和進程優先順序; 4 "ps -l" 只能看到當前 Shell 產生的進程; 5 6 常用選項 7 -a:顯示當前終端下的所有進程資訊,包括其他用戶的進程。與「x」選項結合時將示系統中所有的進程資訊。 8 -u:使用以用戶為主的格式輸出進程資訊。 9 -x:顯示當前用戶在所有終端下的進程資訊。 10 -e:顯示系統內的所有進程資訊。 11 -l:使用長(Long)格式顯示進程資訊。 12 -f:使用完整的(Full)格式顯示進程信 13 -k:對屬性排序,屬性前加 - 表示倒序 14 -o:顯示訂製的資訊 pid、cmd、%cpu、%mem
PRI (最終值) = PRI (原始值) + NI
修改 NI 值時有幾個注意事項:
- NI範圍:是 -20~19,越小越好。
- 普通用戶調整NI值的範圍是:0~19,而且只能調整自己的進程。
- 普通用戶只能調高 NI 值,而不能降低。如原本 NI 值為 0,則只能調整為大於 0。
- 只有 root 用戶才能設定進程 NI 值為負值,而且可以調整任何用戶的進程。
3.2top命令
top 命令可以動態地持續監聽進程地運行狀態,與此同時,該命令還提供了一個交互介面,用戶可以根據需要,人性化地訂製自己的輸出,進而更清楚地了進程的運行狀態。
1 選項: 2 -d 秒數:指定 top 命令每隔幾秒更新。默認是 3 秒; 3 -b:使用批處理模式輸出。一般和"-n"選項合用,用於把 top 命令重定向到文件中; 4 -n 次數:指定 top 命令執行的次數。一般和"-"選項合用; 5 -p 進程PID:僅查看指定 ID 的進程; 6 -s:使 top 命令在安全模式中運行,避免在交互模式中出現錯誤; 7 -u 用戶名:只監聽某個用戶的進程; 8 9 在 top 命令的顯示窗口中,還可以使用如下按鍵,進行一下交互操作: 10 ? 或 h:顯示交互模式的幫助; 11 c:按照 CPU 的使用率排序,默認就是此選項; 12 M:按照記憶體的使用率排序; 13 N:按照 PID 排序; 14 T:按照 CPU 的累積運算時間排序,也就是按照 TIME+ 項排序; 15 k:按照 PID 給予某個進程一個訊號。一般用於中止某個進程,訊號 9 是強制中止的訊號; 16 r:按照 PID 給某個進程重設優先順序(Nice)值; 17 q:退出 top 命令;
緩衝(buffer)和快取(cache)的區別:
- 快取(cache)是在讀取硬碟中的數據時,把最常用的數據保存在記憶體的快取區中,再次讀取該數據時,就不去硬碟中讀取了,而在快取中讀取。
- 緩衝(buffer)是在向硬碟寫入數據時,先把數據放入緩衝區,然後再一起向硬碟寫入,把分散的寫操作集中進行,減少磁碟碎片和硬碟的反覆尋道,從而提高系統性能。
簡單來說,快取(cache)是用來加速數據從硬碟中”讀取”的,而緩衝(buffer)是用來加速數據”寫入”硬碟的。
3.3pgrep命令
pgrep命令:查看指定的進程
-U 指定用戶 -l: 顯示進程名 -a: 顯示完整格式的進程名 -P:pid: 顯示指定進程的子進程
3.4pstree
pstree:以樹形結構列出進程資訊
1 常用選項: 2 -a:顯示啟動每個進程對應的完整指令,包括啟動進程的路徑、參數等 3 -p:顯示PID 4 -T:不顯示執行緒thread,默認顯示執行緒 5 -u:顯示用戶切換 6 -H:pid高亮顯示指定進程及其前輩進程
3.5lsof
lsof:是列舉系統中已經被打開的文件。通過 lsof 命令,我們就可以根據文件找到對應的進程資訊,也可以根據進程資訊找到進程打開的文件。
lsof [選項]
實驗:刪除大文件不釋放空間
3.6監控系統資源vmstat
vmstat命令:可用來監控 CPU 使用、進程狀態、記憶體使用、虛擬記憶體使用、硬碟輸入/輸出狀態等資訊。
五大系統資源:
cpu利用率:怎麼查看(top,ps aux)
記憶體利用率:(free)
磁碟:(df,fdisk -l,lsblk)
磁碟讀寫性能:(dd,vmstat,iostat)
頻寬:網路資源
四、進程管理
4.1手動啟動(jobs,fg,bg)
- 前台啟動:通過終端啟動,且啟動後一直佔據終端
- 後台啟動:可通過終端啟動,但啟動後即轉入後台運行(釋放終端)
“命令&”,把命令放入後台執行(具有交互性質的命令不建議放入後台比如ping命令)
讓作業運行於後台(並行執行):
運行中的作業:Ctrl+z
jobs,fg,bs命令使用
4.2結束進程kill,killall
(1)kill
命令格式: kill [訊號] PID kill 命令會向作業系統內核發送一個訊號(多是終止訊號)和目標進程的 PID,然後系統內核根據收到的訊號類型,對指定進程進行相應的操作。
- kill -9:強制殺死進程
- kill -18:運行進程
- kill -19:停止進程
(2)killall
命令格式:
killall [選項] [訊號] 進程名 killall 也是用於關閉進程的一個命令,但和 kill 不同的是,killall 命令不再依靠 PID 來殺死單個進程,而是通過程式的進程名來殺死一類進程,也正是由於這一點,該命令常與 ps、pstree 等命令配合使用 -i:互動式,詢問是否要殺死某個進程 -I:忽略進程名的大小寫
五、計劃任務
5.1at一次性
HH:MM YYYY-MM-DD:規定在某年某月的某一天的特殊時刻進行該項任務
5.2crontab周期
1 crontab [選項] [file]
在書寫 crontab 定時任務時,需要注意以下幾個事項:
- 6 個選項都不能為空,必須填寫。如果不確定,則使用「*」代表任意時間。
- crontab 定時任務的最小有效時間是分鐘,最大有效時間是月。
- 在定義時間時,日期和星期最好不要在一條定時任務中出現,因為它們都以天為單位,非常容易讓管理員混淆。
- 在定時任務中,不管是直接寫命令,還是在腳本中寫命令,最好都使用絕對路徑。有時使用相對路徑的命令會報錯。