Linux進程管理與性能監控
- 2020 年 8 月 20 日
- 筆記
- [09].Linux
1. 進程管理工具
這一節我們介紹進程管理工具;
使用進程管理工具,我們可以查詢程式當前的運行狀態,或終止一個進程;
任何進程都與文件關聯;我們會用到lsof工具(list opened files),作用是列舉系統中已經被打開的文件。在linux環境中,任何事物都是文件,設備是文件,目錄是文件,甚至sockets也是文件。用好lsof命令,對日常的linux管理非常有幫助。
1.1. 查詢進程
查詢正在運行的進程資訊
$ps -ef
eg:查詢歸屬於用戶colin115的進程
$ps -ef | grep colin115
$ps -lu colin115
查詢進程ID(適合只記得部分進程欄位)
$pgrep 查找進程
eg:查詢進程名中含有re的進程
[/home/weber#]pgrep -l re
2 kthreadd
28 ecryptfs-kthrea
29515 redis-server
以完整的格式顯示所有的進程
$ps -ajx
顯示進程資訊,並實時更新
$top
查看埠佔用的進程狀態:
lsof -i:3306
查看用戶username的進程所打開的文件
$lsof -u username
查詢init進程當前打開的文件
$lsof -c init
查詢指定的進程ID(23295)打開的文件:
$lsof -p 23295
查詢指定目錄下被進程開啟的文件(使用+D 遞歸目錄):
$lsof +d mydir1/
1.2. 終止進程
殺死指定PID的進程 (PID為Process ID)
$kill PID
殺死相關進程
kill -9 3434
殺死job工作 (job為job number)
$kill %job
1.3. 進程監控
查看系統中使用CPU、使用記憶體最多的進程;
$top
(->)P
輸入top命令後,進入到交互介面;接著輸入字元命令後顯示相應的進程狀態:
對於進程,平時我們最常想知道的就是哪些進程佔用CPU最多,佔用記憶體最多。以下兩個命令就可以滿足要求:
P:根據CPU使用百分比大小進行排序。
M:根據駐留記憶體大小進行排序。
i:使top不顯示任何閑置或者僵死進程。
這裡介紹最使用的幾個選項,對於更詳細的使用,詳見top linux下的任務管理器
1.4. 分析執行緒棧
使用命令pmap,來輸出進程記憶體的狀況,可以用來分析執行緒堆棧;
$pmap PID
eg:
[/home/weber#]ps -fe| grep redis
weber 13508 13070 0 08:14 pts/0 00:00:00 grep --color=auto redis
weber 29515 1 0 2013 ? 02:55:59 ./redis-server redis.conf
[/home/weber#]pmap 29515
29515: ./redis-server redis.conf
08048000 768K r-x-- /home/weber/soft/redis-2.6.16/src/redis-server
08108000 4K r---- /home/weber/soft/redis-2.6.16/src/redis-server
08109000 12K rw--- /home/weber/soft/redis-2.6.16/src/redis-server
1.5. 綜合運用
將用戶colin115下的所有進程名以av_開頭的進程終止:
ps -u colin115 | awk '/av_/ {print "kill -9 " $1}' | sh
將用戶colin115下所有進程名中包含HOST的進程終止:
ps -fe| grep colin115|grep HOST |awk '{print $2}' | xargs kill -9;
2.性能監控
在使用作業系統的過程中,我們經常需要查看當前的性能如何,需要了解CPU、記憶體和硬碟的使用情況; 本節介紹的這幾個工具能滿足日常工作要求;
2.1. 監控CPU
查看CPU使用率
$sar -u
eg:
$sar -u 1 2
[/home/weber#]sar -u 1 2
Linux 2.6.35-22-generic-pae (MyVPS) 06/28/2014 _i686_ (1 CPU)
09:03:59 AM CPU %user %nice %system %iowait %steal %idle
09:04:00 AM all 0.00 0.00 0.50 0.00 0.00 99.50
09:04:01 AM all 0.00 0.00 0.00 0.00 0.00 100.00
後面的兩個參數表示監控的頻率,比如例子中的1和2,表示每秒取樣一次,總共取樣2次;
查看CPU平均負載
$sar -q 1 2
sar指定-q後,就能查看運行隊列中的進程數、系統上的進程大小、平均負載等;
2.2. 查詢記憶體
查看記憶體使用狀況 sar指定-r之後,可查看記憶體使用狀況;
$sar -r 1 2
09:08:48 AM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact
09:08:49 AM 17888 359784 95.26 37796 73272 507004 65.42 137400 150764
09:08:50 AM 17888 359784 95.26 37796 73272 507004 65.42 137400 150764
Average: 17888 359784 95.26 37796 73272 507004 65.42 137400 150764
查看記憶體使用量
$free -m
2.3. 查詢頁面交換
查看頁面交換髮生狀況 頁面發生交換時,伺服器的吞吐量會大幅下降;伺服器狀況不良時,如果懷疑因為記憶體不足而導致了頁面交換的發生,可以使用sar -W這個命令來確認是否發生了大量的交換;
$sar -W 1 3
2.4. 查詢硬碟使用
查看磁碟空間利用情況
$df -h
查詢當前目錄下空間使用情況
du -sh -h是人性化顯示 s是遞歸整個目錄的大小
查看該目錄下所有文件夾的排序後的大小
for i in `ls`; do du -sh $i; done | sort
或者
du -sh `ls`
2.5. 綜合應用
當系統中sar不可用時,可以使用以下工具替代:linux下有 vmstat、Unix系統有prstat
eg: 查看cpu、記憶體、使用情況: vmstat n m (n 為監控頻率、m為監控次數)
[/home/weber#]vmstat 1 3
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r b swpd free buff cache si so bi bo in cs us sy id wa
0 0 86560 42300 9752 63556 0 1 1 1 0 0 0 0 99 0
1 0 86560 39936 9764 63544 0 0 0 52 66 95 5 0 95 0
0 0 86560 42168 9772 63556 0 0 0 20 127 231 13 2 84 0
使用watch 工具監控變化 當需要持續的監控應用的某個數據變化時,watch工具能滿足要求; 執行watch命令後,會進入到一個介面,輸出當前被監控的數據,一旦數據變化,便會高亮顯示變化情況;
eg:操作redis時,監控記憶體變化:
$watch -d -n 1 './redis-cli info | grep memory'
(以下為watch工具中的介面內容,一旦記憶體變化,即實時高亮顯示變化)
Every 1.0s: ./redis-cli info | grep memory
used_memory:45157376
used_memory_human:43.07M
used_memory_rss:47628288
used_memory_peak:49686080
used_memory_peak_human:47.38M