Linux三劍客grep、awk和sed

2021 年 1 月 19 日
筆記
linux, Linux三劍客

grep，sed 和 awk是Linux/Unix 系統中常用的三個文本處理的命令行工具，稱為文本處理三劍客。本文將簡要介紹這三個命令並給出基本用法。

管道

在介紹這兩個命令之前，有必要介紹一下Unix/Linux中管道（pipe）的概念。管道將一個命令/程式/進程的輸出發送到另一個命令/程式/進程，以進行進一步處理。是一種進程間通訊機制，使用管道符”|」將兩個命令隔開，管道符左邊命令的輸出就會作為管道符右邊命令的輸入。

管道實現了數據在多個命令之間傳遞，不需要創建臨時文件來傳遞，它是單向的，數據通過管道從左向右流動。

實例1：
cat test.txt | grep test1

# cat test.txt | grep test1
test1
test111
test3 test1
test111
# cat test.txt | grep test1 | grep test3
test3 test1
#

實例2：

# cat test.txt | head -3
test1
test2
test3
# cat test.txt | tail -5
test
test

test
rrrr
#

grep

定義

grep(Global Regular Expression Print) 命令用於搜索文件的特定模式，它不能增加、修改、刪除文本內容，通常用於搜索過濾文本，顯示被模式匹配到的行。使用正則表達式進行文本匹配（正則表達式參考文章《Python正則表達式》），它的使用許可權是所有用戶。

命令形式：
grep [OPTIONS] PATTERN [FILE...]
擴展正則表達式（rgrep）添加 -E 參數：
grep -E [OPTIONS] PATTERN [FILE...]

選項參數

-v 或 –invert-match ：顯示不被 pattern匹配到的行
-n 或 –line-number ：顯示匹配的行號
-o 或 –only-matching ：僅顯示匹配到的字元串
-c 或 –count ：統計匹配的行數
-i 或 –ignore-case ：忽略字元大小寫
-m或–max-count：-m 1 ，匹配到1行後停止匹配
-A<顯示行數> 或 –after-context=<顯示行數> : 除了顯示符合範本樣式的那一列之外，並顯示該行之後的內容。
-B<顯示行數> 或 –before-context=<顯示行數> : 除了顯示符合樣式的那一行之外，並顯示該行之前的內容。

實例1：查找文件內容，顯示行號

查找文件內容包含’test1’的行，顯示行數

# grep -n test1 test.txt 
1:test1
7:test111
9:test3 test1
11:test111
# grep -o test1 test.txt  
test1
test1
test1
test1
# grep -no test1 test.txt
1:test1
7:test1
9:test1
11:test1

實例2：查找文件內容，不包含test1的行

# grep -nv test1 test.txt
2:test2
3:test3
4:test4
5:test5
6:test6
8:test2
10:test

實例3：grep 正則表達式

查找test1開頭的行

# grep -n ^test1 test.txt
1:test1
7:test111
11:test111

查找以1結尾的行

# grep -n 1$ test.txt    
1:test1
7:test111
9:test3 test1
11:test111

查看進程

# ps -aux | grep chrome
root       5425  0.4  1.8 869280 34200 pts/0    Sl   Dec22  11:31 /opt/google/chrome/chrome --no-sandbox
root       5439  0.0  0.0 563592  1132 pts/0    S    Dec22   0:00 /opt/google/chrome/chrome --type=zygote --no-zygote-sandbox --no-sandbox
root       5440  0.0  0.1 563592  2836 pts/0    S    Dec22   0:06 /opt/google/chrome/chrome --type=zygote --no-sandbox
root       5441  0.0  0.0  26452   208 pts/0    S    Dec22   0:00 /opt/google/chrome/nacl_helper --no-sandbox
root       5442  0.0  0.0  26452   144 pts/0    S    Dec22   0:00 /opt/google/chrome/nacl_helper --no-sandbox

sed

定義

sed（Stream Editor）是一種流編輯器，一次處理一行內容，將行存儲在模式空間（臨時緩衝區），然後用sed命令處理模式空間中的內容，處理完成後將內容送入螢幕，然後清除模式空間，繼續讀入下一行，執行下一個循環，直到文件末尾。這個過程中不會改變文件內容（除了 -i 選項）。

命令形式：
sed [選項] [sed命令] [-f <script FILE>] [FILE]
查看幫助文檔：

man sed
sed -h

選項

-h：顯示幫助資訊
-n：僅顯示 script處理後的結果，常與sed命令p連用：sed -n 'p' test.txt 列印test.txt文件內容
-e：直接在指令列模式上進行 sed 的動作編輯，不修改原文件，輸出到終端
-i：修改文件內容，而不輸出到終端
-f filename ： sed 動作寫在filename 內，執行 filename 內的sed 動作
-r∶擴展正規表達式

常用命令

a：append，新增： sed -e '4 a newline' test.txt
c：change，取代： sed -e '2,5c No 2-5 number' test.txt
d：delete，刪除： sed -e '2,5d' test.txt
- sed '/^$/d' test.txt：刪除test.txt文件空行
i：insert，插入： sed -e '2i newline' test.txt
p：print，列印：sed -n 'p' test.txt
s：substitute，替換： sed -e 's/old/new/g' test.txt
- sed 's/$/%/' test.txt：在每行末尾添加%
- sed s/ *//g test.txt：刪除test.txt文件空格
N：將下一行添加到pattern space中，將當前讀入行和用N命令添加的下一行看成「一行」

注意在替換操作中，替換時用的分割符 ‘/’ 可以使用其它符號代替，特別是替換的內容中有 ‘/’ 時，可以使用@、#、%等符號代替。

實例1：列印並輸出數據

列印並輸出第5行數據

# sed -n '5p' test.txt
test5
# cat -n test.txt | sed -n '5p' 
     5	test5
#

列印並輸出第3-5行數據

# sed -n '3,5p' test.txt
test3
test4
test5

取反，不選擇第3到5行數據

# sed -n '3,5!p' test.txt
test1
test2

隔行輸出

# sed -n '1~2p' test.txt
test1
test3
test5
# sed -n '1~3p' test.txt
test1
test4
#

實例2：將匹配的行數據輸出到指定文件

# 累加
sed -n '1~2p' test.txt >> a.log
# 覆蓋
sed -n '1~3p' test.txt > a.log

# sed -n '1~2p' test.txt>> a.log
# cat a.log
test1
test3
test5
# sed -n '1~3p' test.txt > a.log 
# cat a.log
test1
test4
#

實例3：新增、插入字元串

在第2行後加上 newLine

# sed '2 a newline' test.txt
test1
test2
newline
test3
test4
test5
#

在第2行前加上 newline

# sed '2 i newline' test.txt
test1
newline
test2
test3
test4
test5

實例4：全局替換

將所有的test2替換為test222

# sed -e 's/test2/test222/g' test.txt
test1
test222
test3
test4
test5
# sed -e 's/test2/test222/' test.txt
test1
test222
test3
test4
test5

實例5：修改文件

前面的新增、替換操作都沒有改變文件內容，如果要使文件修改生效，需要使用 -i 選項。

# sed -i 's/test2/test222/' test.txt
# cat test.txt 
test1
test222
test3
test4
test5
#

awk

定義

awk是一種文本模式掃描和處理的程式語言，由 Aho, Weinberger 和 Kernighan開發。awk功能強大，可用於數據提取和統計，常用在shell腳本中。awk逐行讀入文件，以空格為默認分隔符將每行切片，切開的部分再進行後續處理。

命令形式：
awk [options] 'pattern action' [FILE(s)]

pattern：正則表達式
action：對匹配到的內容執行的命令(默認為輸出每行內容)

常用參數

$0：整條記錄（當前行）
$1 – $n：表示當前行的第n個域
FILENAME： awk瀏覽的文件名
BEGIN：處理文本之前要執行的操作
END：處理文本之後要執行的操作
FS：設置輸入域分隔符，等價於命令行 -F 選項，默認為空格「」
- awk -F: '{print $1}' test.txt
- 或者 awk 'BEGIN {FS = ":"} {print $1}' test.txt
NF：瀏覽記錄的域的個數/列數
NR：已讀的記錄數/行數
FNR：當前輸入文件的記錄數
OFS：輸出域分隔符，默認為空格「」
ORS：輸出記錄分隔符，默認為「\n」
RS：控制記錄分隔符
exit：匹配到第一行內容後退出：awk -F: '{print $2;exit}' test.txt ，grep使用 -m 參數

實例1：查找、列印

搜索/etc/passwd有root關鍵字的所有行

# awk -F : '/root/ {print $0}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
#
# awk -F : '/root/ {print $7}' /etc/passwd
/bin/bash
/sbin/nologin

列印etc/passwd/的第二行資訊

# awk -F : 'NR==2 {print $0}' /etc/passwd
bin:x:1:1:bin:/bin:/sbin/nologin
#

實例2：BEGIN、END製表

使用 begin加入標題

[root@iZ8vb54310gt89j8qct198Z tmp]# awk -F : 'BEGIN {print "No", "User", "Auth"} {print NR "|" $1 "|" $2} END {print FILENAME}' /etc/passwd
No User Auth
1|root|x
2|bin|x
3|daemon|x
4|adm|x
5|lp|x
6|sync|x
7|shutdown|x
8|halt|x
9|mail|x
.................
28|nscd|x
29|exim|x
/etc/passwd

實例3：自定義分割符

# echo "123|456|789"
123|456|789
# echo "123|456|789" | awk 'BEGIN{RS="|"}{print $0}'
123
456
789

–THE END–

文章標題：Linux三劍客grep、awk和sed
本文作者：hiyo
本文鏈接：//www.cnblogs.com/hiyong/p/14238392.html
歡迎關注公眾號:「測試開發小記」及時接收最新技術文章！

Tags: linux Linux三劍客

Linux三劍客grep、awk和sed

管道

grep

定義

選項參數

實例1：查找文件內容，顯示行號

實例2：查找文件內容，不包含test1的行

實例3：grep 正則表達式

查看進程

sed

定義

選項

常用命令

實例1：列印並輸出數據

實例2：將匹配的行數據輸出到指定文件

實例3：新增、插入字元串

實例4：全局替換

實例5：修改文件

awk

定義

常用參數

實例1：查找、列印

實例2：BEGIN、END製表

實例3：自定義分割符

VirMach 便宜 VPS

QNews

Linux三劍客grep、awk和sed

管道

grep

定義

選項參數

實例1：查找文件內容，顯示行號

實例2：查找文件內容，不包含test1的行

實例3：grep 正則表達式

查看進程

sed

定義

選項

常用命令

實例1：列印並輸出數據

實例2：將匹配的行數據輸出到指定文件

實例3：新增、插入字元串

實例4：全局替換

實例5：修改文件

awk

定義

常用參數

實例1：查找、列印

實例2：BEGIN、END製表

實例3：自定義分割符

分享此文：

Related Posts

推薦一個能夠讓程式猿快速開發的極簡工具箱

超酷！！HTML5 Canvas 水流樣式 Loading 動畫

對標微信、支付寶？抖音大招公布 官方低調回應

使用 gRPCurl 調試.NET 5的gPRC服務

VirMach 便宜 VPS

QNews

熱門文章

熱門搜尋

對標微信、支付寶？抖音大招公布官方低調回應