『學了就忘』Linux基礎命令 — 31、grep命令和通配符
- 2021 年 11 月 8 日
- 筆記
- 測試基礎必會技能 - Linux系統
1、grep命令介紹
grep
命令:是一個Shell命令,是Shell中文本三劍客之一,作用是在文件中提取和匹配符合條件的字元串列。
grep
命令是一個非常常見的命令,和find
命令有很多非常相似的地方,所以在這裡先說明。
grep
命令格式如下:
[root@localhost ~ ]# grep [選項] 「搜索內容」 文件名
選項:
-i:忽略大小寫
-n:輸出行號(顯示原始文件中的行號)
-v:反向查找
--color=auto:搜索出的關鍵字用顏色顯示
舉例:
# 輸出行號。
[root@localhost ~]# grep -n"123" abc
3:123abc
4:123abcdef123
5:abc 123
6:123aaaaabc
7:123bc
8:123aabc
10:abc123abc
# 把你要搜索的內容用紅色高亮顯示。
[root@localhost ~]# grep --color=auto "123" abc
注意:如果要搜索的內容中沒有空格,「搜索內容」部分就可以不加雙引號,如果「搜索內容」中有空格,則一定要加雙引號。
2、find命令和grep命令的區別(重點)
(1)find命令
find
命令用於在系統中搜索符合條件的文件名,如果需要模糊查詢,則使用通配符進行匹配,通配符是完全匹配。
提示:
find
命令可以通過-regex
選項,把匹配規則轉為正則表達式規則,但是不建議如此。
(2)grep命令
grep
命令用於在文件中搜索符合條件的字元串,如果需要模糊查詢,則使用正則表達式進行匹配,正則表達式是包含匹配。
注意:完全匹配和包含匹配的規則不是
find
命令和grep
命令的區別,是通配符和正則表達式的區別。
3、通配符與正則表達式的區別
(1)通配符:
用於匹配文件名,是完全匹配。
下面舉例說明:
?
:匹配一個任意字元。*
:匹配0個或任意多個任意字元,也就是可以匹配任何內容。[]
:匹配中括弧中任意一個字元。例如:[abc]
代表一定匹配一個字元,或者是a
,或者是b
,或者是c
。[-]
:匹配中括弧中任意一個字元,-
代表一個範圍。例如:[a-z]
代表匹配一個小寫字母。[\^]
:邏輯非,表示匹配不是中括弧內的一個字元。例如:[\^0-9]
代表匹配一個不是數字的字元。
# 通過通配符查找文件
[root@localhost ~ ] # find . -name "abc*"
./abcd
./abc
[root@localhost ~ ]# find . -name "a?c"
./acc
./abc
# 其他同理
提示:只要是操作文件名或者目錄名的命令都可以是用通配符。如
rm
命令。
(2)正則表達式:
用於匹配字元串,是包含匹配。
下面簡單舉例:
?
:匹配前一個字元重複0次,或1次(?
是擴展正則,需要使用egrep
命令。注Shell分為標準正則和擴展正則。)。*
:匹配前一個字元重複0次,或任意多次。[]
:匹配中括弧中任意一個字元。例如:[abc]
代表一定匹配一個字元,或者是a
,或者是b
,或者是c
。[-]
:匹配中括弧中任意一個字元,-
代表一個範圍。例如:[a-z]
代表匹配一個小寫字母。[\^]
:邏輯非,表示匹配不是中括弧內的一個字元。例如:[\^0-9]
代表匹配一個不是數字的字元。^
:匹配行首(限位符)。$
:匹配行尾(限位符)。
其中主要是是?
和*
,在通配符和正則表達式的不同。
關於
*
注意:
[root@localhost ~ ] # grep "a*" abc
向上面命令中,單寫一個字母+*
是沒有任何意義的。結果會顯示文件中所有內容,包括空白行。
因為*
是匹配前一個字元重複0次,或任意多次。0次代表什麼都沒有,也就是沒有條件的篩選,所以就顯示文件匯總所有的內容。而
[root@localhost ~ ] # grep "aa*" abc
命令,則表示查找文件中包含有小寫字母a
的行。和開頭無關,正則是含有匹配,包含就會被列出。
如果想要在正則當中去匹配開頭的內容,就需要使用限位符。如下:
[root@localhost ~] # grep "^a" abc
abc
abc 123
abc123abc
[root@localhost ~] # grep "^aa*" abc 和上面查詢結果也一樣。
小練習:
[root@localhost ~]# egrep"aaa?" abc
123aaaaabc
123aabc
# 上面證明是包含匹配
[root@localhost ~j# egrep "3aaa?b"abc
123aabc
[root@localhost ]#
# 如果只想要搜索兩個a的字元串,就需要使用限位符,其中的3和b都屬於限位符。
# 限位符是包括自己與其他字元串不匹配的任何字元的統稱。