『學了就忘』Linux基礎命令 — 31、grep命令和通配符

1、grep命令介紹

grep命令:是一個Shell命令,是Shell中文本三劍客之一,作用是在文件中提取和匹配符合條件的字元串列

grep命令是一個非常常見的命令,和find命令有很多非常相似的地方,所以在這裡先說明。

grep命令格式如下:

[root@localhost ~ ]# grep [選項] 「搜索內容」 文件名

選項:
  -i:忽略大小寫
  -n:輸出行號(顯示原始文件中的行號)
  -v:反向查找
  --color=auto:搜索出的關鍵字用顏色顯示

舉例:

# 輸出行號。
[root@localhost ~]# grep -n"123" abc
3:123abc
4:123abcdef123
5:abc 123
6:123aaaaabc
7:123bc
8:123aabc
10:abc123abc

# 把你要搜索的內容用紅色高亮顯示。
[root@localhost ~]# grep --color=auto "123" abc

注意:如果要搜索的內容中沒有空格,「搜索內容」部分就可以不加雙引號,如果「搜索內容」中有空格,則一定要加雙引號。

2、find命令和grep命令的區別(重點)

(1)find命令

find命令用於在系統中搜索符合條件的文件名,如果需要模糊查詢,則使用通配符進行匹配,通配符是完全匹配。

提示:find命令可以通過-regex選項,把匹配規則轉為正則表達式規則,但是不建議如此。

(2)grep命令

grep命令用於在文件中搜索符合條件的字元串,如果需要模糊查詢,則使用正則表達式進行匹配,正則表達式是包含匹配。

注意:完全匹配和包含匹配的規則不是find命令和grep命令的區別,是通配符正則表達式的區別。

3、通配符與正則表達式的區別

(1)通配符:

用於匹配文件名,是完全匹配。

下面舉例說明:

  • ?:匹配一個任意字元。
  • *:匹配0個或任意多個任意字元,也就是可以匹配任何內容。
  • []:匹配中括弧中任意一個字元。例如:[abc]代表一定匹配一個字元,或者是a,或者是b,或者是c
  • [-]:匹配中括弧中任意一個字元,-代表一個範圍。例如:[a-z]代表匹配一個小寫字母。
  • [\^]:邏輯非,表示匹配不是中括弧內的一個字元。例如:[\^0-9]代表匹配一個不是數字的字元。
# 通過通配符查找文件
[root@localhost ~ ] # find . -name "abc*"
./abcd
./abc

[root@localhost ~ ]# find . -name "a?c"
./acc
./abc

# 其他同理

提示:只要是操作文件名或者目錄名的命令都可以是用通配符。如rm命令。

(2)正則表達式:

用於匹配字元串,是包含匹配。

下面簡單舉例:

  • ?:匹配前一個字元重複0次,或1次(?是擴展正則,需要使用egrep命令。注Shell分為標準正則和擴展正則。)。
  • *:匹配前一個字元重複0次,或任意多次。
  • []:匹配中括弧中任意一個字元。例如:[abc]代表一定匹配一個字元,或者是a,或者是b,或者是c
  • [-]:匹配中括弧中任意一個字元,-代表一個範圍。例如:[a-z]代表匹配一個小寫字母。
  • [\^]:邏輯非,表示匹配不是中括弧內的一個字元。例如:[\^0-9]代表匹配一個不是數字的字元。
  • ^:匹配行首(限位符)。
  • $:匹配行尾(限位符)。

其中主要是是?*,在通配符和正則表達式的不同。

關於*注意:
[root@localhost ~ ] # grep "a*" abc
向上面命令中,單寫一個字母+*是沒有任何意義的。結果會顯示文件中所有內容,包括空白行。
因為*是匹配前一個字元重複0次,或任意多次。0次代表什麼都沒有,也就是沒有條件的篩選,所以就顯示文件匯總所有的內容。

[root@localhost ~ ] # grep "aa*" abc命令,則表示查找文件中包含有小寫字母a的行。和開頭無關,正則是含有匹配,包含就會被列出。

如果想要在正則當中去匹配開頭的內容,就需要使用限位符。如下:

[root@localhost ~]  # grep "^a" abc
abc
abc 123
abc123abc

[root@localhost ~]  # grep "^aa*" abc 和上面查詢結果也一樣。

小練習:

[root@localhost ~]# egrep"aaa?" abc
123aaaaabc
123aabc
# 上面證明是包含匹配

[root@localhost ~j# egrep "3aaa?b"abc
123aabc
[root@localhost ]#
# 如果只想要搜索兩個a的字元串,就需要使用限位符,其中的3和b都屬於限位符。
# 限位符是包括自己與其他字元串不匹配的任何字元的統稱。