『忘了再學』Shell基礎 — 28、AWK中條件表達式說明
- 2022 年 6 月 9 日
- 筆記
- 高級測試技能 - Shell基礎
1、AWK的條件表達
如下圖所示:
2、條件表達式說明
以下練習使用如下文本:
ID Name Python Linux MySQL Java
1 Tangs 88 87 86 85.55
2 Sunwk 99 98 97 96,66
3 Zhubj 77 76 75 74.44
4 Shahs 66 65 64 63.33
(1)BEGIN
BEGIN
是AWK的保留字,是一種特殊的條件類型。
BEGIN
的執行時機是在AWK程式一開始時,尚未讀取任何數據之前執行。
BEGIN
後的動作只執行一次,因為當AWK開始從文件中讀入數據,BEGIN
的條件就不再成立,所以BEGIN
定義的動作只能被執行一次。
練習:執行命令查看BEGIN
作用:
執行命令:awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
[root@localhost tmp]# awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
This is BEGIN action
Name Python Java
Tangs 88 85.55
Sunwk 99 96.66
Zhubj 77 74.44
Shahs 66 63.33
說明:
- AWK命令只要檢測不到完整的單引號不會執行,所以這個命令的換行不用加入
\
,就是一行命令- 上邊命令定義了兩個動作:
第一個動作使用BEGIN
條件,所以會在讀入文件數據前列印「This is BEGIN action」(只會執行一次)
第二個動作會列印文件中的對應文本。
(2)END
END
也是AWK保留字,不過剛好和BEGIN
相反。
END
是在AWK程式處理完所有數據,即將結束時執行。END
後的動作只在程式結束時執行一次。
練習:執行命令查看END
作用:
執行命令:awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
[root@localhost tmp]# awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
Name Python Java
Tangs 88 85.55
Sunwk 99 96.66
Zhubj 77 74.44
Shahs 66 63.33
This is END action
說明:在輸出結尾輸入「This is END action」,這並不是文檔本身的內容,而且只會執行一次。
(3)關係運算符
假設我想看看Java績大於等於80分的學員是誰,就可以這樣輸入命令:
grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
# 判斷第六欄位(Java成績)大於等於80分的行,如果判斷式成立,則列印第2列(學員名)
[root@localhost tmp]# grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
Tangs
Sunwk
grep -v "Name" student.txt
是把標題過濾掉。
(4)說明AWK中條件表達式的執行過程
要先說明一下,雖然AWK是列提取命令,但是也要按行來讀入的。
在AWK處理一個文本文件的時候:
- 先判斷表達式中有沒有
BEGIN
。
如果有,就先執行BEGIN
定義的操作,且執行一次。 - 如果沒有
BEGIN
或者BEGIN
定義的動作執行完成之後,會把文本中的第一行數據讀入AWK中,
把該行的整行數據賦予$0
變數中,
把該行數據的第一列賦值在$1
變數中,第二列賦值在$2
變數中,以此類推。 - 例如
awk '{printf $2 "\n"}' student.txt
,意思是列印文本中的第二列姓名。
我們先忽略掉條件,流程是:
AWK讀取第一行數據(上面一步),然後執行動作輸出第二列資訊,也就是輸出第一行的第二列資訊。
然後開始讀取第二行數據,然後再執行動作,輸出第二行的第二列資訊,
然後再讀取第三行數據,之後執行動作,輸出第三行的第二列資訊,
以此類推,基本上就是這樣的一個過程。 - 然後在加上條件
awk '$6>=80 {printf $2 "\n"}' student.txt
判斷第六列Java的成績大於80分,才輸出。
還是和上邊一樣,先是AWK讀取第一行數據完成之後,就要處理動作了,
但是在處理動作之前,先要判斷一下動作前面的條件是否成立,
如果成立,則執行後邊的動作。
如果不成立,則不執行跟在後邊的動作。
然後在開始讀取第二行數據,重複上邊的流程,以此類推。
總結一下就是:加入了條件之後,只有條件成立動作才會執行,如果條件不滿足,則動作則不運行。 - 最後如果有
END
,則把END
中定義的動作執行一次。
以上就是AWK的執行流程。
(5)AWK中使用正則表達式
如果要想讓AWK識別字元串,必須使用//
包含,//
中識別的就是正則表達式規則匹配的字元串。
例如:
# 輸出列印Sunwk的成績
# awk會匹配有Sunwk符號的行,並輸出
[root@localhost tmp]# awk '/Sunwk/ {print}' student.txt
2 Sunwk 99 98 97 96.66
注意:這裡要注意在AWK中,使用
//
包含的字元串,AWK命令才會查找。也就是說字元串必須用//
包含,AWK命令才能正確識別。
(6)A~B
練習
A~B
是A包含B的意思。
練習:查看Sunwk
用戶的Java成績。
# 匹配第二欄位中包含有「Sun」字元,則列印第六欄位數據
[root@localhost tmp]# awk '$2 ~ /Sun/ {printf $6 "\n" }' student.txt
96.66
提示:(6)練習的方式,是在某一列中查找是否包含一個字元串。而上面(5)的寫法,是在一行數據當中匹配是否包含一個字元串,根據需求靈活使用。
注意:
~
兩邊有無空格都可以。
拓展練習:
當使用df
命令查看分區使用情況時,如果我只想查看真正的系統分區的使用狀況,而不想查看光碟和臨時分區的使用狀況,則可以執行如下:
# 查詢包含有sda+數字的行,並列印第一欄位和第五欄位
[root@localhost tmp]# df -h | awk '/sda[0-9]/ {printf $1 "\t" $5 "\t" "\n"}'
/dev/sda3 12%
/dev/sda1 15%