『忘了再學』Shell基礎 — 28、AWK中條件表達式說明

1、AWK的條件表達
2、條件表達式說明

1、AWK的條件表達

如下圖所示：

2、條件表達式說明

以下練習使用如下文本：

ID      Name    Python  Linux   MySQL   Java
1       Tangs   88      87      86      85.55
2       Sunwk   99      98      97      96,66
3       Zhubj   77      76      75      74.44
4       Shahs   66      65      64      63.33

（1）BEGIN

BEGIN是AWK的保留字，是一種特殊的條件類型。

BEGIN的執行時機是在AWK程式一開始時，尚未讀取任何數據之前執行。

BEGIN後的動作只執行一次，因為當AWK開始從文件中讀入數據，BEGIN的條件就不再成立，所以BEGIN定義的動作只能被執行一次。

練習：執行命令查看BEGIN作用：

執行命令：awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt

[root@localhost tmp]# awk 'BEGIN{print "This is BEGIN action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
This is BEGIN action
Name    Python  Java
Tangs   88      85.55
Sunwk   99      96.66
Zhubj   77      74.44
Shahs   66      63.33

說明：

AWK命令只要檢測不到完整的單引號不會執行，所以這個命令的換行不用加入\，就是一行命令

上邊命令定義了兩個動作：
第一個動作使用BEGIN條件，所以會在讀入文件數據前列印「This is BEGIN action」（只會執行一次）
第二個動作會列印文件中的對應文本。

（2）END

END也是AWK保留字，不過剛好和BEGIN相反。

END是在AWK程式處理完所有數據，即將結束時執行。END後的動作只在程式結束時執行一次。

練習：執行命令查看END作用：

執行命令：awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt

[root@localhost tmp]# awk 'END{print "This is END action"} {printf $2 "\t" $3 "\t" $6 "\t" "\n"}' student.txt
Name    Python  Java
Tangs   88      85.55
Sunwk   99      96.66
Zhubj   77      74.44
Shahs   66      63.33
This is END action

說明：在輸出結尾輸入「This is END action」，這並不是文檔本身的內容，而且只會執行一次。

（3）關係運算符

假設我想看看Java績大於等於80分的學員是誰，就可以這樣輸入命令：

grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'

# 判斷第六欄位（Java成績）大於等於80分的行，如果判斷式成立，則列印第2列（學員名）
[root@localhost tmp]# grep -v "Name" student.txt | awk '$6>=80 {printf $2 "\n"}'
Tangs
Sunwk

grep -v "Name" student.txt是把標題過濾掉。

（4）說明AWK中條件表達式的執行過程

要先說明一下，雖然AWK是列提取命令，但是也要按行來讀入的。

在AWK處理一個文本文件的時候：

先判斷表達式中有沒有BEGIN。
如果有，就先執行BEGIN定義的操作，且執行一次。
如果沒有BEGIN或者BEGIN定義的動作執行完成之後，會把文本中的第一行數據讀入AWK中，
把該行的整行數據賦予$0變數中，
把該行數據的第一列賦值在$1變數中，第二列賦值在$2變數中，以此類推。
例如awk '{printf $2 "\n"}' student.txt，意思是列印文本中的第二列姓名。
我們先忽略掉條件，流程是：
AWK讀取第一行數據（上面一步），然後執行動作輸出第二列資訊，也就是輸出第一行的第二列資訊。
然後開始讀取第二行數據，然後再執行動作，輸出第二行的第二列資訊，
然後再讀取第三行數據，之後執行動作，輸出第三行的第二列資訊，
以此類推，基本上就是這樣的一個過程。
然後在加上條件awk '$6>=80 {printf $2 "\n"}' student.txt
判斷第六列Java的成績大於80分，才輸出。
還是和上邊一樣，先是AWK讀取第一行數據完成之後，就要處理動作了，
但是在處理動作之前，先要判斷一下動作前面的條件是否成立，
如果成立，則執行後邊的動作。
如果不成立，則不執行跟在後邊的動作。
然後在開始讀取第二行數據，重複上邊的流程，以此類推。
總結一下就是：加入了條件之後，只有條件成立動作才會執行，如果條件不滿足，則動作則不運行。
最後如果有END，則把END中定義的動作執行一次。

以上就是AWK的執行流程。

（5）AWK中使用正則表達式

如果要想讓AWK識別字元串，必須使用//包含，//中識別的就是正則表達式規則匹配的字元串。

例如：

# 輸出列印Sunwk的成績
# awk會匹配有Sunwk符號的行，並輸出
[root@localhost tmp]# awk '/Sunwk/ {print}' student.txt
2   Sunwk   99  98  97  96.66

注意：這裡要注意在AWK中，使用//包含的字元串，AWK命令才會查找。也就是說字元串必須用//包含，AWK命令才能正確識別。

（6）`A~B`練習

A~B是A包含B的意思。

練習：查看Sunwk用戶的Java成績。

# 匹配第二欄位中包含有「Sun」字元，則列印第六欄位數據
[root@localhost tmp]# awk '$2 ~ /Sun/ {printf $6 "\n" }' student.txt
96.66

提示：（6）練習的方式，是在某一列中查找是否包含一個字元串。而上面（5）的寫法，是在一行數據當中匹配是否包含一個字元串，根據需求靈活使用。

注意：~兩邊有無空格都可以。

拓展練習：

當使用df命令查看分區使用情況時，如果我只想查看真正的系統分區的使用狀況，而不想查看光碟和臨時分區的使用狀況，則可以執行如下：

# 查詢包含有sda+數字的行，並列印第一欄位和第五欄位
[root@localhost tmp]# df -h | awk '/sda[0-9]/ {printf $1 "\t" $5 "\t" "\n"}'
/dev/sda3   12%
/dev/sda1   15%

Tags: 高級測試技能 - Shell基礎