『忘了再學』Shell基礎 — 29、AWK內置變量

1、AWK內置變量
2、練習說明
3、總結：

1、AWK內置變量

AWK內置變量如下表：

awk內置變量	作用
`$0`	代表目前AWK所讀入的整行數據。我們已知AWK是一行一行讀入數據的，`$0`就代表當前讀入行的整行數據。
`$n`	代表目前讀入行的第n個字段。
`NF`	當前行擁有的字段（列）總數。
`NR`	當前AWK所處理的行，是總數據的第幾行。
`FS`	用戶定義分隔符。AWK的默認分隔符是任何空格（tab鍵或者空格），如果想要使用其他分隔符（如「：」），就需要`FS`變量定義。
`ARGC`	命令行參數個數。
`ARGV`	命令行參數數組。
`FNR`	當前文件中的當前記錄數（對輸入文件起始為1）。
`OFMT`	數值的輸出格式（默認為`%.6g`）。
`OFS`	輸出字段的分隔符（默認為空格）。
`ORS`	輸出記錄分隔符（默認為換行符）。
`RS`	輸入記錄分隔符（默認為換行符）。

2、練習說明

（1）`$n`變量練習

使用如下文本：

ID      Name    Python  Linux   MySQL   Java
1       Tangs   88      87      86      85.55
2       Sunwk   99      98      97      96,66
3       Zhubj   77      76      75      74.44
4       Shahs   66      65      64      63.33

比如我們提取文本中的第2列數據，執行如下命令：

[root@localhost tmp]# awk '{printf $2 "\n"}' student.txt
Name
Tangs
Sunwk
Zhubj
Shahs

（2）`FS`變量練習

AWK的默認分隔符是任何空格（tab鍵或者空格），如果想要使用其他分隔符，就需要FS變量定義。

cut命令默認是以tab鍵做為分隔符。

我們之前用cut命令提取過/etc/passwd文件中普通用戶的用戶名，現在我們來用AWK來提取能正常登陸用戶的用戶名。

執行如下命令：

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk '{FS=":"} {printf $1 "\n"}'
root:x:0:0:root:/root:/bin/bash
user1
user2

說明：FS變量指定分隔符是一個單獨的動作，而打印輸出是另外一個動作。

看到上面的結果我們會發現，user1和user2用戶的信息正確提取了，而第一行root用戶的信息，是把整行的數據都打印輸出了，沒有按:冒號做為分隔符來正確的提取。

是因為AWK先把一行數據讀取進AWK中，然後在用後面的動作，再對讀入的數據進行處理。

也就是說我已經把第一行的root用戶的信息，已經讀入到awk中，$0、$1、$2等變量已經賦值好了，然後才在後邊的動作中看到你指定了:冒號作為分隔符，這個時候第一行數據已經來不及處理了，只能用AWK默認的處理方式，用空格作為分隔符來處理，這一行沒有空格，就會把這一行的所有數據全部打印出來了。

到了處理第二行數據的時候，AWK已經知道要用:冒號作為分隔符，這個時候就可以正確處理數據了。

現在就需要用的BEGIN來處理這個問題，把分隔符的指定{FS=":"}放入BEGIN中就可以了。

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\n"}'
root
user1
user2

這樣就可以正確提取到我們需要的數據了。

所以在使用AWK的時候，如果需要手動指定分隔符，要把這個指定分隔符的動作寫在BEGIN中。

總結：如果有明顯的分隔符，推薦優先使用cut命令，因為簡單。

但是如果需要一些判斷的話，比如我需要根據用戶ID，查看某一個用戶的用戶名。

這個時候用AWK就方便很多，cut命令就不能直接處理了，需要寫腳本程序進行過濾。

比如打印uid=500的用戶的用戶名，命令如下：

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} $3=="500" {printf $1 "\n"}'
user1

# $3=="500"也可以寫成$3==500或者$3=/500/都可以

（3）`NF`變量和`NR`變量練習

我們還是以/etc/passwd文件中的內容為例，需求打印輸出可登錄的用戶的用戶名，用戶ID，行號，字段數（也就是列數）。

執行如下命令：

# 提示：寫法是，輸出格式在雙引號里，變量在雙引號外。
[root@192 tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\t" $3 "\t 行號：" NR "\t 字段數：" NF "\n"}'
root    0    行號：1    字段數：7
user1   500  行號：2    字段數：7
user2   501  行號：3    字段數：7

注意一下，最終傳入AWK中處理的數據就三行，如下：

[root@192 tmp]# cat /etc/passwd | grep "/bin/bash"
root:x:0:0:root:/root:/bin/bash
user1:x:500:500::/home/user1:/bin/bash
user2:x:501:501::/home/user2:/bin/bash

3、總結：

我們就學會前5個AWK內置變量就可以了，後邊的AWK內置變量一般用不到，換句話說就是能用Shell處理的，就少用AWK處理，以後如果真要用到AWK進行更深層次的編程，自己再單獨的學習一下AWK。

Tags: 高級測試技能 - Shell基礎