『忘了再學』Shell基礎 — 29、AWK內置變量

1、AWK內置變量

AWK內置變量如下表:

awk內置變量 作用
$0 代表目前AWK所讀入的整行數據。我們已知AWK是一行一行讀入數據的,$0就代表當前讀入行的整行數據。
$n 代表目前讀入行的第n個字段。
NF 當前行擁有的字段(列)總數。
NR 當前AWK所處理的行,是總數據的第幾行。
FS 用戶定義分隔符。AWK的默認分隔符是任何空格(tab鍵或者空格),如果想要使用其他分隔符(如「:」),就需要FS變量定義。
ARGC 命令行參數個數。
ARGV 命令行參數數組。
FNR 當前文件中的當前記錄數(對輸入文件起始為1)。
OFMT 數值的輸出格式(默認為%.6g)。
OFS 輸出字段的分隔符(默認為空格)。
ORS 輸出記錄分隔符(默認為換行符)。
RS 輸入記錄分隔符(默認為換行符)。

2、練習說明

(1)$n變量練習

使用如下文本:

ID      Name    Python  Linux   MySQL   Java
1       Tangs   88      87      86      85.55
2       Sunwk   99      98      97      96,66
3       Zhubj   77      76      75      74.44
4       Shahs   66      65      64      63.33

比如我們提取文本中的第2列數據,執行如下命令:

[root@localhost tmp]# awk '{printf $2 "\n"}' student.txt
Name
Tangs
Sunwk
Zhubj
Shahs

(2)FS變量練習

AWK的默認分隔符是任何空格(tab鍵或者空格),如果想要使用其他分隔符,就需要FS變量定義。

cut命令默認是以tab鍵做為分隔符。

我們之前用cut命令提取過/etc/passwd文件中普通用戶的用戶名,現在我們來用AWK來提取能正常登陸用戶的用戶名。

執行如下命令:

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk '{FS=":"} {printf $1 "\n"}'
root:x:0:0:root:/root:/bin/bash
user1
user2

說明:FS變量指定分隔符是一個單獨的動作,而打印輸出是另外一個動作。

看到上面的結果我們會發現,user1user2用戶的信息正確提取了,而第一行root用戶的信息,是把整行的數據都打印輸出了,沒有按:冒號做為分隔符來正確的提取。

是因為AWK先把一行數據讀取進AWK中,然後在用後面的動作,再對讀入的數據進行處理。

也就是說我已經把第一行的root用戶的信息,已經讀入到awk中,$0$1$2等變量已經賦值好了,然後才在後邊的動作中看到你指定了:冒號作為分隔符,這個時候第一行數據已經來不及處理了,只能用AWK默認的處理方式,用空格作為分隔符來處理,這一行沒有空格,就會把這一行的所有數據全部打印出來了。

到了處理第二行數據的時候,AWK已經知道要用:冒號作為分隔符,這個時候就可以正確處理數據了。

現在就需要用的BEGIN來處理這個問題,把分隔符的指定{FS=":"}放入BEGIN中就可以了。

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\n"}'
root
user1
user2

這樣就可以正確提取到我們需要的數據了。

所以在使用AWK的時候,如果需要手動指定分隔符,要把這個指定分隔符的動作寫在BEGIN中。

總結:如果有明顯的分隔符,推薦優先使用cut命令,因為簡單。

但是如果需要一些判斷的話,比如我需要根據用戶ID,查看某一個用戶的用戶名。

這個時候用AWK就方便很多,cut命令就不能直接處理了,需要寫腳本程序進行過濾。

比如打印uid=500的用戶的用戶名,命令如下:

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} $3=="500" {printf $1 "\n"}'
user1

# $3=="500"也可以寫成$3==500或者$3=/500/都可以

(3)NF變量和NR變量練習

我們還是以/etc/passwd文件中的內容為例,需求打印輸出可登錄的用戶的用戶名,用戶ID,行號,字段數(也就是列數)。

執行如下命令:

# 提示:寫法是,輸出格式在雙引號里,變量在雙引號外。
[root@192 tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\t" $3 "\t 行號:" NR "\t 字段數:" NF "\n"}'
root    0    行號:1    字段數:7
user1   500  行號:2    字段數:7
user2   501  行號:3    字段數:7

注意一下,最終傳入AWK中處理的數據就三行,如下:

[root@192 tmp]# cat /etc/passwd | grep "/bin/bash"
root:x:0:0:root:/root:/bin/bash
user1:x:500:500::/home/user1:/bin/bash
user2:x:501:501::/home/user2:/bin/bash

3、總結:

我們就學會前5個AWK內置變量就可以了,後邊的AWK內置變量一般用不到,換句話說就是能用Shell處理的,就少用AWK處理,以後如果真要用到AWK進行更深層次的編程,自己再單獨的學習一下AWK。