AWK 基本语法
AWK 是极其简单的,你觉得难,那是因为不懂它的工作流程和语法。
对于大多数人来说,难的原因是不常用,语法又难记,哈哈。
AWK 程序有两种运行方式:
- 一种就是像上一章节那样直接在终端( shell )中使用。
- AWK 的另一种使用方式,就是可以和 Shell 脚本,写在一个文本文件里,然后运行这个文本文件。不过这种方式不多见
AWK 命令行使用
AWK 最常见的使用方式就是在终端里直接输入 AWK 脚本。
awk [options] file ...
在命令行里直接使用,我们需要讲 AWK 代码使用 单引号
( ''
) 引起来。
比如
[www.twle.cn]$ awk '{print}' employee.txt
范例
假设我们有一个雇员文件 employee.txt
,在这个雇员文件里,每一个雇员一行,内容如下
1) 张三 技术部 23 2) 李四 人力部 22 3) 王五 行政部 23 4) 赵六 技术部 24 5) 朱七 客服部 23
要显示文件的内容,我们可以使用 cat employee.txt
命令
[www.twle.cn]$ cat employee.txt 1) 张三 技术部 23 2) 李四 人力部 22 3) 王五 行政部 23 4) 赵六 技术部 24 5) 朱七 客服部 23
当然了,我们使用 AWK 同样也能实现同样的效果,命令如下
[www.twle.cn]$ awk '{print}' employee.txt
AWK 程序文件
如果 AWK 代码太多,我们也可以把 AWK 代码写在一个 .awk
的文本文件里,然后通过 -f
选项指定 awk 命令使用该 AWK 脚本文件
awk [options] -f file ....
为了方便演示,我们拿上面的 AWK 命令行程序来做范例,我们可以在当前目录下新建一个文件叫做 command.awk
,然后在 command.awk
里输入以下内容
{print}
其实就是把单引号 (
''
) 之间的内容放入command.awk
文件中。
最后,我们就可以通过下面的命令来运行这个 command.awk
文件
[www.twle.cn]$ awk -f command.awk employee.txt
运行上面这段代码,我们可以看到输出的结果和上面一模一样
[www.twle.cn]$ awk -f command.awk employee.txt 1) 张三 技术部 23 2) 李四 人力部 22 3) 王五 行政部 23 4) 赵六 技术部 24 5) 朱七 客服部 23
AWK 标准选项
命令行程序 awk
命令支持一些标准的选项,我们可以使用这些选项定制 awk 程序。
下面,我们就来罗列一些常见的选项
-v
选项
-v
选项用于预定义一些变量。这些预定义变量会在执行具体的 AWK 程序之前就定义好,准确的说,在 BEGIN
语句之前就已经定义。已经可以在 BEGIN
语句中使用
下面的 awk 命令行代码演示了 -v 选项的使用,它与定义了一个变量 site
并指定值为 www.twle.cn
[www.twle.cn]$ awk -v site=www.twle.cn 'BEGIN{printf "Site = %s\n", site}'
运行上面的命令,输出结果如下
Site = www.twle.cn
--dump-variables[=file]
选项
Mac OS 系统默认的 awk 不支持该选项
--dump-variables[=file]
用于显示/导出按字母顺序排序的,当前已经定义的所有全局变量
如果不指定 [=file]
,那么默认的导出文件为 awkvars.out
[www.twle.cn]$ awk --dump-variables '' [www.twle.cn]$ cat awkvars.out
运行上面的命令,输出结果如下
ARGC: number (1) ARGIND: number (0) ARGV: array, 1 elements BINMODE: number (0) CONVFMT: string ("%.6g") ERRNO: number (0) FIELDWIDTHS: string ("") FILENAME: string ("") FNR: number (0) FS: string (" ") IGNORECASE: number (0) LINT: number (0) NF: number (0) NR: number (0) OFMT: string ("%.6g") OFS: string (" ") ORS: string ("\n") RLENGTH: number (0) RS: string ("\n") RSTART: number (0) RT: string ("") SUBSEP: string ("\034") TEXTDOMAIN: string ("messages")
--help
选项
Mac OS 系统默认的 awk 不支持该选项
--help
选项用于输出 awk
命令的帮助信息
[www.twle.cn]$ awk --help
运行上面的脚本,输出结果如下
用法: awk [POSIX 或 GNU 风格选项] -f 脚本文件 [--] 文件 ... 用法: awk [POSIX 或 GNU 风格选项] [--] '程序' 文件 ... POSIX 选项: GNU 长选项: -f 脚本文件 --file=脚本文件 -F fs --field-separator=fs -v var=val --assign=var=val -m[fr] val -O --optimize -W compat --compat -W copyleft --copyleft -W copyright --copyright -W dump-variables[=file] --dump-variables[=file] -W exec=file --exec=file -W gen-po --gen-po -W help --help -W lint[=fatal] --lint[=fatal] -W lint-old --lint-old -W non-decimal-data --non-decimal-data -W profile[=file] --profile[=file] -W posix --posix -W re-interval --re-interval -W source=program-text --source=program-text -W traditional --traditional -W usage --usage -W use-lc-numeric --use-lc-numeric -W version --version 提交错误报告请参考“gawk.info”中的“Bugs”页,它位于打印版本中的“Reporting Problems and Bugs”一节 翻译错误请发信至 translation-team-zh-cn@lists.sourceforge.net gawk 是一个模式扫描及处理语言。缺省情况下它从标准输入读入并写至标准输出。 范例: gawk '{ sum += $1 }; END { print sum }' file gawk -F: '{ print $1 }' /etc/passwd
--lint[=fatal]
选项
Mac OS 系统默认的 awk 不支持该选项
--lint
选项用于检查当前的 AWK 代码和当前的输入流,一般来说主要检查可疑的结构和不可移植的代码。
如果指定了 [=fatal]
,那么会讲警告信息当作错误信息处理,也就是说遇到警告信息,程序也会自动终止。
例如下面的 awk 脚本,我们使用 /bin/ls
作为输入流,因为 /bin/ls
是一个二进制文件,因此使用 --link
的时候会报错
[www.twle.cn]$ awk --lint '' /bin/ls
运行上面的文件,输出结果如下
awk: 警告: 命令行中程序体为空 awk: 警告: 源文件不以换行符结束 awk: 警告: 完全没有程序正文!
--posix
选项
Mac OS 系统默认的 awk 不支持该选项
--posix
选项用于开启严格的 POSIX 兼容性检查。
在严格的 POSIX 兼容性检查模式下,几乎会禁用所有常见的和 gawk-specific 中定义的扩展
--profile[=file]
选项
Mac OS 系统默认的 awk 不支持该选项
--profile[=file]
选项用于将当前的 awk 程序代码格式化并切输出到 file
文件中。
如果不传递 [=file]
,那么默认的文件为当前目录下的 awkprof.out
例如下面的 awk 命令,我们使用 --profile
格式化我们的代码
[www.twle.cn]$ awk --profile 'BEGIN{printf"---|Header|--\n"} {print} END{printf"---|Footer|---\n"}' employee.txt > /dev/null [www.twle.cn]$ cat awkprof.out
运行上面的 awk 程序,输出结果如下
# gawk 配置, 创建 Sat May 25 12:13:10 2019 # BEGIN 块 BEGIN { printf "---|Header|--\n" } # 规则 { print $0 } # END 块 END { printf "---|Footer|---\n" }
--traditional
选项
Mac OS 系统默认的 awk 不支持该选项
--traditional
选项用于禁用所有 gawk-specific 扩展。
--version
选项
--version
选项用于显示当前 awk
命令行程序的版本
[www.twle.cn]$ awk --version
运行上面的命令,输入结果如下 (苹果电脑)
[www.twle.cn]$ awk --version awk version 20070501
其它 Linux 系统,结果如下
GNU Awk 3.1.7 版权所有 © 1989, 1991-2009 自由软件基金会(FSF)。 该程序为自由软件,你可以在自由软件基金会发布的 GNU 通用公共许可证(GPL)第 3版或以后版本下修改或重新发布。 该程序之所以被发布是因为希望他能对你有所用处,但我们不作任何担保。这包含 但不限于任何商业适售性以及针对特定目的的适用性的担保。详情参见 GNU 通用公 共许可证(GPL)。 你应该收到程序附带的一份 GNU 通用公共许可证(GPL)。如果没有收到,请参看 http://www.gnu.org/licenses/