使用awk处理文本文件
时间:2019-08-20 17:58:06 来源:igfitidea点击:
在Unix/Linux系统中,经常使用awk命令来处理有一定格式的文本信息中的列。
awk命令
awk是一个很优秀的处理文本中的行和列的工具。
Awk命令被Unix/Linux用户广泛用于文本处理文件。
它具有搜索关键字/字符串的功能。
还可以和regex表达式一起使用。
使用awk命令处理文本文件中的列
创建一个测试文件
[root@theitroad ~]# ls -l / > /tmp/test.txt [root@theitroad ~]# cat /tmp/test.txt total 20 lrwxrwxrwx. 1 root root 7 Sep 30 13:39 bin -> usr/bin dr-xr-xr-x. 5 root root 4096 Sep 30 14:07 boot drwxr-xr-x. 19 root root 3220 Sep 30 06:34 dev drwxr-xr-x. 139 root root 8192 Sep 30 06:19 etc drwxr-xr-x. 3 root root 18 Sep 30 14:02 home lrwxrwxrwx. 1 root root 7 Sep 30 13:39 lib -> usr/lib lrwxrwxrwx. 1 root root 9 Sep 30 13:39 lib64 -> usr/lib64 drwxr-xr-x. 2 root root 6 Apr 11 2018 media drwxr-xr-x. 2 root root 6 Apr 11 2018 mnt drwxr-xr-x. 3 root root 16 Sep 30 13:52 opt dr-xr-xr-x. 219 root root 0 Sep 30 06:33 proc dr-xr-x---. 6 root root 198 Sep 30 06:20 root drwxr-xr-x. 42 root root 1260 Sep 30 06:37 run lrwxrwxrwx. 1 root root 8 Sep 30 13:39 sbin -> usr/sbin drwxr-xr-x. 2 root root 6 Apr 11 2018 srv dr-xr-xr-x. 13 root root 0 Sep 30 06:34 sys drwxrwxrwt. 19 root root 4096 Oct 1 02:51 tmp drwxr-xr-x. 13 root root 155 Sep 30 13:39 usr drwxr-xr-x. 20 root root 282 Sep 30 14:06 var
打印某一列
语法:
awk '{print $column-number}' /path/file-name
示例:打印第2列
awk '{print }' /tmp/test.txt
-F:
表示使用冒号做分隔符
示例:打印第4列
awk '{print }' /tmp/test.txt
打印多列
打印多个列需要逗号(,)分隔多个列。
语法:
awk '{print $column-number1,$column-number2,$column-number-N'} /path/file-name
示例:打印第2列、第3列和第5列
awk '{print ,,}' /tmp/test.txt
输出如下:
20 1 root 7 5 root 4096 19 root 3220 139 root 8192 3 root 18
指定字段分隔符
awk命令默认的分割符是空格。
我们可以使用其他字符,比如分号(;)、冒号(:)、逗号(,)、制表符、空格等作为字段分隔符。
awk命令有一个–field-separator
的选项。 简写是 -F
。
语法:
awk -F'separator' '{print $column-number-N}' /path/file-name
从/etc/passwd打印第1列、第6列和第7列。
awk -F':' '{print ,,}' /etc/passwd
输出如下:
root /root /bin/bash bin /bin /sbin/nologin daemon /sbin /sbin/nologin adm /var/adm /sbin/nologin lp /var/spool/lpd /sbin/nologin
使用awk命令打印整个文件
使用awk命令打印整个文件 类似于“cat file-name”`
语法:
awk '{print ##代码##}' /path/filename
$0 匹配整行。