awk实现文本或日志分析处理_shell日志脚本

awk实现文本或日志分析处理: 发布时间：2020-06-05编辑：脚本学堂

本文介绍了awk命令进行文本或日志分析的方法，万能的awk命令分析日志绝对是一把好手，本节通过实例学习awk分析日志的方法，一起来看看吧。

使用linuxjishu/13830.html target=_blank class=infotextkey>awk与sort -nr分析访问日志，找出每种请求返回状态码的请求个数：
访问日志的文件格式：

113.31.27.213 www.jb200.com - [15/Apr/2012:04:06:17 +0800] "GET /faq/ HTTP/1.0" 200 2795 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.2 Safari/535.11" 118.119.120.248, 222.215.136.44 0.003 192.168.0.25:80 200 3.31

最常用的处理方式为：

复制代码代码示例:

cat /home/logs/nginx/www.jb200.com.access.log|awk '{print $(NF-1)}'|sort -nr |uniq -c

处理效率较低:

复制代码代码示例:

time cat /home/logs/nginx/www.jb200.com.access.log|awk '{print $(NF-1)}'|sort -nr |uniq -c

      1 200"

      3 "404"

      4 "304"

   7377 "200"

     48 "-"

real    0m0.107s

user    0m0.102s

sys     0m0.013s

time cat /home/logs/nginx/www.jb200.com.access.log|awk '{a[$(NF-1)]++} END{for (i in a) print i " " a[i]}'

"304" 4

"404" 3

"200" 7399

"-" 49

200" 1

real    0m0.018s

user    0m0.013s

sys     0m0.008s

可见使用后面的awk处理效率高10倍~

另一个案例,用一行shell命令处理以下文本分析任务：
有一个文本文件，内容为每行为每隔5分钟记录的带宽峰值，共一个月（共8640行），我需要计算出，每天的峰值并排序：
traffic文件格式:

-bash-4.1$ cat traffic.txt|more
2012-04-01 00:00        1952.34 mbps
2012-04-01 00:05        2198.34 mbps
2012-04-01 00:10        2117.07 mbps
2012-04-01 00:15        2104.83 mbps
2012-04-01 00:20        1878.73 mbps

一种常见解决方法:

复制代码代码示例:

-bash-4.1$ for i in `cat traffic.txt|awk '{print $1}'|sort|uniq`; do cat traffic.txt|grep $i|sort -nr -k3 |head -1 ; done     

2012-04-01 21:35    3876.02 mbps

2012-04-02 21:15    3577.66 mbps

2012-04-03 21:35    3371.59 mbps

2012-04-04 21:10    3087.17 mbps

2012-04-05 21:35    3202.44 mbps

2012-04-06 20:45    3703.53 mbps

2012-04-07 20:40    4177.43 mbps

2012-04-08 14:25    3837.9 mbps

2012-04-09 20:50    3082.46 mbps

...

更高效的解决方法:

复制代码代码示例:

-bash-4.1$ cat traffic.txt |awk '{if($3 > a[$1])a[$1]=$3} END{for(i in a)print i " " a[i]}'

2012-04-28 5369.81

2012-04-19 3474.73

2012-04-29 4824.24

2012-04-10 2979.91

2012-04-01 3876.02

2012-04-20 3866.19

2012-04-11 3548.73

2012-04-02 3577.66

2012-04-30 4077.35

...

经对比,后面一种方法处理执行效率仍然高10倍.可见活用awk对文本或日志分析处理效率明显提高.

上一篇：Nginx/Apache日志分析脚本实例精讲
下一篇：nginx日志分析脚本一例

与 awk实现文本或日志分析处理有关的文章

本文标题：awk实现文本或日志分析处理
本页链接：http://www.jb200.com/article/24248.html

浏览排行

栏目分类

热点文章

awk实现文本或日志分析处理