禁止apache异常访问量用户的方法

发布时间:2020-10-23编辑:脚本学堂
本文介绍了apache中禁止异常访问量的用户的方法,有需要的朋友参考下。

apache中的异常访问,通常指的是频繁、大量访问的用户,通过apache的log,结合几个linuxcmd/ target=_blank class=infotextkey>linux命令,可以分析这些用户,并通过apache的配置文件来禁止他们访问。

首先,更改apache的log方式,不记录一些图像、css等文件,这样在log中每一行基本上都能对应一次访问,如果不去除图像等文件的记录,正常用户访问一个页面,同时也会下载页面上的图像、css等文件,会产生多条log记录,影响计数的结果。

在apache的conf文件中增加如下配置:
 

复制代码 代码示例:
setenvifnocase request_uri .css$ useless-file
setenvifnocase request_uri .gif$ useless-file
setenvifnocase request_uri .ico$ useless-file
setenvifnocase request_uri .jpg$ useless-file
setenvifnocase request_uri .js$ useless-file
customlog logs/fwolf.com/access.log combined env=!useless-file

关于setenvif的其他用法,可以参见apache文档中setenvif和environment variables in apache部分。

经过一段时间的运行,就可以分析log文件中访问量最大的用户了,只需要一条命令:
 

复制代码 代码示例:
cat access.log |awk '{print $1}'| sort | uniq -c |sort -n

cat就不用说了;
awk的作用,就是把第一列,也就是客户端IP地址分拣出来;
第一个sort,是把分拣出来的ip地址排序,这样相同的ip地址会排在一起
uniq是一个去除重复值的工具,但是带上-c参数,就可以统计出每个值出现了多少次
最后的sort,把uniq产生的结果进行排序,按照-n这个参数的默认设置,最大的排在最下面。
所以,得到的结果应该是这样的:
......
2040 219.148.106.198
2047 218.12.78.14
2149 218.12.26.233
2205 121.28.4.34

第一列就是访问次数,第二列是ip地址,再回去对照log文件中的详细内容,如果发现哪个访问量大户是某某机器人的话,就可以禁止掉了,还是修改apache的conf文件:
 

复制代码 代码示例:
<directory />
    order deny,allow
    deny from 219.143.69.2
    deny from 218.12.26.233
    deny from 61.135.162.51
    allow from all
</directory>
 

如此反复监测、设置,直到没有人捣乱为止。

同理,如果想查看反复刷新查看某一页面的用户,可以用如下命令:
 

复制代码 代码示例:
grep "get /url/to/some/file" access.log |awk '{print $1}' |sort |uniq -c |sort -n