以下脚本用于分析apacherizhi/ target=_blank class=infotextkey>apache日志中的蜘蛛爬行记录,能统计出各个搜索引擎的蜘蛛爬行了多少页面,给出一个清晰的统计结果,用来分析apache日志,真是挺不错的。
本脚本接收二个参考,参考一是日志所属的日期文件夹,参考二是日志的扩展名(在这里主要是轮循日志的序号,比如access.log.1,这里要传入的第二个参数就是1)。
完整代码如下图所示:
把以上代码保存为do.sh,并赋上执行权限:chmod +x do.sh 。
调用示例
在终端命令行输入:
# ./do.sh 201303 1
即统计分析 logs/201303 目录下的 access.log.1 日志文件。