养成经常看日志的习惯,对于建设一个长期稳定的网站来讲,是非常重要的。
本文教大家如何看懂网站日志,希望对大家有所帮助。
如下是某网站的网站空间日志;(网站日志一般位于网站ftp的以log字母标识的文件夹中,具体根据虚拟主机平台而定,如果不清楚可以联系idc客服)
2012-01-12 00:00:07 GET /jgmrzx/nfmb/1453.html – - 203.208.60.219 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) – 200 2128
2012-01-12 00:00:35 GET / – - 123.125.71.99 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) – 200 88913
先看下各参数的意义
前面2012-01-12 00:00:07 是访问时间,提示下一般服务器时间与实际时间是可能有差异的;
GET /jgmrzx/nfmb/1453.html通过get方法访问了根目录下 /jgmrzx/nfmb/1453.html这个文件;
203.208.60.219 指的是访问者的ip;
HTTP/1.1 用过http协议访问;
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 这一大串的文字表示的是ip头文件,一般为浏览器信息,以及说明;
搜索引擎爬虫的信息也包含在里面;百度知道的表述为baiduspider谷歌爬虫是Googlebot;
200 ,这个是服务器返回状态码,200表示此次访问正常;
2128表示访问页面的大小,这个数值是以字节为单位的;
如何确定蜘蛛来访时间,例如在日志文件中查找当天百度蜘蛛访问足迹,我们可以ctrl+f查找baiduspider,然后看蜘蛛访问了哪些页面,具体是什么内容,什么时间来访的,还有蜘蛛一般什么时间来网站抓取,这时候我们更新文章讲蜘蛛伺候好了,后面收录权重也就不是问题了。
如何判定服务器有没有问题?最常见的服务器故障的状态码是500,如果服务器返回500,这时候你可以咨询下idc,看看服务器是否正常工作。
分析网站空间日志除了上面的内容外,我们还可以发现网站内部的一些错误,比如返回状态码为404,就表示该页面没打开或者是存在,我们就可以判定该页面可能出现问题,也就是常说的死链接。
当然,大家也可以下载一些iis日志分析工具,可以更方便地查看去分析网站日志。
提供几个常用的IIS日志分析工具:
1. IISWEB日志分析工具v1.03
2. 滴水社IIS日志分析工具v1.0
3. IIS日志分析工具V3.5
4. 飞达鲁IIS日志分析工具v1.0