现在的位置:首页>网站SEO>正文

网站日志分析实例教程

2012年12月16日 ⁄ 共 1438字 评论 1 条

今天我们要说的是网站日志分析,是手工分析,而不是借助三方软件.我们都知道,好一点的日志分析软件那都是要money的,没有钱的话,就得自已学会分析网站日志,并能从网站日志的结果中找到问题并解决.我们通过FTP访问网站的根目录,在根目录下可以看到一个log或者weblog文件夹,这里面就是日志文件,我们把这个日志文件下载下来,用记事本(或浏览器)打开就可以看到网站日志的内容.

先来看一个实例.内容如下:

220.181.108.171 - - [14/Dec/2012:06:42:07 -0700] "GET www.fuli121.com/325.html HTTP/1.1" 200 5545 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)" 0 "redirect-handler" "/var/chroot/home/content/42/10136242/html/index.php" 649821

这是从福利老幺的网站日志中提取的一段日志记录,由上图我们可以看到这时百度蜘蛛成功抓取了福利老幺中www.fuli121.com/325.html这个页面,后面的200 5545就是证明.最前面是蜘蛛的IP,有时候我们也要对蜘蛛的真假作一个判断,这点百度站长平台可以看到,那就是用nslookup命令来查看,上面的日志中我们来查看一下蜘蛛的真假,如下图:

zhizhuip1

由上图可以看到,该IP对应的蜘蛛是真的,来自百度,再回过头来看看上面说到的http状态码,最常见的HTTP状态码有200(页面抓取成功)、304(上次抓取的和这次抓取的没变化),404(未找到页面,错误链接)500(服务器未响应,一般由服务器维护和出故障,网站打不开时出现的),这些状态码是我们站长朋友必须能看懂的,服务器状态码的值是我们和蜘蛛交流的信号。知道了这些基本信息以后 我们就可以根据网站日志进行分析了,一般来说我们只看百度和谷歌蜘蛛的爬行和抓取情况,当然有时候也可以关注一下其它的蜘蛛,如搜狗,yohoo等.当你的网站上出现404状态码的时候,你就要注意了,来看一段代码先:

61.135.190.71 - - [13/Dec/2012:02:34:13 -0700] "GET www.fuli121.com/316.html HTTP/1.1" 404 7542 "-" "Baiduspider-favo+(+http://www.baidu.com/search/spider.htm)" 0 "redirect-handler" "/var/chroot/home/content/42/10136242/html/index.php" 923642

上面的代码中粉红色的字符中就有404页面,这时我们就要404前面的那一段网址:www.fuli121.com/316.html,如果不能打开,可能说明你的这个地址已经不存在了,这时我们就要向百度和谷歌提交死链文件了,将上面的地址放到一个文件中,上传到你的网站的根目录上,然后到站长平台上提交该文件.后面的文章我会教大家如何制做死链文件,你也可以自已支百度站长平台上查看.其次还有一些302的页面也要引起我们的重视!

评论 1 条 评论内容很精采,有内幕,而且绝对有干货

  1. 外星争霸 2015年05月12日 19:51  @回复  Δ-49楼 回复

    免费裸聊哦

给我留言