18913577661

您的当前位置:主页 > 新闻中心 > 行业新闻 >

网站日志分析很有必要

时间:2017-04-11

       网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,在ftp文件夹里,显示为logs文件夹。确切讲,是服务器日志。网站日志存在的最大意义是记录网站运营中空间运营情况、被访问请求记录等等。通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。对此,我们要对网站日志进行合理查看和分析。
 
       首先我们要知晓各个搜索引擎的的名称,这是知道哪个搜索引擎过来网站抓爬的关键。比如百度叫Baiduspider,谷歌叫Googlebot,360就叫360spider,另外还有搜狗、苹果和火狐等等。其中火狐浏览器和谷歌是做站必备,在此不做具体说明。
 网站日志分析很有必要
       其次,要知道服务器状态码,通常状态码有以下几种:200,301,302,304,404,500等。200代表成功抓取页面,301表示域名重定向,304表示蜘蛛此次抓爬与上次抓爬页面无改变,404表示错误页面,500表示服务器错误。最常用的就是这几种,要记住。
 
       对于蜘蛛抓爬的404页面,要多注意,尽早处理死链,上传404页面。而对于站长来讲,200代表蜘蛛抓取,要多关注一下是哪些页面。
 
       下面我们找一段日志具体分析:
 
       日志案例:117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1" 500 19967 "-" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)"
 
       具体分析:
 
       117.26.203.167 访问ip
 
       02/May/2011:01:57:44 -0700 访问日期和时区
 
       GET/index.php HTTP/1.1 根据HTTP/1.1 协议抓取此页面/index.php ,GET表示服务器动作。
 
       500 服务器响应状态码。关于状态码,上文已经做了说明。
 
       19967 表示抓取了19967个字节。
 
       Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar 表示访问者使用火狐浏览器及Alexa Toolbar等访问端信息。
 
       如果日志里格式不是如此,则代表日志格式设置不同。
 
       200 0 0和200 0 64都代表正常抓取。
本文由苏州网络推广:浩维网络原创

友情链接: 网络推广外包

Copyright © 2007-2016 苏州浩维网络科技有限公司 版权所有     苏ICP备10227305号    地址: 江苏省苏州园区星湖街328号创意产业园15幢201室

网站设计:浩维网络运营中心