您的位置:www.85058.com > 互联网资讯 > 如何分析网站日志文件

如何分析网站日志文件

发布时间:2019-11-03 06:44编辑:互联网资讯浏览(116)

    101 - 切换协议。

    401.3-由于ACL对资源的限制而未获得授权。

    500.100 - 内部 ASP 错误。

    403.13-客户端证书被吊销。

    搜狗蜘蛛名称(sogou spider)

    网站日志文件存放在什么地方?

    1、61.135.168.22 是访问了是服务器IP为这个的网站.

    Google蜘蛛 :Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) 

    403.7 - 要求客户端证书。

    423–锁定的错误。
    5xx-服务器错误

    谷歌爬虫名称(Googlebot)

    501-页眉值指定了未实现的配置。

    IIS日志的用途就是能够观察搜索引擎的蜘蛛来我们网站的爬取情况,可以更近距离的分析和接触蜘蛛。爬取次数,爬取时间点,爬取高峰期,爬取反应出来的HTTP状态码,为我们带来清晰的分析便利。

    414-请求URI太长。

    504 - 网关超时。

    附:网站日志代码大全

    417 - 执行失败。

    502-Web服务器用作网关或代理服务器时收到了无效响应。

    四、IIS详细状态码含义:

    401.7–访问被Web服务器上的URL授权策略拒绝。这个错误代码为IIS6.0所专用。

    200 - 确定。客户端请求已成功。

    "http://www.weiaipin.cn/"

    302:临时重定向

    403.3-写访问被禁止。

    403.10 - 配置无效。

     

    414 - 请求 URI 太长。

    Google图片搜索蜘蛛 :Googlebot-Image/1.0 

    404.0 - 未找到文件或目录。

     

    401.3 - 由于 ACL 对资源的限制而未获得授权。

    3、http返回状态码,搜索引擎蜘蛛以及用户每访问我们的网站一次,服务器端都会产生类似301,404,200的状态吗,我们可以参照此类信息,对我们出现问题的网站进行简单的诊断,及时处理问题。

    501 - 服务器无法完成请求的功能。

    307-临时重定向。
    4xx-客户端错误

    403.6 - IP 地址被拒绝。

    403.15-超出客户端访问许可。

    403.1 - 执行访问被禁止。

    Sogou搜狗蜘蛛 :Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07) 

    403.16 - 客户端证书不受信任或无效。

    403.17-客户端证书已过期或尚未生效。

    6、Baiduspider(+http:-www-baidu-com/search/spider.htm)表示百度蜘蛛的名称

    302-对象已临时移动。

    403.14 - 拒绝目录列表。

    对于这三款软件的具体使用评价总结,请看我写的另外一篇文章《常用网站日志分析软件使用总结》。

    502 - 服务器用作网关或代理服务器时收到了无效响应。

    206-部分内容。
    3xx-重定向

    404.3 - MIME 映射策略阻止本请求。

    116.231.220.179

    403.13 - 客户端证书被吊销。

    4、观察访客行为

    401.5 - ISAPI/CGI 应用程序授权失败。

     

    500.18 - URL 授权存储不能打开。这个错误代码为 IIS 6.0 所专用。

    绝 大多数收费主机都提供原始访问日志,网站服务器会把每一个访客来访时的一些信息自动记录下来,保存在原始访问日志文件中,如果你的主机不提供日志功能,建 议你到期后还是换主机吧。日志中记录了网站上所有资源的访问信息,包括图片、CSS、JS、FLASH、HTML、MP3等所有网页打开过程载入的资源, 同时记录了这些资源都被谁访问了、用什么来访问以及访问的结果是什么等等,可以说原始访问日志记录了主机的所有资源使用情况。

    415 - 不支持的媒体类型。

     

    图片 1

    401.1-登录失败。

    403.17 - 客户端证书已过期或尚未生效。

     

    403.15 - 超出客户端访问许可。

    1xx-信息提示

    分析:

    416–所请求的范围无法满足。

    505 - HTTP 版本不受支持。

    204-无内容。

    406 - 客户端浏览器不接受所请求页面的 MIME 类型。

    500.16–UNC授权凭据不正确。这个错误代码为IIS6.0所专用。

    三、基本状态码:

    "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:36.0)"

    200:请求已经完成,蜘蛛访问页面正常

    为访客来源(Referer)。这一段是告诉我们访客是从哪里来到这一个网页。有可能是你的网站其他页,有可能是来自搜索引擎的搜索页等。通过这条来源信息,你可以揪出盗链者的网页。

    404.2 - Web 服务扩展锁定策略阻止本请求。

    405-用来访问本页面的HTTP谓词不被允许(方法不被允许)

    100 - 表示已收到请求的一部分,正在继续发送余下部分。

    如 果在日志中,你发现某个资源(网页、图片和mp3等)被人频繁访问,那你应该注意该资源被用于何处了!如果这些请求的来源(Referer)不是你的网站 或者为空,且状态码(Http Code)为200,说明你的这些资源很可能被人盗链了,通过 Referer 你可以查出盗链者的网址,这可能就是你的网站流量暴增的原因,你应该做好防盗链了。请看下图,我网站上的japan.mp3这个文件就被人频繁的访问了, 下图还只是日志的一部分,这人极其险恶,由于我早已将该文件删除,它迟迟要不到japan.mp3,在短短一个小时内对japan.mp3发起了不下百次 的请求,见我设置了防盗链就伪造来源Referer和Agent,还不断地更换IP,很可惜它做得都是无用功,根本没有这个文件,请求的状态码Http Code都是403或者404。

    413 - 请求实体太大。

    403.2-读访问被禁止。

    403.18 - 在当前的应用程序池中不能执行所请求的 URL.这个错误代码为 IIS 6.0 所专用。

    403.1-执行访问被禁止。

    400 - 错误的请求。

    404.3-MIME映射策略阻止本请求。

    305:使用代理

    404.0-(无)–没有找到文件或目录。

    二、IIS分析:

    403.20-Passport登录失败。这个错误代码为IIS6.0所专用。

    203 - 非权威性信息。

     

    【来源媒体:雨中漫步网络 编译:赵慧森】

    406-客户端浏览器不接受所请求页面的MIME类型。

    500 - 服务器内部错误。

    404.2-Web服务扩展锁定策略阻止本请求。

    503 - 服务不可用。这个错误代码为 IIS 6.0 所专用。

    415–不支持的媒体类型。

    400:请求错误

    401.2-服务器配置导致登录失败。

    有道蜘蛛名称

    网站日志文件里面的记录怎么看?

    500.15 - 不允许直接请求 Global.asa.

     

    403.9 - 用户数过多。

    403.14-拒绝目录列表。

    401.2 - 服务器配置导致登录失败。

    韩国Yeti蜘蛛:Yeti/1.0 (NHN Corp.; http://help.naver.com/robots/) 

    403.11 - 密码更改。

    401-访问被拒绝。IIS定义了许多不同的401错误,它们指明更为具体的错误原因。这些具体的错误代码在浏览器中显示,但不在IIS日志中显示:

    403 - 禁止访问:IIS 定义了许多不同的 403 错误,它们指明更为具体的错误原因:

     

    401.4 - 筛选器授权失败。

     

    205 - 重置内容。

    100-继续。

    405 - 用来访问本页面的 HTTP 谓词不被允许

    "GET /blog/article/10.html HTTP/1.1"

    MSN的蜘蛛名称:msnbot

    1、注意那些被频繁访问的资源

    雅虎爬虫名称(Yahoo Slurp)

    200 8671

    302 - 临时移动转移,请求的内容已临时移动新的位置

     

    204 - 无内容。

    407-要求进行代理身份验证。

    403.4 - 要求 SSL.

    500-内部服务器错误。

    202 - 已接受。

    403.19-不能为这个应用程序池中的客户端执行CGI。这个错误代码为IIS6.0所专用。

    其实我们做seo网站优化的一般来说都是一个全知全能的职位,因为做优化做排名影响的因素太多了,就比如我们今天要讲的课题,日志的分析如果不会分析看不懂蜘蛛的爬行轨迹,那么在优化的过程中出现问题,就很有可能思路是错的而不自知。

    分析网站日志有什么作用?

    404:找不到页面

    2、注意那些你网站上不存在资源的请求

    404 - 未找到请求的内容。

     

    404.1 - 无法在所请求的端口上访问 Web站点。

    1、我们可以比较准确的定位搜索引擎蜘蛛来爬行我们网站的次数,可以屏蔽伪蜘蛛(此类蜘蛛多以采集为主,会增加我们服务器的开销)点此识别Baiduspider真伪 ;

    423 - 锁定的错误。

    505-HTTP版本不受支持。

    一、各大搜索引擎的蜘蛛名称:

    500.100-内部ASP错误。

    2、11/Jan/2009:04:02:45 表示蜘蛛爬行时间

    本文转载于「为爱拼」,原文地址:http://www.weiaipin.cn/blog/article/31.html

    304:蜘蛛爬取后发现,页面没有修改

    401.5-ISAPI/CGI应用程序授权失败。

    300 - 针对收到请求,服务器可执行多种操作。

    发生错误,客户端似乎有问题。例如,客户端请求不存在的页面,客户端未提供有效的身份验证信息。400-错误的请求。

    502.2 - CGI 应用程序出错。

    412-前提条件失败。

    502.1 - CGI 应用程序超时。

     

    好了,今天我们就给大家讲讲日志的分析与http 返回状态码的意义。

    这些状态代码表示临时的响应。客户端在收到常规响应之前,应准备接收一个或多个1xx响应。

    本文由www.85058.com发布于互联网资讯,转载请注明出处:如何分析网站日志文件

    关键词: