如何实现日志的集中化存储以及使用loganalyzer做日志分析

如何实现日志的集中化存储以及使用loganalyzer做日志分析,第1张

如何实现日志的集中化存储以及使用loganalyzer做日志分析

1、下载网站日志:

流程如下:主机独立控制面板——网站情报系统分析——网站日志——下载WebLog日志——右键,链接另存为

在主机独立控制面板中,找到网站情报系统分析板块,里面就能看到网站日志了,点击下载WebLog日志,能看到最近几天的网站日志,但是进去,会发现是一堆看不懂的代码,没有关系,我们先不要进去查看,而是右键,链接另存为,下载网站日志。

——————

2、代码看不懂的话,可以使用光年日志分析软件GnAnalyzer,这是一个可以帮助我们进行网站日志分析的软件。比如蜘蛛抓取的情况,日志里面都有显示。

——————

3、光年日志分析软件的使用:

下载好网站日志后,就可以使用光年日志分析软件进行网站日志的分析了。

流程如下:光年日志分析软件文件夹中的GnAnalyzerexe——文件菜单,新建任务——添加(类型选择所有文件)——下一步,保存——马上分析

——————

4、网站日志分析:

马上分析后,就可以查看当天:蜘蛛分析(概要分析、目录抓取、页面抓取、IP排行);搜索引擎分析(关键字分析);状态码分析(用户状态码、蜘蛛状态码)的相关信息。

1进入服务器的管理之后,打开“Internet 信息服务(IIS)管理器”

2进入管理以后打开服务器(本地计算机)

3双击服务器(本地计算机),在网站栏目那里右键单击选择属性。

在弹出的窗口里面,网站栏目点击属性

上面的日志文件目录即是iis的文件存放位置了,在C:\WINDOWS\system32\LogFiles\W3SVC20110218打开文件夹。

这些文件就是网站的iis日志了。

知道了IIS日志的位置了,接下来我们就应该对日志文件进行分析了,那么如果分析呢?

1 IIS日志后可以用IIS日志分析工具去大概的去查一查IIS日志。一般工具都能查出有各种蜘蛛来到网站的总数,以及有没有失败,不会把各种的信息都给你。并不是工具分析没有出现失败的我们就不用一条一条看了,工具分析只是简单的告诉你有没有失败,没有失败当然是皆大欢喜了,但是来是一条一条的去分析。我们拿出这样子的一条信息来分析一下

首先是时间:2010-10-22 05:04:53 机器编号为W3SVC151800 P-0YMR9WW8YX4U9 2227621349是网站的IP GET是触发事件, 80是端口号,6113518649是蜘蛛的IP,Baiduspider是百度的蜘蛛,200 0 0访问成功, 41786 193 6968 是蜘蛛与网站对话的时间与下载的数据以及花了多少时间。连在一起就是20101022的早上5点4分53秒的时候一个编号为W3SVC151800 P-0YMR9WW8YX4U9的蜘蛛通过80端口进入网站成功访问并下载了47186B的数据,花费了193MS。

百度的蜘蛛名字:Baiduspider、google蜘蛛名字:googlebot 、有道的蜘蛛名字:YoudaoBot、yahoo的蜘蛛的名字:slurp。

IIS日志基本上都是这样子的,区别在于上面那个是成功抓取:200 0 0

一下是FTTP状态码:

404(未找到)服务器找不到请求的页面

304 (未修改)自从上次请求后,请求的页面未修改过,服务器返回此响应时,不会返回网页内容

503 (服务不可用)服务器目前无法使用(由于超时或停机维护)

301 永久重定向

302 临时重定向

基本上我们要了解的就是这些FTTP状态码,如果你的网站出现了404,那你就要立刻用robots进行屏蔽,404是死链接,如果出现了404的话搜索引擎会认为你欺骗用户,会对你作出处罚。大面积出现304的话那就要注意了,网站没有更新,一二条关系不大,但是多了就会让搜索引擎认为你网站没有人管理,时间长了就会导致网站快照不更新,关键词的波动;出现了503是你无法解决的,你就要找服务器供应商。如果是连续同一时间出现503的时候我建议你去换一个服务器,因为他在那个时候判断服务器导致蜘蛛进不去,蜘蛛不能进你的网站,搜索就不会了解,就会降低信任度,降权也随之开始了。301是永久重定向,是网站改换了使用的,可以从这里判断你的301做的怎么样,成功了没有。302临时的重定向,当做策划什么活动的时候可以使用。

2 用excel表格分析网站的iis日志。

先新建一个excel表格,把刚才的ex121129log文件里的文件粘贴到新建的excel表格里面。

复制之后,选定A

在上面的工具栏里选择数据→分列

选择分隔符号,点击下一步

选择空格,去掉Tab键前面的钩,点击完成。

网站的iis日志就这样被拆分出来了,之后自己再调整一下表格的列宽、升降序等即可。

利用Windows 2003服务器的远程维护功能,并通过IE浏览界面,就能对服务器的日志文件进行远程查看了,不过默认状态下,Windows 2003服务器的远程维护功能并没有开通,需要手工启动。

查看服务器日志文件的作用

  网站服务器日志记录了web服务器接收处理请求以及运行时错误等各种原始信息。通 过对日志进行统计、分析、综合,就能有效地掌握服务器的运行状况,发现和排除错误原 因、了解客户访问分布等,更好的加强系统的维护和管理。

  对于自己有服务器的朋友或是有条件可以看到服务器日志文件的朋友来说,无疑是了 解搜索引擎工作原理和搜索引擎对网页抓取频率的最佳途径。

  通过这个文件,您可以了解什么搜索引擎、什么时间、抓取了哪些页面,以及可以知 道是主搜索蜘蛛还是从搜索蜘蛛抓取了您的网站等的信息。

  访问原理

  1、客户端(浏览器)和Web服务器建立TCP连接,连接建立以后,向Web服务器发出 访问请求(如:Get),根据HTTP协议该请求中包含了客户端的IP地址、浏览器类型、 请求的URL等一系列信息。

  2、Web服务器收到请求后,将客户端要求的页面内容返回到客户端。如果出现错误,那么返回错误代码。

  3、服务器端将访问信息和错误信息纪录到日志文件里。

  下面我们就对本公司自己服务器其中的一个日志文件进行分析。由于文件比较长,所以我们只拿出典型的几种情况来说明。

  #Software: Microsoft Internet Information Services 60

  #Version: 10

  #Date: 2006-05-12 03:56:30

  #Fields:

date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port

cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status

  2006-05-12

03:56:30 三圆三圆三圆 2182592169 GET / - 80 - 2201811898

Baiduspider+(+http://wwwbaiducom/search/spiderhtm) 403 14 5

  / 说明 /

  上面定义了在2006年5月12日的3点56分30秒的时候,IP为2201811898的百度蜘蛛通过80端口(HTTP)访问了IP为2182592169的服务器的根目录,但被拒绝。

  #Software: Microsoft Internet Information Services 60

  #Version: 10

  #Date: 2006-05-12 10:18:39

  #Fields:

date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port

cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status

  2006-05-12

10:33:36 三圆三圆三圆 2182592169 GET //indexhtm - 80 - 102576

Mozilla/40+(compatible;+MSIE+60;+Windows+NT+51;+SV1) 200 0 0

  2006-05-12

10:33:36 三圆三圆三圆 2182592169 GET ///gif - 80 - 102576

Mozilla/40+(compatible;+MSIE+60;+Windows+NT+51;+SV1) 200 0 0

  / 说明 /

  上面定义了在2006年5月12日的10点33分36秒的时候,IP为102576的用户正常访问了网站三圆三圆三圆中目录下的indexhtm页和/下的。gif。

  #Software: Microsoft Internet Information Services 60

  #Version: 10

  #Date: 2006-05-12 13:17:46

  #Fields:

date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port

cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status

  2006-05-12

13:17:46 三圆三圆三圆 2182592169 GET /robotstxt - 80 - 662496672

Mozilla/50+(compatible;+Googlebot/21;++http://wwwgooglecom/bothtml)

404 0 2

  2006-05-12 13:17:46 三圆三圆三圆 2182592169 GET / - 80 -

662496672

Mozilla/50+(compatible;+Googlebot/21;++http://wwwgooglecom/bothtml)

403 14 5

  / 说明 /

  上面定义了在2006年5月12日的13点17分46秒的时候,IP为662496672的Google蜘蛛访问了robotstxt文件,但没有找到此文件,有访问了此网站的根目 录,但被拒绝。

  现在也有很多日志分析工具,如果您的服务器流量很大的话,作者推荐使用分析工具来分析服务器日志。

phrases

读音英 ['freɪzɪz]  美 ['frezɪz] 

意思

1、n [语] 短语;词组;乐句;措词(phrase的复数)

2、v 用话表示;把…分成短句;用短语描述(phrase的三单形式)

短语

1、lexical phrases 词汇短语 ; 使用词汇短语 ; 词语片语 ; 很高的短语词汇

2、Festival Phrases 音乐节短语

3、Golden Phrases 网络服务器日志分析 ; 服务器日志分析工具

4、Participial Phrases 分词短语 ; 为分词短语 ; 分词词组 ; 分词片语

5、prefabricated phrases 预制短语 ; 预制结构

6、phrases preferred 短语优先原则

扩展资料

phrases的近义词

expression

读音英 [ɪkˈspreʃn]  美 [ɪkˈspreʃn] 

意思n 表现,表示,表达;表情,脸色,态度,腔调,声调;式,符号;词句,语句,措辞,说法

短语

1、mathematical expression 表示式 ; 数学表达式 ; 数学式 ; 式子

2、expression languages 表达式语言

3、rational expression 有理式 ; 有理数式 ; 有理表达式 ; 整式和分式统称有理式

4、constant expression 常数表达式 ; 常量表达式 ; 常数表白式 ; 表达式

5、numeric expression 数值表达式 ; 数字表达式 ; 数值运算式 ; 数值表示法

查找数据

1

进浏览器打开百度,输入“国家统计局”然后进入“中华人民共和国统计局官网”。

2

在菜单栏“统计数据”中点击“数据查询”,弹出数据查询的页面后输入要查询的数据比如“湖南近5年生产总值”点击搜索下面就会出现相关数据。

3

点击右侧“相关报表”,弹出相关报表页面后再点击左侧指标栏里“地区生产总值“和右上侧时间框里选择”近5年“。

4

点击”报表管理“中的”编辑“,在列中选中我们要查找的数据,这样就只会显示我们要查的数据。

END

下载数据

我们要需要的数据搜素出来后,开始下载数据,点击上方的下载。

选择需要下载的格式后开始下载。在下载之前需要先登陆账号,没有的可以注册。

3

这就是Excle下载完打开的数据。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 如何实现日志的集中化存储以及使用loganalyzer做日志分析

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情