服务器用什么监控软件好?

服务器用什么监控软件好?,第1张

曾经做过几次大规模服务器监控,下面推荐几款监控软件和辅助软件。

1zabbix一款老牌经典的监控软件。是一个企业级的分布式开源监控方案。能够实时监控从成千上万台服务器、虚拟机和网络设备中收集到的数以百万计的指标。

提供图形操作界面,可以方便的添加监控指标、告警指标。支持邮件、微信等的告警通知。

2Prometheus,近些年监控方面的当红炸子鸡,Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是GoogleBorgMon监控系统的开源版本。

其优点是轻量级,配置简易,上手简单,丰富的告警模板。

以上是两款监控软件,下面推荐几款监控辅助软件。

1grafana监控展示界面,在我们获取到监控数据后,可能需要把数据展示出来,给领导们邀功。grafana就是这样一款软件,开源免费,模板丰富。可直接对接zabbixprometheus和mysql数据库等。

2钉钉机器人。服务器出现告警怎么办,当然是发消息通知运维人员啊。钉钉机器人就提供这么一个功能。在钉钉群里面直接创建机器人,会给我们一个restfull的接口,我们就可以直接发送post请求。原生linux就直接用curl发送,Prometheus提供插件可以直接对接。

监控硬盘是一种比普通硬盘更实用的硬盘。普通硬盘在上电启动的时候会全速启动,瞬间电流可能达到2安,甚至更高。而监控硬盘启动的时候会缓慢加速,启动电流会控制在2安以下。因为监控系统中通常会安装多个硬盘,这样在启动的瞬间会产生很大的启动电流,如果是普通硬盘的话,电源会难以承受,甚至烧毁。另外,监控系统对硬盘的传输速度要求一般不高,但是会频繁的小数据量的读写。所以需要在磁头读写机构上针对监控系统的读写特点做结构优化设计,以延长磁头寿命。监控硬盘的理论平均无故障运行时间比普通硬盘要长的多,稳定性、可靠性要更高主要特点,更适合应用于一些特殊行业,比如说全天候数字视频监控系统。

与普通硬盘区别

  1连续工作时间差别 普通PC硬盘的设计以8×5为基础。8×5指的是普通PC硬盘每天工作8个小时,每周工作5天(硬盘工作是指硬盘处于读写状态。需要特别注意的是硬盘加电后有两个状态:工作状态和等待状态,其中工作状态是硬盘进行读写工作,等待状态是硬盘没有进行读写工作但处于待命状态。 DVR专用硬盘(监控硬盘)是按24×7的企业级环境要求进行设计开发的。24×7就是每天工作24个小时,每周工作7天(就是连续不断的进行工作)。普通PC硬盘并不适合长时间连续读写,如果要求普通PC硬盘长时间连续读写就会损伤硬盘,使硬盘出现异常声音、读写错误、工作中止等多种问题并由此导致硬盘最终损坏。 数字硬盘录像机是常年不间断运行的,因此要求硬盘必须可以长时间连续工作,能满足这个要求的就是DVR专用硬盘。 2启动差别 所有的35寸硬盘都包含电机系统,因此硬盘加电启动的时候与电机加电启动的情况相类似:就是在加电的初始时间会出现较大的启动电流以完成硬盘启动。如果加电启动的时候硬盘外部供电系统不能保障足够的电流支持,则硬盘会启动失败,导致硬盘不可用。并且如果多次出现这种情况,容易造成硬盘的损坏。 由于硬盘电机的供电是由外部电源系统直流12V满足的,因此在评价硬盘启动电流的时候都以直流12V的电流为标准。普通PC硬盘启动电流一般在28A~32A之间。DVR专用硬盘的启动电流最高为20A。 数字硬盘录像机经常采用多硬盘进行数据存储,以安装8片硬盘为例:普通PC硬盘启动电流28×8=224A,最低的功耗为224A×12V=2688W。DVR专用硬盘启动电流20A×8=16A,最高的功耗为16A×12V=192W。可以看出,在相同硬盘数量的情况下DVR专用硬盘对外部电源系统的要求更低(在同样输出功率的外部电源支持下,可以安装的DVR专用硬盘的数量会更多)。 注:在上例情况中,若外部电源系统供电只能保障250W,则采用普通PC硬盘的时候会出现某些硬盘可以识别,某些硬盘不可以识别,并且没有规律性,而专用硬盘可以轻松识别。 3运行功耗及散热差别 这里运行功耗是指硬盘在正常读写状态时的功耗。 普通PC硬盘的运行功耗一般为145瓦左右,DVR专用硬盘的运行功耗一般为8瓦左右。可以看出,DVR专用硬盘运行功耗仅相当于普通PC硬盘功耗55%,低的运行功耗不仅对电源系统有重要意义,而且对数字硬盘录像机系统的散热也有重要的意义(运行功耗中大概75%会转变为热能)。 在数字硬盘录像机中,如果安装8片硬盘,那普通PC硬盘的运行总功耗为145W×8=116W,DVR专用硬盘的运行总功耗8W×8=64W。如果采用普通PC硬盘,可以想像在数字硬盘录像机这么小的空间内有这么高的发热源,对系统的散热要求是很高的,为了保障硬盘有一个合理的环境温度(0~60℃),必须对硬盘系统进行有效的散热。而采用DVR专用硬盘,发热情况就好得多----降低了系统散热要求使系统对环境的适应性更强。 4 传输的差别 DVR专用硬盘除了采用传统PC硬盘的传输模式,还引入了一个更新的传输模式----不间断传输模式,该传输模式最大为65MB/S。通过引入不间断传输模式,使硬盘对流媒体的支持更加可靠,充分保障数字硬盘录像机在录入的同时进行回放的流畅性和稳定性,这是其它硬盘所不具备的特性。

误区:

在网上查询它们的区别,看到不少相关的讨论,但经常得到这样一些结果:“监控级硬盘为7×24设计,拥有更低的启动电流、更低的功耗、更好的稳定性和寿命,故障率低于桌面硬盘”,因此有不少网友选择它组建自己的数据仓库。 乍看之下,监控级硬盘比桌面硬盘更可靠,而比桌面硬盘略高的价格似乎也佐证了这一点,但事实果真如此吗?经过不懈的查询,终于搜到一篇题为“Western Digital AV-GP 2TB Hard Disk Drive Review”的英文文档。其中分为两个部分,第一部分陈述了西数监控盘如何为影音数据做优化,在此略过,本文关注的重点在第二部分:“Not For Desktop Use”(非桌面用途)。现将该部分内容翻译如下(水平有限,难免错漏): “与桌面硬盘不同,为了能按时完成命令,AV-GP被设计为跳过错误纠正。这能防止在为损坏数据纠错时造成时间消耗从而导致影音流的中断。这对于CE型应用比如从电缆或闭路电视中录制影音流是非常好的。少量的像素点颜色失真要比少量的丢帧不显眼得多。 “然而,没人能接受在桌面或服务器环境中出现损坏数据。当我们拷贝一篇文档到硬盘中时,我们希望它的内容与原件是100%相同的。如果一个比特被认定为错的,我们希望硬盘在写入之前就修正它。但如果为了确保能“按时”完成写操作,硬盘不会执行修正过程,而只是简单地忽略了错误并写入了损坏的比特位。 “由于标价相对桌面版要稍高,某些没有道德的或误导你的商人会把这种为影音优化的硬盘作为桌面版硬盘的“高级”版向你推销。这完全是胡扯。这些影音优化硬盘与它们的桌面版兄弟并无谁高谁低。它们是为非常专业的应用设计的,并不适合在桌面和服务器环境中使用。” 看完以上解释,想必各位读者都有自己的判断了,是的,所谓监控级硬盘,具备出色的连续读取性能,能同时提供十几条音视频流,但这是以牺牲数据纠错为代价的,所以仅适用于DVR、PVR、CCTV等特定领域,正如上述文档中还提到的:“永远不要把这类硬盘用于桌面或服务器中”!因为文件内容很可能在存储时已经损坏了,对于影音文件,影响尚不大,但对于重要的文档,一旦出错,损失就惨重了,不正确的数据对于数据仓库来说是致命的,况且这种错误是硬盘本身带来的,用这种监控盘即使组成RAID也无法避免错误数据的产生! 鉴于如今有很多用户难以区分绿盘之间的差别,甚至迷信监控盘的“高稳定性”,希望能以此文,宣传一下相关知识,让读者真正地了解监控盘。

Linux服务器性能监测是很重要的工作,服务器运行应该提供最有效的系统性能。当服务器系统性能突然低于平均应有的情况,问题可能来自在执行的进程、内存的使用率、磁盘的性能、网络流量和CPU 的压力。在预算短缺的今天,理解如何优化系统性能比以往任何时候都重要。 要实现它的前提是,你必须充分了解自己的计算机和网络,从而找到真正的瓶颈所在。本文提供一些基础的工具来辨别和处理一些性能问题。使用的Linux 发行版本是Red Hat Enterprise Linux 4,工作过程是:首先查看整个系统的状态,然后是检查特定的子系统。 Linux服务器进行性能监控有几种方法,每种方法都各有其优缺点。 使用SNMP等标准工具 标准及非标准工具能执行一个或多个收集、合并及传输阶段,如rstatd或SNMP工具,然而标准的rstat后台程序提供的信息是有限的,速度慢而且效率低。 内核模块 几个系统监控工程利用内核模块来存取监控数据。一般情况下,这是很有效的收集系统数据的方法。然而这种方法存在的问题是,当主内核源内有其它改变时,必须保持代码一致性。一个内核模块可能与用户想使用的其它内核模块相冲突。此外,在使用监控系统之前,用户必须获得或申请模块。 /proc虚拟文件系统 /proc虚拟文件系统是一个较快的、高效率执行系统监控的方法。使用/proc的主要缺点是必须保持代码分析与/proc 文件格式改变的同步。事实表明,Linux内核的改变比/proc 文件格式的改变要更频繁,所以,用/proc虚拟文件系统比用内核模块存在的问题要少。本文介绍的方法即基于/proc虚拟文件系统。 一、 /proc文件系统特点 Linux 系统向管理员提供了非常好的方法,使他们可以在系统运行时更改内核,而不需要重新引导内核系统。这是通过 /proc 虚拟文件系统实现的。/proc 文件虚拟系统是一种内核和内核模块用来向进程 (process) 发送信息的机制 (所以叫做 /proc)。这个伪文件系统让你可以和内核内部数据结构进行交互,获取 有关进程的有用信息,在运行中 (on the fly) 改变设置 (通过改变内核参数)。 与其他文件系统不同,/proc 存在于内存之中而不是硬盘上。不用重新启动而去看 CMOS ,就可以知道系统信息。这就是 /proc 的妙处之一。 小提示: 每个Linux系统根据软硬件不同/proc 虚拟文件系统的内容也有些差异。/proc 虚拟文件系统有三个很重要的目录:net,scsi和sys。Sys目录是可写的,可以通过它来访问或修改内核的参数,而net和scsi则依赖于内核配置。

买数字硬盘录相主机.最好是自己去配/

凭我多年做监控的经验(小弟一直做的是数字硬盘录相)监控主机的配置一般如下:

华硕865PE主板

CPU随便用,(主要是看你用的是什么视频采集卡了,如果是软压卡,CPU就买好一点的.P2.26的就够了,如果是硬压卡,就可以用C2.0的)

内存随便.一般我们都用256M

硬盘越大越好.看你有多少钱了.越大硬盘录的时间越长.一般我们给客户都配320G的,两块160的

显卡一定要配好点的/最少得64M,一般都是用128M的.如果显卡有S端口还可以接电视

机箱其实用普通机箱就行.不用太大.

电源用好的,400W.

软件的话呢.你自己去电子城买,一般买海康威视的卡吧.质量不错.商家会给你软件的.

最好先去电子城里了解好各个配件的报价,如果申请工程,人家的利润就有50%~70%之多/

现在所有的企业都基本需要用到服务器,那么服务器的所有信息都应该得到监控,以便管理然而一台服务器每天需要监控的东西其实很多,比如常见的有以下内容:

一、网站故障监控,如果你所运行的项目出现了故障服务器要自动以短信或者邮件提醒的方式通知你,如果没有这个监控,或许等你发现时损失已经很大。

二、服务器性能监控,其实就对服务器(计算机)CPU、内存、硬盘、负载等硬件使用多少的一个监控,如果出现了服务器硬件使用消耗过大那么就要考虑是否升级服务器配置了。

三、网站安全监控,如果网站遭到黑客的攻击这时服务器如果有这项监控那么就会立刻通知你,这时采取相应的措施反攻击,以免自己的网站受到攻击。网站安全可以说是非常重要的,一旦黑客攻击进来你的网站数据丢失,损失就很大了。

四、用户访问速度监控,监控所有访问本服务器的用户的访问速度。

五、备份数据监控,查看网站的备份是否成功,哪些网站备份过、哪些没有。网站备份可以让你的数据有个保存,出现了突发问题可以立马恢复到上一个版本。所以说网站的备份大家也要注重。

六、端口监控,服务器中端口检测也尤为重要,监控服务器开启了哪些端口哪些端口被占用,如果某些端口被一些不知名的IP或者程序占用那么就要考虑是不是服务器中了病毒,被黑客所利用。

以上只是个人观点,不足之处还请大家补充。

一、云计算和传统IDC在服务类型上的区别

常用的传统IDC服务包括实体服务器托管和租用两类。前者是由用户自行购买硬件发往机房托管,期间设备的监控和管理工作均由用户单方独立完成,IDC数据中心提供IP接入、带宽接入、电力供应和网络维护等,后者是由IDC数据中心租用实体设备给客户使用,同时负责环境的稳定,用户无需购买硬件设备。而云计算提供的服务是从基础设施(Iaas)到业务基础平台(PaaS)再到应用层(SaaS)的连续的整体的全套服务。IDC数据中心将规模化的硬件服务器整合虚拟到云端,为用户提供的是服务能力和IT效能。用户无需担心任何硬件设备的性能限制问题,例如小鸟云的可弹性扩展资源用量来获得具备高扩展性和高可用的计算能力。

二、云计算和传统IDC在资源集约化速度和规模上的区别

传统IDC,只是在硬件服务器的基础进行有限的整合,例如多台虚拟机共享一台实体服务器性能。但这种简单的集约化受限于单台实体服务器的资源规模,远远不如云计算那样跨实体服务器,甚至跨数据中心的大规模有效整合。更重要的是,传统IDC提供的资源难以承受短时间内的快速再分配。而像小鸟云服务器那样,使用云计算可以实现横向/纵向的弹性资源扩展和快速调度。

三、云计算和传统IDC在资源分配时滞上的区别

四、云计算和传统IDC在平台运行效率上的区别

更加灵活的资源应用方式、更高的技术提升,使云服务商拥有集合优势创新资源利用方式,促进整个平台运作效率提升。例如,根据不同用户需求优化服务器设计和服务器软件更新、网络专线接入等。并且,和传统IDC服务不同,云计算使用户从硬件设备的管理和运维工作中解脱出来,专注内部业务的开发和创新,由云服务商负责云平台本身的稳定。这种责任分担模式使整个平台的运行效率获得提升。

  安防监控

  安防监控系统是应用光纤、同轴电缆或微波在其闭合的环路内传输视频信号,并从摄像到图像显示和记录构成独立完整的系统。它能实时、形象、真实地反映被监控对象,不但极大地延长了人眼的观察距离,而且扩大了人眼的机能,它可以在恶劣的环境下代替人工进行长时间监视,让人能够看到被监视现场的实际发生的一切情况,并通过录像机记录下来。同时报警系统设备对非法入侵进行报警,产生的报警型号输入报警主机,报警主机触发监控系统录像并记录。

  安防监控系统的构成:

  前端部分: 

  前端完成模拟视频的拍摄,探测器报警信号的产生,云台、防护罩的控制,报警输出等功能。主要包括:摄像头、电动变焦镜头、室外红外对射探测器、双监探测器、温湿度传感器、云台、防护罩、解码器、BSV液晶拼接屏、数字扫描器、警灯、警笛等设备(设备使用情况根据用户的实际需求配置)。摄像头通过内置CCD及辅助电路将现场情况拍摄成为模拟视频电信号,经同轴电缆传输。电动变焦镜头将拍摄场景拉近、推远,并实现光圈、调焦等光学调整。温、湿度传感器可探测环境内温度、湿度,从而保证内部良好的物理环境。云台、防护罩给摄像机和镜头提供了适宜的工作环境,并可实现拍摄角度的水平和垂直调整。解码器是云台、镜头控制的核心设备,通过它可实现使用微机接口经过软件控制镜头、云台。 

  传输部分: 

  这里介绍的传输部分主要由同轴电缆组成。传输部分要求在前端摄像机摄录的图像进行实时传输,同时要求传输具有损耗小,可靠的传输质量,图像在录像控制中心能够清晰还原显示。 

  控制部分:该部分是安防监控系统的核心,它完成模拟视频监视信号的数字采集、MPEG-1压缩、监控数据记录和检索、硬盘录像等功能。它的核心单元是采集、压缩单元,它的通道可靠性、运算处理能力、录像检索的便利性直接影响到整个系统的性能。控制部分是实现报警和录像记录进行联动的关键部分。 

  电视墙显示部分:该部分完成在系统显示器或监视器屏幕上的实时监视信号显示和录像内容的回放及检索。系统支持多画面回放,所有通道同时录像,系统报警屏幕、声音提示等功能。它既兼容了传统电视监视墙一览无余的监控功能,又大大降低了值守人员的工作强度且提高了安全防卫的可靠性。终端显示部分实际上还完成了另外一项重要工作——控制。这种控制包括摄像机云台、镜头控制,报警控制,报警通知,自动、手动设防,防盗照明控制等功能,用户的工作只需要在系统桌面点击鼠标操作即可。 

  防盗报警部分: 在重要出入口、楼梯口安装主动式红外探头,进行布防,在监控中心值班室(监控室)安装报警主机,一旦某处有人越入,探头即自动感应,触发报警,主机显示报警部位,同时联动相应的探照灯和摄像机,并在主机上自动切换成报警摄像画面,报警中心监控用计算机弹出电子地图并作报警记录,提示值班人员处理,大大加强了保安力度。报警防范系统是利用主动红外移动探测器将重要通道控制起来,并连接到管理中心的报警中心,当在非工作时间内有人员从非正常入口进入时,探测器会立即将报警信号发送到管理中心,同时启动联动装置和设备,对入侵者进行警告,可以进行连续摄像及录像。在建筑的外围安装电子围栏,电子围栏是目前最先进的周界防盗报警系统,它由高压电子脉冲主机和前端探测围栏组成。高压电子脉冲主机是产生和接收高压脉冲信号,并在前端探测围栏处于触网、短路、断路状态时能产生报警信号,并把入侵信号发送到安全报警中心;前端探测围栏由杆及金属导线等构件组成的有形周界。电子围栏是一种主动入侵防越围栏,对入侵企图做出反击,击退入侵者,延迟入侵时间,并且不威胁人的性命,并把入侵信号发送到安全部门监控设备上,以保证管理人员能及时了解报警区域的情况,快速的作出处理。 

  系统供电: 

  电源的供给对于保证整个闭路监控报警系统的正常运转起到至关重要的作用,一旦电源受破坏即会导致整个系统处于瘫痪状态。系统的供电可以采用集中供电和分散供电两部分,用户可以根据实际的需要进行选择。 

  以上仅是一个的典型安防监控系统介绍,在实际应用中会有不同种类型的方案出现,安防监控系统方案一般会根据用户的不同要求而量身订制。

  安防监控系统的特点

  一、安防监控系统:以平台为核心,以网络为纽带。 

  现在的安防监控系统的规模及规划,让人有点生畏,或者说让使用者有点生畏。数量众多的摄像头采集的监控图像、编解码设备、服务器如何配置及管理靠人力已经不能解决大规模监控系统出现的管理问题了,所以打造一个管理平台的需求就显得非常迫切。一个好的管理平台可以将所有的摄像头、报警点、编解码、后台服务器纳入管理,从而使得整套安防监控系统、安全防护系统能够顺畅运行。以平台为核心管理整个监控系统有一个前提,需要足够的带宽来连接这些设备和服务器,没有网络一切就是空谈。 

  二、网络监控:多家不同的设备,实现互联互通。 

  由于安防监控系统的历史状况(独立的小规模应用为主),造成了安防监控设备的生产厂家非常众多,而且各个厂家都有自己的一套编解码和网络传输的做法。但是也是因为这个现状的存在,所以要求大型监控系统平台能够接入多家厂商的设备。一者保护用户原有的投资;二者用户在新系统建设时减少投入提供解决办法。在建的大型监控系统都在这个方面做出了大量的努力,都接入了国内主流厂商的视频编解码设备,并且在用户端基本实现了对设备的透明化。

  监控系统常见的故障现象及其解决方法

  在一个监控系统进入调试阶段、试运行阶段以及交付使用后,有可能出现这样那样的故障现象,如:不能正常运行、系统达不到设计要求的技术指标、整体性能和质量不理想,亦即一些“软毛病”。这些问题对于一个监控工程项目来说,特别是对于一个复杂的、大型的监控工程项目来说,是在所难免的。

  1电源不正确引发的设备故障

  电源不正确大致有如下几种可能:供电线路或供电电压不正确、功率不够(或某一路供电线路的线径不够,降压过大等)、供电系统的传输线路出现短路、断路、瞬间过压等。特别是因供电错误或瞬间过压导致设备损坏的情况时有发生。因此,在系统调试中,供电之前,一定要认真严格地进行核对与检查,绝不应掉以轻心。

  2接线不好引发的故障

   由于某些设备(如带三可变镜头的摄像机及云台)的连结有很多条,若处理不好,特别是与设备相接的线路处理不好,就会出现断路、短路、线间绝缘不良、误接线等导致设备的损坏、性能下降的问题。在这种情况下,应根据故障现象冷静地进行分析,判断在若干条线路上是由于哪些线路的连接有问题才产生那种故障现象。这样就会把出现问题的范围缩小了。特别值得指出的是,带云台的摄像机由于全方位的运动,时间长了,导致连线的脱落、挣断是常见的。因此,要特别注意这种情况的设备与各种线路的连接应符合长时间运转的要求。

  3设备或部件本身的质量问题

  从理论上说,各种设备和部件都有可能发生质量问题。但从经验上看,纯属产品本身的质量问题,多发生在解码器、电动云台、传输部件等设备上。值得指出的是,某些设备从整体上讲质量上可能没有出现不能使用的问题,但从某些技术指标上却达不到产品说明书上给出的指标。因此必须对所选的产品进行必要的抽样检测。如确属产品质量问题,最好的办法是更换该产品,而不应自行拆卸修理。 

  此之外,最常见的是由于对设备调整不当产生的问题。比如摄像机后截距的调整是非常细致和精确的工作,如不认真调整,就会出现聚焦不好或在三可变镜头的各种操作时发生散焦等问题。另外,摄像机上一些开关和调整旋钮的位置是否正确、是否符合系统的技术要求、解码器编码开关或其它可调部位设置的正确与否都会直接影响设备本身的正常使用或影响整个系统的正常性能。

  4连接不正确产出的故障

  设备(或部件)与设备(或部件)之间的连接不正确产生的问题大致会发生在以下几个方面:⑴阻抗不匹配。 

  ⑵通信接口或通信方式不对应。

  这种情况多半发生在控制主机与解码器或控制键盘等有通信控制关系的设备之间,也就是说,选用的控制主机与解码器或控制键盘等不是一个厂家的产品所造成的。所以,对于主机、解码器、控制键盘等应选用同一厂家的产品。

  ⑶驱动能力不够或超出规定的设备连接数量。比如,某些画面分割器带有报警输入接口在其产品说明书上给出了与报警探头、长延时录像机等连接的系统主机连成系统,如果再将报警探头并联接至画面分割器的报警输入端,就会出现探头的报警信号既要驱动报警主机,又要驱动画面分割器的情况。在这种情况下,往往会出现驱动能力不足的问题。表现出的现象是,画面分割器虽然能报警,但出于输入的报警信号弱而工作不稳定,从而导致对应发生报警信号的那一路摄像机的图像画面在监视器上虽然瞬间转换为全屏幕画面却又丢掉(保持不住),而使监视器上的图像仍为没报警之前的多画面。

  解决类似上述问题的方法之

  一是通过专用的报警接口箱将报警探头的信号与画面分割器或视频切换主机相对应连接

  二是在没有报警接口箱的情况时,可自行设计加工信号扩展设备或驱动设备。

,仅完成安装系统、应用程序并上架后便拍拍屁股离开,远不能发挥服务器性能。服务器需要通过周期性的监控来确保硬件投资得到了预期回报--并对潜在问题提出告警,比如资源不足或硬件故障。性能监控工具可以提供大量的可用信息,但需要确保工具被正确安装与运行。本文将介绍可以帮助管理员们从系统性能监控中获得最大利益的技巧。

  实现精确的性能监控

  如果采集的信息存在错误,监控便毫无用处,所以确保数据的准确性是你得采取的第一步。准确性包括许多方面,如互通性、采样窗口、工具架构、虚拟化感知与校准。

  互通性。在此讨论中,互通性是性能监控工具的基本功能,能够从数据中心内各种硬件与部件中访问与读取数据源。在部署了同一厂商产品线设备的同质环境内,利用集成在硬件中的内置挂钩,监控工具可以发挥极大优势。通过这些挂钩,工具可以抓取设备的详细运行信息。

  在异质环境下,监控则成为了另外一种挑战,因为工具与硬件可能无法很好匹配。产商提供的工具可能可以提供一些硬件部件的特殊信息,而其他工具可能无法保障一致性。第三方性能监控工具可能无法检测每个监控器或硬件的细微差别,它们更依赖于操作系统级的数据,而这些数据通常缺乏足够的颗粒度。在某些情况下,监控数据可能丢失或失真,从而降低系统性能监控的可用性。

  工具与硬件之前的数据差异需要全面测试。例如,在购买工具之前,先测试并验证兼容性,在经过较长时间的可用性验证项目后,再开始将工具由测试环境部署至生产环境中。但问题同样从开始购买延伸至未来产品升级或技术刷新周期。当你更换硬件或升级工具,你需要测试监控工具的互通性来确保性能监控工具依旧可以正常工作并提供准确数据。

  采样。准确性同样依赖于收集数据用的采样窗口。当负载与运行参数可能一直处于波动状态时,数据准确性将十分重要。理想情况下,性能监控工具可以捕捉整台服务器的运行周期。技巧在于决定运行周期是怎样的。这依赖于每个负载与宿主主机是如何被使用的。例如,每台服务器的内存性能可能需要极快的采样率,而采样窗口需要跨越好几分钟。与此相反,观察某个合作HR系统的CPU使用情况可能需要已较低的频率捕捉数值,但采样窗口周期需要长达30天甚至更长。如何正确采样并没有标准答案,不同属性的操作系统同样需要通过不同的比率与窗口灵活定义。

  工具架构。性能监控工具通常需要在受监控系统上安装代理或额外驱动(即使是虚拟机)。代理具有优势也有不足。首先,它们十分有用,因为代理可以收集并传输许多重要信息,比无代理的监控工具提供更多监控参数。尽管如此,代理通常被作为软件客户端,将所有数据报告给中央服务器,中央服务器将收集与处理这些数据。所以每个代理都需要占用一定的计算资源,这可能在一定程度上影响整台服务器的负载性能。

  我所在环境下所有计算机拥有两个代理, Chris Steffen,Kroll Factual Data的首席技术架构师说。一个应用程序代理监控我们所有应用程序的健康状况,而且我们还有System Center [Virtual Machine Manager]代理安装在所有虚拟机宿主上。

  这些年来,关于代理的负面影响一直在降低,但它们所产生的影响一直在被评估,尤其在执行关键任务或对性能要求十分苛刻的负载上。不仅如此,Steffen同样表示,新兴的监控工具可以提供更多功能,包括自动化安装,重装或维护运行环境中的代理。

  虚拟化感知。

虚拟化软件把应用负载从硬件中抽象化。当传统性能监控工具试图在虚拟化环境中报告,抽象层常常发生错误结果,因为老工具是同直接监控硬件,而不是通过控制计算资源的hypervisor。考虑到虚拟化技术的人气和重要性,管理员应该选择能监控虚拟化的监控工具。这样能让性能监控同时管到物理目标和虚拟目标,管理员可以才可以收集到精确的数据。

  管理员们有时候还需要采集虚拟机与承载虚拟机的宿主服务器指标,Kleyman说。这种情况下,需要在虚拟化与物理层级别进行性能监控以确保最佳负载性能并保障用户体验。

  传感器校准。需要忽视传感器本身的重要性。来自网络交换机或服务器的数字信信号常都是十分准确的。但是某些传感器,例如温度,湿度,空气流或其他环境类型的传感器通常是通过模拟信号传输,可能需要经常校对并定期更换电池来保证其长期稳定的工作。

  最大化性能监控工具价值

  如果没有正确使用,工具是无法产生价值的。在许许多多的案例中,性能监控工具已经被部署,但是没有清晰的规划来使用与分析所收集到的海量数据。工具则变成了管理员们用来抽查或不定期故障处理的简单工具;这是一种投资浪费。

  性能监控工具报告同样可以作为能力规划的基础参考,或协助完成技术刷新项目。性能指标可以帮助展示RIO[投资回报率],Kleyman说。通过了解旧系统性能,并比对新款服务器性能,我们可以决定是否将钱投资在新设备上已提升计算性能并获得更长远的利益。

  但Steffen同样建议用户多留个心眼,秉着信任,但要核查的态度来对待性能监控工具,有可能某些服务器监控工具已经被验证,与其他工具相比可以获得十分准确的数值,但如果用来监控网络设备则可能出现一些异常。好的业务决策需要有优质的数据进行支撑,而且若工具无法提供准确、可验证的结果,那样将很难给业务决策提供有力支持。

lg=t

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 服务器用什么监控软件好?

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情