通过哪些方式可以实现服务器硬件监控

通过哪些方式可以实现服务器硬件监控,第1张

目前通过2种方式就能实现服务器硬件监控,

即:1、使用服务器端check_nrpe调用被监控端的check_openmanage就能来进行实现,大家的话只需要在被监控端安装omsa和check_openmanage就好了;

2、也能通过nagios服务器端直接通过check_openmanage来实现服务器硬件监控,使用这种方式的话就是需要在nagios服务端进行安装perl-net-snmp,并在被监控端安装omsa,snmp服务;不过需要提醒大家的是,一定要先能安装snmp服务再来安装omsa,也只有这样的话omsa才能自动进行更改snmp的相关配置文件以达到实现服务器硬件监控目的。

1 Performance Co-Pilot

Performance Co-Pilot,简称 PCP,是一个系统性能和分析框架。它从多个主机整理数据并实时的分析,帮你识别不正常的表现模式。它也提供 API 让你设计自己的监控和报告解决方案。

2 Anturis

Anturis 是一个监控你的服务器、网站、IT基础设置的基于云计算的SaaS平台。它有一个全面的监控解决方案列表,非常值得一看。

3 SeaLion

SeaLion 是一个基于云计算的Linux服务器监控工具。它可以用一个面板简单的监控所有的服务器并且诊断问题。它只需要几分钟就可以安装好,具有及时提醒功能,当发生问题时你可以及时的收到提醒,还具有日常数据汇总等功能。

4 Icinga

Icinga 是一个免费开源的服务器监控工具,可以检测服务器资源的可用性。它可以记录服务器问题并且通知你。

5 Munin

Munin 是一个网路和系统监控工具,可以帮你分析服务器资源趋势。它是一个即插即用的解决方案。默认的安装方式提供了很多的报告。

准备远程服务器

在 Debain/Ubuntu 中:

# cd /usr/lib/nagios/plugins/# wget https://rawgithubusercontentcom/justintime/nagios-plugins/master/check_mem/check_mempl# mv check_mempl check_mem# chmod +x check_mem

在 RHEL/CentOS 中:

# cd /usr/lib64/nagios/plugins/ (or /usr/lib/nagios/plugins/ for 32-bit)# wget https://rawgithubusercontentcom/justintime/nagios-plugins/master/check_mem/check_mempl# mv check_mempl check_mem# chmod +x check_mem

你可以通过手工在本地运行下面的命令来检查脚本的输出是否正常。当使用NRPE时,这条命令应该会检测空闲的内存,当可用内存小于20%时会发出警告,并且在可用内存小于10%时会生成一个严重警告。

# /check_mem -f -w 20 -c 10

OK - 340% (2735744 kB) free|TOTAL=8035340KB;;;; USED=5299596KB;6428272;7231806;; FREE=2735744KB;;;; CACHES=2703504KB;;;;

如果你看到像上面那样的输出,那就意味这命令正常工作着。

现在脚本已经准备好了,我们要定义NRPE检查内存使用率的命令了。如上所述,命令会检查可用内存,在可用率小于20%时发出警报,小于10%时发出严重警告。

# vim /etc/nagios/nrpecfg

对于 Debian/Ubuntu:

command[check_mem]=/usr/lib/nagios/plugins/check_mem -f -w 20 -c 10

对于 RHEL/CentOS 32 bit:

command[check_mem]=/usr/lib/nagios/plugins/check_mem -f -w 20 -c 10

对于 RHEL/CentOS 64 bit:

command[check_mem]=/usr/lib64/nagios/plugins/check_mem -f -w 20 -c 10

准备 Nagios 服务器

在Nagios服务器中,我们为NRPE定义了一条自定义命令。该命令可存储在Nagios内的任何目录中。为了让本教程简单,我们会将命令定义放在/etc/nagios目录中。

对于 Debian/Ubuntu:

# vim /etc/nagios3/confd/nrpe_commandcfg

define command{ command_name check_nrpe command_line /usr/lib/nagios/plugins/check_nrpe -H '$HOSTADDRESS$' -c '$ARG1$'}

对于 RHEL/CentOS 32 bit:

# vim /etc/nagios/objects/nrpe_commandcfg

define command{ command_name check_nrpe command_line /usr/lib/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ }

对于 RHEL/CentOS 64 bit:

# vim /etc/nagios/objects/nrpe_commandcfg

define command{ command_name check_nrpe command_line /usr/lib64/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ }

现在我们定义Nagios的服务检查

在 Debian/Ubuntu 上:

# vim /etc/nagios3/confd/nrpe_service_checkcfg

define service{ use local-service host_name remote-server service_description Check RAM check_command check_nrpe!check_mem}

在 RHEL/CentOS 上:

# vim /etc/nagios/objects/nrpe_service_checkcfg

define service{ use local-service host_name remote-server service_description Check RAM check_command check_nrpe!check_mem}

最后我们重启Nagios服务

在 Debian/Ubuntu 上:

# service nagios3 restart

在 RHEL/CentOS 6 上:

# service nagios restart

在 RHEL/CentOS 7 上:

# systemctl restart nagiosservice

故障排除

Nagios应该开始在使用NRPE的远程服务器上检查内存使用率了。如果你有任何问题,你可以检查下面这些情况。

确保NRPE的端口在远程主机上是总是允许的。默认NRPE的端口是TCP 5666。

你可以尝试通过执行check_nrpe 命令: /usr/lib/nagios/plugins/check_nrpe -H remote-server 手工检查NRPE操作。

你同样可以尝试运行check_mem 命令:/usr/lib/nagios/plugins/check_nrpe -H remote-server –c check_mem

在远程服务器上,在/etc/nagios/nrpecfg中设置debug=1。重启NRPE服务并检查这些日志文件,/var/log

/messages (RHEL/CentOS)或者/var/log/syslog

(Debain/Ubuntu)。如果有任何的配置或者权限错误,日志中应该包含了相关的信息。如果日志中没有反映出什么,很有可能是由于请求在某些端口

上有过滤而没有到达远程服务器上。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 通过哪些方式可以实现服务器硬件监控

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情