如何运营服务器
摘要:服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。服务器上线以后,基本是不间断,724小时运行,否则会影响业务及用户体验。那么如何运营服务器呢?下面来了解服务器运营注意事项吧!一、服务器怎么运营?
检查磁盘使用率,当磁盘使用率超过80%,可以清除一些日志文件;
检查内存使用情况,当内存使用过多时,需要检查是哪个进程占用,是否合理;
检查CPU使用情况,负载大小;当CPU使用过多,负载过大时,需要检查是哪个进程占用,是否合理。
检查服务器网卡接口的数据统计和每秒收发包的个数和流量。
还需要结合服务器的业务,当然,这些可用使用监控软件自动检查,故障报警等,实时掌握服务器的运行情况。
二、服务器运营注意事项
1、提前检查
服务器和网站漏洞检测,对Web漏洞、弱口令、潜在的恶意行为、违法信息等进行定期扫描。
代码的定期检查,安全检查,漏洞检查。
服务器安全加固,安全基线设置,安全基线检查。
数据库执行的命令,添加字段、加索引等,必须是经过测试检查的命令,才能在正式环境运行。
2、数据备份
服务器数据备份,包括网站程序文件备份,数据库文件备份、配置文件备份,如有资源最好每小时备份和异地备份。
建立五重备份机制:常规备份、自动同步、LVM快照、Azure备份、S3备份。
定期检查备份文件是否可用,避免出故障后,备份数据不可用。
重要数据多重加密算法加密处理。
程序文件版本控制,测试,发布,故障回滚。
3、安全监控
nagios监控服务器常规状态CPU负载、内存、磁盘、流量,超过阈值告警。
zabbix或cacti监控服务器常规状态CPU负载、内存、磁盘、流量等状态,可以显示历史曲线,方便排查问题。
监控服务器SSH登录记录、iptables状态、进程状态,有异常记录告警。
监控网站WEB日志(包括nginx日志php日志等),可以采用EKL来收集管理,有异常日志告警。
运维人员都要接收告警邮件和短信,至少所负责的业务告警邮件和短信必须接收,运维经理接收重要业务告警邮件和短信。(除非是专职运维开发)
除服务器内部监控外,最好使用第三方监控,从外部监控业务是否正常(监控URL、端口等),比如:监控宝。
4、故障避免预防
网站WEB增加WAF,避免XSS跨站脚本、SQL注入、网页挂马等漏洞威胁。
程序代码连接数据库、memcache、redis等,可以使用域名(域名HOSTS指定IP),当出问题,有备用的服务器,就可以通过修改DNS或者HOSTS,恢复服务。
建立应急预案机制,定期演练事故场景,估算修复时间。
部署蜜罐系统,防范企业和服务器内网APT攻击。
建立双活集群,包括业务服务的高可用,避免业务服务单点。
服务器集群采用跳板机或堡垒机登录,避免服务器集群每台服务器可以远程连接管理。
操作重要业务升级、迁移、扩容之前,列一下操作步骤,越详细越好,实际操作按步骤操作,操作完做好记录。
5、事中操作
网站WEB增加WAF,发现XSS、SQL注入、网页挂马等攻击,会自动拦截,并记录日志。
检查服务器数据备份是否可用。
在处理需求和故障时,执行风险命令(比如rm、restart、reboot等)需再三确认,执行命令前,检查所在服务器,所在服务器路径,再执行!
不要疲劳驾驶,喝酒不上机,上机不喝酒,尤其别动数据库,避免在不清醒的状态下,在服务器上执行了错误命令,导致数据丢失或业务故障。
在处理事故时,一定要考虑处理措施是否会引发连锁故障,重要操作三思而行。
6、事后检查分析
实现网络安全可视化管理,可以看到每天有那些异常IP和异常URL请求,服务器集群开放端口列表等。能对全网进行安全策略集中管理。统一日志收集和分析。
备份及篡改恢复功能,程序文件、、数据文件、配置文件的备份,故障回滚机制。
对攻击日志进行深度分析,展现攻击路径、攻击源,协助管理员溯源。
践行DevOps的无指责文化,尤其是在做事故分析时。事故分析重在定位原因,制定改进措施。
配置LoadRunner监控Apache,LoadRunner监控Apache服务器是调用的Apache自身的模块进行监控的,所以需要配置Apache和LoadRunner。要实现对Apache服务器上的资源使用情况进行监控,需要按如下方法进行配置,具体配置如下。
配置Apache部分。
一般要修改的内容在Httpdconf文件中已经存在,如果不存在请自行添加相应内容。
X:\XXXXXX\Apache22\bin
(1)修改Apache中Httpdconf文件,
(2)添加ExtendedStatus,设置ExtendedStatus On。
添加如下代码:
<Location /server-status>
SetHandler server-status
Order deny,allow
# Deny from all
Allow from localhost
</Location>
ExtendedStatus On
浏览器打开以下链接(已添加ExtendedStatus On会显示详细信息,没添加只显示基本信息):
localhost/server-status ---------------手工F5刷新才会更新信息
localhost/server-statusauto&refresh=3 --------auto自动刷新,refresh设置3秒更新一次
(3)取消注释LoadModule status_module modules/mod_statusso,加载该模块。
(4)重新启动Apache。
配置LoadRunner部分。
(1)在图树中双击Apache,然后在屏幕下方区域单击鼠标右键,在弹出的菜单中选择"Add Measurements…"项,如图7-27所示。
(2)单击"Add"输入要监控计算机的名称或者IP地址,并选择该计算机运行的平台,如图7-28所示。
(3)在图7-28所示"Apache"对话框的"Resource Measurements…"部分中,单击"Add"项,选择要监视的度量,弹出"Apache-Add Measurements"对话框,选择要度量的内容,如图7-29所示。
(4)在"Server Properties"部分,输入端口号和不带服务器名的URL,单击OK按钮。默认的URL是/server-statusauto,端口号为80。
(5)关闭相应窗口以后,就可以实现已选择度量内容的监控。
你好楼主;
1、Ganglia是伯克利开发的一个集群监控软件。可以监视和显示集群中的节点的各种状态信息,比如如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,
2、Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具。
3、Zenoss Core是开源企业级IT管理软件-是智能监控软件,他允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core同时也是开源的网络与系统管理软件。
4、Argus 是一个网络连接监控器,可以利用它来定制监控网络中符合某种条件的计算机,例如网络空闲、断开等。
5、 Monit是一款功能非常丰富的进程、文件、目录和设备的监测软件,用于Unix平台。它可以自动修复那些已经停止运作的程序,特使适合处理那些由于多种原因导致的软件错误。
6、Nagios是一个监视系统运行状态和网络信息的监视系统。Nagios能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等
7、collectd是一个守护(daemon)进程,用来收集系统性能和提供各种存储方式来存储不同值的机制。比如以RRD 文件形式。
8、Fiddler是最强大最好用的Web调试工具之一,它能记录所有客户端和服务器的http和https请求,允许你监视,设置断点,甚至修改输入输出数据,Fiddler包含了一个强大的基于事件脚本的子系统,并且能使用net语言进行扩展
9、网络嗅探器/数据包捕获网络取证分析工具(NFAT),它可以检测网络上的流量,会话,主机名,操作系统的开放端口等。 NetworkMiner也可以解析PCAP文件进行离线分析,同时,NetworkMiner还可以提取网络流量的传输的文件。
10、Pandora FMS(灵活监控系统)是一种小型和大型系统环境(一个服务器2000节点)的可用性和性能监视系统。对于本地系统,该软件使用代理来监视Linux, Solaris, FreeBSD, MAC OS X, Windows和AIX平台上的数值参数,布尔状态或字符串。使用者可以用Shellscript, WSH, Perl 或 C创建代理。 可通过SNMP v3, TCP检查和远程WMI探测来进行远程网络监视。 数据报告基于Pandora自己的SQL后台,且可在配置的屏幕上显示。
11、Observium是一个可自动发现网络中的Cisco设备和Linux系 统的网络监控工具,而是包括了主要的网络硬件和操作系统的广泛支持。
12、EasyNetMonitor是一款非常有用的免费网络监 视工具,无需安装。软件默认会每10秒钟ping一次网站,如果网站运作正常,也就是有响应的话,系统托盘的监测状态会显示绿灯,如果是没响应的话则是显 示红灯。要修改或是删除监测的网站,在地球小图标上点击右键,选择监测网址子菜单的 Edit 或是 Delete就行!
13、Colasoft Capsa Free是一个功能强大的程序,成功地处理与网络分析,向您提供用于故障诊断和监测的信息。它为用户提供丰富的经验,若要了解如何监视网络活动,查明网络问题,增强网络安全性等。
望采纳!
1、监控windows进程内存。在C盘中创建脚本abat,内容tasklist。
2、在zabbix客户端配置文件zabbix-agentdwinconf中添加UserParameter=aa,c:\abat。
3、在主机的监控项中添加新的监控项,这样就可以监控windows进程内存。
4、还可以通过zabbix监控网络设备,网络配置>接口/区域>区域TAB页,在“允许管理设备”里勾选“SNMP”。
5、在网络配置>高级网络配置里,找到snmp标签页,添加一条SNMP V1/V2规则。
6、用snmp进行管理,这里的设备的IP一定要在第一步“允许管理此设备的IP”范围内,用下面命令进行测试。
7、创建监控主机,选择snmp接口,默认端口为161。
8、通过在zabbix上创建监控项,配置上键值、SNMP OID、SNMP community。
9、这样就能通过监控项获取到最新数据了。
linux服务器性能监测是很重要的工作,服务器运行应该提供最有效的系统性能。当服务器系统性能突然低于平均应有的情况,问题可能来自在执行的进程、内存的使用率、磁盘的性能、网络流量和cpu
的压力。在预算短缺的今天,理解如何优化系统性能比以往任何时候都重要。
要实现它的前提是,你必须充分了解自己的计算机和网络,从而找到真正的瓶颈所在。本文提供一些基础的工具来辨别和处理一些性能问题。使用的linux
发行版本是red
hat
enterprise
linux
4,工作过程是:首先查看整个系统的状态,然后是检查特定的子系统。
linux服务器进行性能监控有几种方法,每种方法都各有其优缺点。
使用snmp等标准工具
标准及非标准工具能执行一个或多个收集、合并及传输阶段,如rstatd或snmp工具,然而标准的rstat后台程序提供的信息是有限的,速度慢而且效率低。
内核模块
几个系统监控工程利用内核模块来存取监控数据。一般情况下,这是很有效的收集系统数据的方法。然而这种方法存在的问题是,当主内核源内有其它改变时,必须保持代码一致性。一个内核模块可能与用户想使用的其它内核模块相冲突。此外,在使用监控系统之前,用户必须获得或申请模块。
/proc虚拟文件系统
/proc虚拟文件系统是一个较快的、高效率执行系统监控的方法。使用/proc的主要缺点是必须保持代码分析与/proc
文件格式改变的同步。事实表明,linux内核的改变比/proc
文件格式的改变要更频繁,所以,用/proc虚拟文件系统比用内核模块存在的问题要少。本文介绍的方法即基于/proc虚拟文件系统。
一、
/proc文件系统特点
linux
系统向管理员提供了非常好的方法,使他们可以在系统运行时更改内核,而不需要重新引导内核系统。这是通过
/proc
虚拟文件系统实现的。/proc
文件虚拟系统是一种内核和内核模块用来向进程
(process)
发送信息的机制
(所以叫做
/proc)。这个伪文件系统让你可以和内核内部数据结构进行交互,获取
有关进程的有用信息,在运行中
(on
the
fly)
改变设置
(通过改变内核参数)。
与其他文件系统不同,/proc
存在于内存之中而不是硬盘上。不用重新启动而去看
cmos
,就可以知道系统信息。这就是
/proc
的妙处之一。
小提示:
每个linux系统根据软硬件不同/proc
虚拟文件系统的内容也有些差异。/proc
虚拟文件系统有三个很重要的目录:net,scsi和sys。sys目录是可写的,可以通过它来访问或修改内核的参数,而net和scsi则依赖于内核配置。
1 Performance Co-Pilot
Performance Co-Pilot,简称 PCP,是一个系统性能和分析框架。它从多个主机整理数据并实时的分析,帮你识别不正常的表现模式。它也提供 API 让你设计自己的监控和报告解决方案。
2 Anturis
Anturis 是一个监控你的服务器、网站、IT基础设置的基于云计算的SaaS平台。它有一个全面的监控解决方案列表,非常值得一看。
3 SeaLion
SeaLion 是一个基于云计算的Linux服务器监控工具。它可以用一个面板简单的监控所有的服务器并且诊断问题。它只需要几分钟就可以安装好,具有及时提醒功能,当发生问题时你可以及时的收到提醒,还具有日常数据汇总等功能。
4 Icinga
Icinga 是一个免费开源的服务器监控工具,可以检测服务器资源的可用性。它可以记录服务器问题并且通知你。
5 Munin
Munin 是一个网路和系统监控工具,可以帮你分析服务器资源趋势。它是一个即插即用的解决方案。默认的安装方式提供了很多的报告。
0条评论