如何测试服务器的稳定性?

如何测试服务器的稳定性?,第1张

服务器稳定性是最重要的,如果在稳定性方面不能够保证业务运行的需要,在高的性能也是无用的。

  正规的服务器厂商都会对产品惊醒不同温度和湿度下的运行稳定性测试。重点要考虑的是冗余功能,如:数据冗余、网卡荣誉、电源冗余、风扇冗余等。

  一些测试方法主要分以下几种:

  压力测试:已知系统高峰期使用人数,验证各事务在最大并发数(通过高峰期人数换算)下事务响应时间能够达到客户要求。系统各性能指标在这种压力下是否还在正常数值之内。系统是否会因这样的压力导致不良反应(如:宕机、应用异常中止等)。

  Ramp Up 增量设计:如并发用户为75人,系统注册用户为1500人,以5%-7%作为并发用户参考值。一般以每15s加载5人的方式进行增压设计,该数值主要参考测试加压机性能,建议Run几次。以事务通过率与错误率衡量实际加载方式。

  Ramp Up增量设计目标: 寻找已增量方式加压系统性能瓶颈位置,抓住出现的性能拐点时机,一般常用参考Hits点击率与吞吐量、CPU、内存使用情况综合判断。模拟高峰期使用人数,如早晨的登录,下班后的退出,工资发送时的消息系统等。

  另一种极限模拟方式,可视为在峰值压力情况下同时点击事务操作的系统极限操作指标。加压方式不变,在各脚本事务点中设置同集合点名称(如:lr_rendzvous("same");)在场景设计中,使用事务点集合策略。以同时达到集合点百分率为标准,同时释放所有正在Run的Vuser。

  稳定性测试:已知系统高峰期使用人数、各事务操作频率等。设计综合测试场景,测试时将每个场景按照一定人数比率一起运行,模拟用户使用数年的情况。并监控在测试中,系统各性能指标在这种压力下是否能保持正常数值。事务响应时间是否会出现波动或随测试时间增涨而增加。系统是否会在测试期间内发生如宕机、应用中止等异常情况。

  根据上述测试中,各事务条件下出现性能拐点的位置,已确定稳定性测试并发用户人数。仍然根据实际测试服务器(加压机、应用服务器、数据服务器三方性能),估算最终并发用户人数。

  场景设计思想:

  从稳定性测试场景的设计意义,应分多种情况考虑:

  针对同一个场景为例,以下以公文附件上传为例简要分析场景设计思想:

  1)场景一:已压力测试环境下性能拐点的并发用户为设计测试场景,目的验证极限压力情况下测试服务器各性能指标。

  2)场景二:根据压力测试环境中CPU、内存等指标选取服务器所能承受最大压力的50%来确定并发用户数。

  测试方法:采用1)Ramp Up-Load all Vusers simultaneously

  2)Duration-Run Indefinitely

  3)在Sechedule-勾选Initalize all Vusers before Run

  容错性测试:通过模拟一些非正常情况(如:服务器突然断电、网络时断时续、服务器硬盘空间不足等),验证系统在发生这些情况时是否能够有自动处理机制以保障系统的正常运行或恢复运行措施。如有HA(自动容灾系统),还可以专门针对这些自动保护系统进行另外的测试。验证其能否有效触发保护措施。

  问题排除性测试:通过原有案例或经验判断,针对系统中曾经发生问题或怀疑存在隐患的模块进行验证测试。验证这些模块是否还会发生同样的性能问题。如:上传附件模块的内存泄露问题、地址本模块优化、开启Tivoli性能监控对OA系统性能的影响等等。

  测评测试是用于获取系统的关键性能指标点,而进行的相关测试。主要是针对预先没有明确的预期测试结果,而是要通过测试获取在特定压力场景下的性能指标(如:事务响应时间、最大并发用户数等)。

  评测事务交易时间:为获取某事务在特定压力下的响应时间而进行的测试活动。通过模拟已知客户高峰期的各压力值或预期所能承受的压力值,获取事务在这种压力下的响应时间。

  评测事务最大并发用户数:为获取某事务在特定系统环境下所能承受的最大并发用户数而进行的测试活动。通过模拟真实环境或直接采用真实环境,评测在这种环境下事务所能承受的最大并发用户数。判定标准阈值需预先定义(如响应时间,CPU占用率,内存占用率,已出现点击率峰值,已出现吞吐量峰值等)。

  评测系统最大并发用户数:为获取整个系统所能够承受的最大并发用户数而进行的的测试活动。通过预先分析项目各主要模块的使用比率和频率,定义各事务在综合场景中所占的比率,以比率方式分配各事务并发用户数。模拟真实环境或直接采用真实环境,评测在这种环境下系统所能承受的最大并发用户数。判定标准阀值预先定义(如响应时间,CPU占用率,内存占用率,已出现点击率峰值,已出现吞吐量峰值等)。取值标准以木桶法则为准(并发数最小的事务为整个系统的并发数)。

  评测不同数据库数据量对性能的影响:针对不同数据库数据量的测试,将测试结果进行对比,分析发现数据库中各表的数据量对事务性能的影响。得以预先判断系统长时间运行后,或某些模块客户要求数据量较大时可能存在的隐患。

  问题定位测试在通过以上测试或用户实际操作已经发现系统中的性能问题或怀疑已存在性能问题。需通过响应的测试场景重现问题或定义问题。如有可能,可以直接找出引起性能问题所在的代码或模块。

  该类测试主要还是通过测试出问题的脚本场景,并可以增加发现和检测的工具,如开启Tivoli性能监控、开启HeapDump输出、Linux资源监控命令等。并在场景运行过程中辅以手工测试。

服务器扩展硬盘需要配置如下:

1、接口类型:服务器硬盘需要支持相应的接口类型,例如SATA、SAS等。确保新的硬盘与服务器的接口兼容,否则无法使用。

2、硬盘尺寸:需要选择合适的硬盘尺寸,以确保它可以适配到服务器的硬盘托架上。另外,硬盘尺寸也需要考虑适配到服务器机箱的大小。

3、硬盘容量:需要根据存储需求来选择硬盘容量,确保能够满足服务器的储存需求。

4、硬盘转速:硬盘转速也是较为重要的一项配置,通常情况下,服务器要求的硬盘转速是在7200RPM及以上。

5、缓存大小:缓存大小直接影响硬盘的读写速度,需要选择较大的缓存大小。一般来说,硬盘的缓存大小应该在32MB及以上。

服务器要更换硬盘的话多采用企业级硬盘,企业级硬盘具有724小时不间断作业能力,与桌面级硬盘相比,企业级硬盘最重要的不同之处在于可靠性,长时间运作,以及很高的MTBF(Mean Time Between Failure,平均故障间隔时间)

RAID1更换硬盘的典型案例:

硬件环境:两块SATA 80G串口硬盘,插sata0 sata1接口组建RAID1

一、插sata1的slave从硬盘坏掉,更换新硬盘的方法

直接将新硬盘替换到slave位置,线序不变,开机按ctrl+E即可自动热备

二、插sata0的master主硬盘坏掉,更换新硬盘的方法

1拔掉slave盘,单接坏掉的master主硬盘,开机按ctrl+E进入RAID configure界面,选择clear array来清除主盘的raid信息

2将正常的slave盘的sata数据线从sata1插口换到主板的sata0插口,再将新的硬盘插入sata1插口,开机按ctrl+E即进入自动热备状态!

要从硬盘的物理结构来说,硬盘应该叫硬盘驱动器,就像我们常用的光驱(光盘驱动器),结构类似。也是主要由磁头和盘片组成。只不过光驱读的光盘是可更换的,硬盘密封固化起来了。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 如何测试服务器的稳定性?

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情