服务器性能要求
1)可管理性。可管理性是指服务器的管理是否方便、快捷,应用软件是否丰富。在可管理性方面,基于Widows NT/2000平台的个人计算机服务器要优于Unix服务器。
2)可用性。可用性是指在一般时间内服务器可供访问者正常使用的时间的百分比。.提高可用性有两个方面的考虑:减少硬件平均故障时间和利用专用功能机制。专用功能机制可在出现故障时自动执行系统或部件切换机制,以避免或减少意外停机。
3)高性能。这是指服务器综合性能指标要高。主要要求在运行速度、磁盘空间、容错能力、扩展能力、稳定性、监测功能及电源等方面具有较高的性能指标。尤其是硬盘和电源的热插拔性能、网卡的自适应能力的性能指标要高。
4)可扩展性。为了使服务器随负荷的增加而平稳升级,井保证服务器工作的稳定性和安全性,必须考虑服务器的可扩展性能。首先在机架上要有为硬盘和电源的增加而留有的充分空间,其次主机上的插槽不但要种类齐全,而且要有一定的余量。
5)模块化。模块化是指电源、网卡、SCSI卡、硬盘等部件为模块化结构,且都是有热插拔功能,可以在线维护,从而使系统停机的可能性大大减少。特别是分布式电源技术可使每个重要部件都有自己的电源。
参照此表,您可以估算出服务器在繁忙时段的平均扩展系数,并且还可以为 Server_Transinfo_Range 设定合理的数值,以此得到一个比较理想的服务器可用性指标。以下内容节选自 Domino Administrator 651 帮助文档。集群中的每个服务器都定期判断自己的工作负载,判断将基于服务器最近处理请求的响应时间作出。系统用 0 到 100 之间的数字表示工作负载,其中 0 表示服务器负载过重;100 表示服务器负载很轻。这个数值称为服务器的可用性指标。随响应时间增加,服务器可用性指标减小。服务器的可用性指标约等于仍然可用的总服务器容量百分比。例如,如果服务器的可用性指标为 65,则仍然有 65% 的服务器容量可用。尽管企业中的服务器功率和资源可能不同,但每台服务器上的服务器可用性指标都代表同一件事 -- 仍然可用的服务器容量。服务器可用性指标基于扩展系数生成,用于指示服务器上的当前工作负载。扩展系数是由特定类型事件的响应时间与服务器曾经完成此类事务的最短时间之比决定的。例如,如果服务器当前执行“打开数据库”事务的平均时间为 12 毫秒,而服务器曾经执行“打开数据库”事务的最短时间为 3 毫秒,则“打开数据库”事务的扩展系数为 4(当前时间 12 毫秒除以最快时间 3 毫秒)。换言之,扩展系数决定完成当前事务所花的时间是在最佳条件下所花时间的多少倍。IBM(R) Domino(TM) 将每种事务的最短时间存储在内存和 LOADMONNCF 文件中,服务器每次启动时都会读取该时间。服务器关机时,Domino 会用最新信息更新 LOADMONNCF 文件。为确定当前的扩展系数,Domino 会在指定的时间段内跟踪最常用的几种 Domino 事务类型。缺省情况下,Domino 会在 5 个时间段内跟踪这些事务,每段时间为 15 秒。然后,Domino 就可以确定完成每种事务平均要花的时间,并用该时间除以它曾经完成每种同类事务所花的最短时间。这样就可确定每种事件的扩展系数。为确定整个服务器的扩展系数,Domino 会取所有类型事务的扩展系数的平均值,并对最常用的事务类型给予较大的加权数。当服务器繁忙时,对服务器添加更多负载会显著地影响服务器的性能和可用性。因此,向繁忙的服务器中添加负载也比向不繁忙的服务器中添加负载要更快地增大扩展系数。因为各个服务器的速度、容量和处理能力各不相同,能够处理的工作负载也不尽相同。所以,两个不同服务器的扩展系数相同并不一定意味着二者能够承担相当的工作负载。例如,对于一个在空闲状态下执行事务都需要花费很长时间的小型服务器来说,扩展系数 40 可能表示用户需要等待若干秒才能得到响应。而对于一个处理速度非常快的超大型服务器来说,扩展系数 400 可能表示用户只需等待不到一秒的时间就能得到响应。注意:下表中的值是根据扩展系数 64 生成的,该值表示服务器处于满负载状态。 扩展系数可用性指标 1<nozeros> 100<nozeros> 2<nozeros> 83<nozeros> 4<nozeros> 67<nozeros> 8<nozeros> 50<nozeros> 16<nozeros> 33<nozeros> 32<nozeros> 17<nozeros> 64<nozeros> 0<nozeros> 注意:扩展系数和可用性指标仅用于度量服务器响应时间,该时间通常只是客户机经历的响应时间的一小部分。例如,客户机和服务器之间的网络响应时间通常占客户机经历的响应时间的很大部分。更改表示服务器处于满负载状态的扩展系数值 要有效利用 Domino 工作负载平衡,必须调整扩展系数与可用性指标之间的关系,以便服务器在达到预期的故障转移工作负载时进行故障转移。通过指定表示服务器处于满负载状态的扩展系数值,可以实现此目的。Domino 中的缺省值为 64。当扩展系数达到该值时,便可将服务器视为负载已满,可用性指标降为 0(零)。如果服务器的功能特别强大,处理速度特别快,则可提高表示服务器处于满负载状态的扩展系数值。对于一些处理速度极快的服务器来说,该值可以提高到几百或更高。如果服务器的处理速度特别慢,则可降低该值。要更改表示满负载服务器的扩展系数值,请将下面的设置添加到 NOTESINI 文件,然后重新启动服务器。SERVER_TRANSINFO_RANGE= n 其中,值 n 表示服务器处于满负载状态的扩展系数值等于 2 的 n 次幂。 n 的缺省值为 6,这说明扩展系数值为 64,因为 2 的 6 次幂为 64;如果将 SERVER_TRANSINFO_RANGE 设为 7,则满负载时的扩展系数值为 128;如果将 SERVER_TRANSINFO_RANGE 设为 8,则该值为 256。要确定 SERVER_TRANSINFO_RANGE 的最优值,请执行下列操作:1 在服务器负载过重的期间内,监控服务器的扩展系数。可以使用控制台命令“show stat serverexpansionfactor”来执行此任务。另外,还可以在这些期间内监控性能统计信息。记录有关此类期间的足够多的扩展系数值,以便确定使用哪个扩展系数值来表示服务器处于满负载状态。 2 为 SERVER_TRANSINFO_RANGE 确定一个值,以 2 为底数, 该值为指数计算而得的值,即为在步骤 1 中选择的扩展系数值。 如果更改了表示服务器处于满负载状态的扩展系数值,扩展系数与可用性指标之间的关系就会发生变化。下表列出了当 SERVER_TRANSINFO_RANGE 值为 8 时的一些扩展系数以及由之转换而来的可用性指标。因为 2 的 8 次幂为 256,所以本例中的最大扩展系数为 256。扩展系数可用性指标1<nozeros>100<nozeros>2<nozeros>88<nozeros>4<nozeros>75<nozeros>8<nozeros>63<nozeros>16<nozeros>50<nozeros>32<nozeros>38<nozeros>64<nozeros>25<nozeros>128<nozeros>13<nozeros>256<nozeros>0<nozeros>更改用于计算扩展系数的数据量 尽管不是必需的操作,但还是可以使用下列 NOTESINI 设置来更改 Domino 收集用以配置扩展系数的数据量。 要更改 Domino 使用的数据收集时间段数,请使用 NOTESINI 的 Server_Transinfo_Max=x 设置,其中 x 是您希望 Domino 使用的收集时段数量。 要更改每个数据收集时间段的时间长度,请使用 NOTESINI 的 Server_Transinfo_Update_Interval=x 设置,其中 x 是每个时间段的长度(秒)。
性能测试常用指标从外部看,主要有:
1、吞吐量:每秒钟系统能够处理的请求数,任务数
2、响应时间:服务处理一个请求或一个任务的耗时
3、错误率:一批请求中结果出错的请求所占比例
从服务器的角度看,性能测试关注CPU,内存,服务器负载,网络,磁盘IO
对登录功能做性能测试:
1、单用户登陆的响应界面是否符合预期
2、单用户登陆时后台请求数量是否过多
3、高并发场景下用户登录的响应界面是否符合预期
4、高并发场景下服务端的监控指标是否符合预期
5、高集合点并发场景下是否存在资源死锁和不合理的资源等待
6、长时间大量用户连续登录和登出,服务器端是否存在内存泄漏
为了满足网络应用不断增长的性能需要,我们通常增加新服务器个数,分担业务,提高系统工作性能,即横向扩展。其实也可以通过提高现有服务器的配置来提高服务器的整体性能,即纵向扩展——因为服务器部件的选配对服务器的性能至关重要。而直接存储数据的硬盘更是影响服务器服务性能的重要一环。
提高服务器性能的方法就是寻找制约服务器性能的瓶颈在哪。不同应用可能存在的瓶颈是不同的,有的要重点考虑处理器、内存,有的要重点考虑硬盘或网络的I/O吞吐能力;那么,在哪些应用环境下需要重点考虑服务器硬盘瓶颈呢
通讯服务器(messaging/E-mail/VOD):快速的I/O是这类应用的关键,硬盘的I/O吞吐能力是主要瓶颈;
数据仓库(联机事务处理/数据挖掘):大型商业数据存储、编目、索引、数据分析,高速商业计算等,需要具有良好的网络和硬盘I/O吞吐能力;
数据库(ERP/OLTP等):服务器运行数据库,需要具有强大的CPU处理能力,大的内存容量来缓存数据,同时需要有很好的I/O吞吐性能;
其他应用:应用集中在数据查询和网络交流中,需要频繁读写硬盘,这时硬盘的性能将直接影响服务器整体的性能。
影响硬盘的因素
谈到硬盘的指标参数,首先就应提到硬盘的接口标准。当今主流硬盘的接口界面有两种:EIDE和SCSI,当然此外还有IEEE 1394接口、USB接口和FC-AL(FibreChannel-Arbitrated Loop)光纤通道接口的产品,但是很少见。现在几乎所有的微机普遍采用基于Ultra DMA/33/66/100标准的IDE接口的硬盘,它的优势在于能提供较低价格,普及率很高。
同时,也有部分低端服务器采用了IDE硬盘,目前,几乎所有服务器主板都集成了IDE控制器,但在中高端服务器中还只是普遍用来连接低速外设IDE光驱,而硬盘一般采用SCSI接口标准,如浪潮英信服务器就普遍采用了Ultra160 SCSI硬盘,提供更高的硬盘吞吐能力。SCSI接口硬盘有着极低的CPU占用率、支持更多的设备和在多任务下工作的优势明显等优点,更适合于服务器应用的需求,当然SCSI硬盘价格要高得多。
然而,硬盘的数据传输系统之瓶颈不在于PCI总线或是接口速率上,而在硬盘本身,这是由硬盘机械部分与结构设计等诸多因素造成的。
衡量硬盘的指标
衡量硬盘性能的指标主要包括:
主轴转速
主轴转速是一个在硬盘的所有指标中除了容量之外,最应该引人注目的性能参数,也是决定硬盘内部传输速度和持续传输速度的第一决定因素。如今硬盘的转速多为5400rpm、7200rpm、10000rpm和15000rpm。从目前的情况来看,10000rpm的SCSI硬盘具有性价比高的优势,是目前硬盘的主流,而7200rpm及其以下级别的硬盘在逐步淡出硬盘市场。
内部传输率
内部传输率的高低才是评价一个硬盘整体性能的决定性因素。硬盘数据传输率分为内外部传输率;通常称外部传输率也为突发数据传输率(Burstdata Transfer Rate)或接口传输率,指从硬盘的缓存中向外输出数据的速度,目前采用Ultra 160 SCSI技术的外部传输率已经达到了160MB/s;内部传输率也称最大或最小持续传输率(Sustained Transfer Rate),是指硬盘在盘片上读写数据的速度,现在的主流硬盘大多在30MB/s到60MB/s之间。由于硬盘的内部传输率要小于外部传输率,所以只有内部传输率才可以作为衡量硬盘性能的真正标准。
单碟容量
除了对于容量增长的贡献之外,单碟容量的另一个重要意义在于提升硬盘的数据传输速度。单碟容量的提高得益于磁道数的增加和磁道内线性磁密度的增加。磁道数的增加对于减少磁头的寻道时间大有好处,因为磁片的半径是固定的,磁道数的增加意味着磁道间距离的缩短,而磁头从一个磁道转移到另一个磁道所需的就位时间就会缩短。这将有助于随机数据传输速度的提高。而磁道内线性磁密度的增长则和硬盘的持续数据传输速度有着直接的联系。磁道内线性密度的增加使得每个磁道内可以存储更多的数据,从而在碟片的每个圆周运动中有更多的数据被从磁头读至硬盘的缓冲区里。
平均寻道时间
平均寻道时间是指磁头移动到数据所在磁道需要的时间,这是衡量硬盘机械性能的重要指标,一般在3ms~13ms之间,建议平均寻道时间大于8ms的SCSI硬盘不要考虑。平均寻道时间和平均潜伏时间(完全由转速决定)一起决定了硬盘磁头找到数据所在的簇的时间。该时间直接影响着硬盘的随机数据传输速度。
缓存
提高硬盘高速缓存的容量也是一条提高硬盘整体性能的捷径。因为硬盘的内部数据传输速度和外部传输速度不同。因此需要缓存来做一个速度适配器。缓存的大小对于硬盘的持续数据传输速度有着极大的影响。它的容量有512KB、2MB、4MB,甚至8MB或16MB,对于视频捕捉、影像编辑等要求大量磁盘输入/输出的工作,大的硬盘缓存是非常理想的选择。
知道了服务器硬盘的性能指标,下一步自然要依此选择出适合具体应用的服务器硬盘,以提高系统的工作性能。
选用高性能硬盘
由于SCSI具有CPU占用率低,多任务并发操作效率高,连接设备多,连接距离长等优点,对于大多数的服务器应用,建议采用SCSI硬盘,并采用最新的Ultra160 SCSI控制器;对于低端的小型服务器应用,可以采用最新的IDE硬盘和控制器。确定了硬盘的接口和类型后,就要重点考察上面提到的影响硬盘性能的技术指标,根据转速、单碟容量、平均寻道时间、缓存等因素,并结合资金预算,选定性价比最合适的硬盘方案。
RAID技术
冗余磁盘阵列RAID系统提供了比通常的磁盘存储更高的性能指标、数据完整性和数据可用性,尤其是在当今面临的硬盘I/O总是滞后于CPU性能的瓶颈问题越来越突出的情况下,RAID解决方案能够有效地弥补这个缺口。
依据磁盘阵列数据不同的校验方式, RAID技术分为不同的等级(RAID Levels),各有不同的技术特点,读者可以参考有关手册进行选用。
为了更好地提高硬盘的I/O性能,推荐采用RAID技术,根据应用的特点,把被频繁访问读写的硬盘做成RAID0或RAID1、RAID5;目前,在低端服务器可采用IDE RAID,如浪潮英信NP200;而在中高端服务器,建议采用SCSI RAID控制器,并注意RAID控制器有关技术指标,如CPU类型、通道类型和数目、缓存数量、有无电池后备等;需要注意的是:主板集成的RAID控制器由于本身没有硬盘控制器,而占用了主板上的SCSI硬盘控制器,需要耗费更多的主处理器时间,会使服务器的处理能力受到影响。
热拔插技术
除了从性能指标上评价硬盘,还要考虑到硬盘的故障率、平均无故障运行情况和易维护性。在具体的应用中,首先应选用寿命长、故障率低的硬盘,可降低故障出现的几率和次数,这牵扯到硬盘的MTBF(平均无故障时间)和数据保护技术,MTBF值越大越好,如浪潮英信服务器采用的硬盘的MTBF值一般超过120万小时,而硬盘所共有的SMART(自监测、分析、报告技术)以及类似技术,如seagate和IBM的DST(驱动器自我检测)和DFT(驱动器健康检测),对于保存在硬盘中数据的安全性有着重要意义。
另外,一旦硬盘损坏,应考虑如何保证数据不丢失,并且减少服务器的宕机时间。 RAID技术可以用来保证数据的可靠性和安全性,通过硬盘的热拔插技术可以保证在更换或维修硬盘的同时,服务器仍然能正常运行可用。目前热拔插技术在中高档服务器中非常普遍,一直也被作为服务器档次的一个重要标志。一般在服务器中采用的热拔插技术的部件有硬盘、电源、风扇、PCI插槽等,而SCSI硬盘也有专门支持热拔插技术的SCA2接口(80-pin),与SCSI背板配合使用,就可以
0条评论