服务器硬盘检测失败的解决方法

服务器硬盘检测失败的解决方法,第1张

单位最近新买了一台HP ProLiant DL385服务器,同时购买了一台HP Smart Array 500 G2磁盘控制阵列卡,配置了10块容量为146GB的1万转SCSI硬盘,现在笔者打算将这10块SCSI硬盘做成RAID 5,以便让磁盘阵列系统担负起保存大量多媒体信息的任务。想到做到,笔者迅速将服务器机箱外壳打开,然后将HP Smart Array 500 G2磁盘阵列卡小心翼翼地插入到服务器主板的PCI插槽里,接着把SCSI数据线缆的一头与磁盘阵列卡连接,另外一头与插满10块SCSI硬盘的磁盘控制阵列柜直接连接;接下来接通磁盘控制阵列柜电源,等到其中的所有硬盘信号灯闪烁状态稳定后,再接通服务器主机电源,这样一来服务器就会自动开始执行检测操作。

在检测过程中,笔者发现Windows系统先是识别到了安装在插槽1位置处的磁盘阵列卡,之后又对其中的硬盘进行了初始化扫描操作,但是当扫描操作结束后,笔者发现安装在磁盘控制阵列柜中的所有硬盘信号灯都变成了红色,同时系统还弹出提示说检测不到逻辑硬盘和物理硬盘。笔者不放心,重新启动了一下计算机系统,并在启动过程中及时按下了F8功能键,进入到磁盘阵列参数配置界面,并在其中执行了查看逻辑盘命令,可是系统依然提示没有找到可用的逻辑硬盘,看来安装在磁盘控制阵列柜中的10块SCSI硬盘真没有被系统识别到。

考虑到10块SCSI硬盘是通过磁盘控制阵列柜来与计算机相连的,只要任意一块硬盘发生损坏,或者SCSI信号线缆、磁盘控制阵列卡中的任意一个损坏的话,都会导致计算机系统无法检测到硬盘。为了消除硬盘检测失败故障,笔者只好从可能的因素着手,来对多方面因素进行逐步排查:

首先笔者将连接磁盘控制阵列柜与安装在计算机PCI插槽中的阵列卡的SCSI线缆拔了下来,然后将该线缆的一端直接与计算机主板中的SCSI端口相连,而不与磁盘阵列卡相连,另外一端仍然与磁盘控制阵列柜相连,然后接通计算机电源,让Windows服务器系统重新对硬盘进行检测扫描,结果笔者发现所有的SCSI硬盘都能被Windows服务器系统正确扫描识别到,同时屏幕上还显示出每块硬盘的详细参数信息,包括硬盘的生产厂家、具体型号、容量大小以及所用的SCSI标识号,这样的结果至少能表明SCSI连接线缆是正常的,而且磁盘控制阵列柜的工作状态也是正常的。

在排除了磁盘控制阵列柜与SCSI信号线缆因素后,下面笔者又将排查的重点“锁定”在磁盘控制阵列卡上。为了检验磁盘控制阵列卡究竟有没有发生损坏,笔者特意向其他部门临时借用了一块工作状态正常的HP Smart Array 500 G2磁盘阵列卡,来将计算机原配的磁盘阵列卡替换掉;可是,当笔者用SCSI信号线缆将工作正常的磁盘阵列卡与磁盘控制阵列柜直接连接起来,并接通计算机电源后,发现Windows服务器系统在检测扫描硬盘时,仍然发生了失败故障,而且故障症状与先前产生的症状几乎是一模一样,到了这里笔者基本认定磁盘控制阵列卡也没有任何问题。既然磁盘控制阵列柜、阵列卡以及SCSI信号线缆都没有问题,那安装在磁盘控制阵列柜中的10块SCSI硬盘,为什么不会被Windows服务器系统正确扫描、识别到呢

经过上面的逐步排查后,现在导致硬盘检测失败故障的唯一可能因素就是有部分硬盘发生损坏了;为了验证自己的猜想,笔者将安装在磁盘控制阵列柜中的所有硬盘全先拔了出来,然后重新在磁盘控制阵列柜中只安装一块硬盘,并接通计算机电源进行扫描测试,结果发现Windows服务器系统竟然能够扫描识别到该硬盘。按照相同的操作方法,笔者又在磁盘控制阵列柜中新增加了一只硬盘,并接通计算机电源进行扫描测试,测试结果也是正常的;依此类推,当笔者加入第六块硬盘进行测试时,发现Windows服务器系统又找不到硬盘了;当将第六块硬盘排除在外,同时依次加入其他硬盘继续测试时,发现测试结果都很正常。

1 Performance Co-Pilot

Performance Co-Pilot,简称 PCP,是一个系统性能和分析框架。它从多个主机整理数据并实时的分析,帮你识别不正常的表现模式。它也提供 API 让你设计自己的监控和报告解决方案。

2 Anturis

Anturis 是一个监控你的服务器、网站、IT基础设置的基于云计算的SaaS平台。它有一个全面的监控解决方案列表,非常值得一看。

3 SeaLion

SeaLion 是一个基于云计算的Linux服务器监控工具。它可以用一个面板简单的监控所有的服务器并且诊断问题。它只需要几分钟就可以安装好,具有及时提醒功能,当发生问题时你可以及时的收到提醒,还具有日常数据汇总等功能。

4 Icinga

Icinga 是一个免费开源的服务器监控工具,可以检测服务器资源的可用性。它可以记录服务器问题并且通知你。

5 Munin

Munin 是一个网路和系统监控工具,可以帮你分析服务器资源趋势。它是一个即插即用的解决方案。默认的安装方式提供了很多的报告。

1、及时更新最新最全补丁:即使服务器没有连接到互联网,仍然要保证软件系统的更新,你可以通过网络上的另一个服务器运行服务器更新策略服务来完成。如果服务器不联网不实际的话,那么应该确保更新设置为自动下载并应用补丁。

2、定时检查工作:定时检查服务器的网络连接状况、定时检查服务器操作系统运行状况、定时检查服务器系统日志、定时检查磁盘剩余空间已确保有充足的空间存储数据。

3、磁盘阵列:就是把2个或2个以上的物理硬盘组合成1个逻辑硬盘,极大的提高了数据的稳定性和传输速度。同时安全性也有了非常高的保障。服务器硬盘的发展目前已达到每秒10000转左右,在运行当中,一点细小的故障都有可能造成硬盘物理损坏,所以一般服务器都采用Raid磁盘阵列存储,加强服务器硬盘的容错功能。其中任意一个硬盘发生故障时,仍可读出数据。

4、除了做磁盘阵列外,对于一些十分重要的数据要实时进行备份,利用专业备份软件,定期定时做相对完善的备份方案。

5、数据备份记录也好做好,以便恢复时使用。记录里面应包含:备份时间点、备份保存、备份方法、备份工具、操作人员、备份完成时间、备份检测、备份开始时间。

6、删除不必要的软件:在你服务器上的那些肯定不需要的软件如Flash、Silverlight、Java安装这些软件只会给黑客增加攻击的机会。你可以从服务器中删除没用的软件应用

服务器测试方法

服务器测试方法分为两个大方面,性能测试与功能测试。

我们在性能测试方面采用了新的测试方法,主要分为文件测试、数据库性能测试与

Web

性能测试三个

方面。其中,文件性能与数据库性能采用美国

Quest

软件公司的

Benchmark Factory

负载测试和容量规划

软件,

Web

性能测试则使用了

Spirent

公司提供的

Caw WebAvalanche

测试仪。

一、性能测试

1

、文件性能测试方法

Benchmark Factory

软件能按照文件读写的关键指标定制事务。软件最大支持

1000

个虚拟客户。

本次测试环境包括

10

台配置为

PIII800/128MB

内存

/20G

硬盘以上的客户端,它们用来模拟虚拟用户。

控制台为配置是

PIII 850/128MB

内存

/40G

硬盘的

Acer

笔记本电脑。交换机为带有两个千兆

GBIC

接口、

24

10/100M

自适应端口的

Cisco 2950

,客户端与控制台通过

100M

网卡连到交换机上,被测服务器则通

过千兆光纤网卡与交换机相连接。

被测服务器均安装带

SP4

Windows

2000

Advanced Server

操作系统,在所有三项性能测试中都统一

RAID

级别为

5

在具体测试方案设置上,测试软件把决定文件读写操作的关键因素设定为:读

/

写、随机

/

顺序、操作

块大小、对象大小四个。在本次测试中,考虑到我们设有单独的数据库及

Web

测试项目,所以在文件测试

中,我们把目标确定为测试服务器基本的

I/O

性能,这主要由网络接口、系统带宽、磁盘子系统等几大部

分所决定。同时,从几部分的作用看,以大操作块读写大对象文件,小操作块读写小对象文件,较能反映

服务器最基本的

I/O

性能,即“大操作块读写大文件”对系统带宽、缓存的考察,以及“小操作块读写小

文件”对磁盘子系统、网络接口的考察。最终我们确定的四个事务是:

大文件顺序读写

(

操作块

8KB

,对象文件

80% 500KB

20% 1MB)

大文件随机读写

(

操作块

8KB

,对象文件

80% 500KB

20% 1MB)

小文件随机读

(

操作块

1KB

,对象文件

80% 1KB

10% 10KB

10% 50KB)

小文件顺序写

(

操作块

1KB

,对象文件

80% 1KB

10% 10KB

10% 50KB)

每个事务的用户数均以固定步长逐渐增加,

最大可增加到

1000

个虚拟用户。

其中,

“大文件顺序读写”

事务的用户数按照

40

的步长从

1

可增加到

400

(

测试至强服务器

)

200

(

测试

TUALATIN

服务器

)

,其

他事务则将用户数按照

100

的步长从

1

增加至

1000

。我们期望得到其在不同用户数时被测服务器的性能表

现。总体上其走势及峰值反映了该服务器的性能。每项事务均运行三次,每次之间被测服务器进行重启,

最终结果为三次平均值。

2

、数据库性能测试方法

“乘机安全小贴士”安全出行要重视

数据库性能测试同样使用了

Benchmark Factory

软件,测试环境如同文件性能测试。测试时,在被测

服务器上安装

SQL Server 2000

使用企业版。首先在被测服务器上创建新的数据库,通过使用

Benchmark

Factory

预定义的

Database Spec

项目向数据库中创建表,装载数据。在服务器端创建以

CPU

计算为主的

存储过程,通过

10

台客户机模拟用户、按照

40

个虚拟用户的步长递增到

400

个用户,执行该存储过程。

结果是以获得的每秒事务数

(TPS)

衡量服务器的数据库事务处理能力。

整个测试分为三次,

每次之间重新启

动被测服务器,最终取三次平均值作为评价结果。

3

Web

性能测试方法

Web

性能测试工具是由

Spirent

公司提供的

Caw WebAvalanche

WebAvalanche

模拟实际的用户发出

HTTP

请求,

并根据回应给出具体的详细测试结果。

它有以下特点:

能够模拟成百上千的客户端对服务器发

出请求

;

能够模拟真实的网络应用情况,

比如网站在高峰期的访问量应该是动态的维持,

有新客户端的加入,

同时也有原客户的离去,

访问量不是固定不变的

;

可以产生

20000

个连接

/

秒请求量,

足以满足测试的需要

;

测试项目丰富,有访问请求的成功失败数,有

URL

和页面的响应时间,有网络流量数,还有

HTTP

TCP

议的具体情况。

测试时,被测服务器与

WebAvalanche

上都装有千兆光纤网卡,两网卡通过光纤直接连接。监控端

(

置为

PIII 1GHz/128M

内存

/20G

硬盘

)

安装了带

SP4

Windows 2000 Server,

该监控端与

WebAvalanche

过交叉线直连。在监控端通过

Web

浏览器配置

WebAvalanche

,在被测服务器安装了

SQL Server 2000

企业

版,并用微软的

IIS

建立了

Web

服务器。

测试分为静态性能与动态性能两部分。主要是因为在实际的

Web

应用中,有的站点静态内容居多,提

供的服务也绝大多数是静态的,

因此,

他们就会特别的关心服务器静态性能

;

同样,

有的站点提供的服务交

互性的内容居多,他们就会更关心服务器的动态性能。

被测网站中页面大小及静态、动态页面所占比例均参照实际网站得出,整个网站静态、动态页面所占

比例是

70%

30%

,使用的动态页面类型为

ASP

。请求页面样本的文件大小分布比例与整个网站的相同。

静态性能测试模拟发出的均是静态页面请求。在测试动态性能时,动态页面的访问请求占

20%

,其余

80%

为静态页面请求。我们根据实际的

Web

服务器一天中的运行情况建立了一个服务器页面请求模型,该

模型由

4

个阶段组成,第一阶段是预热阶段,

WebAvalanche

发出的请求量由

0

慢慢上升到

200;

第二阶段

是逐步加压阶段,请求量逐步累加到最大值

8200;

第三阶段是动态维持阶段

;

第四阶段是下降阶段,请求量

由最大值迅速下降为

0

。其中,最大请求量略大于实际服务器能够提供的事务处理量。

被测服务器的静态与动态测试分别测试三遍,每遍之间被测服务器和测试仪均重启,结果取三次的平

均值。由此可见,此服务器测试方法立志于最终结果的准确性。

二、功能测试

在功能测试方面,我们对被测服务器的可扩展性、可用性以及可管理性进行了综合评价,其中可扩展

性包括硬盘、

PCI

槽以及内存等的扩展能力,可用性包括对热插拔、冗余设备

(

如硬盘、电源、风扇、网卡

)

的支持,可管理性则指的是服务器随机所带的管理软件。

我们在对服务器进行总体评价时,综合了性能、功能和价格三方面因素,依据《网络世界》所做的用

户调查结果,分别给予不同权重,性能占

50%

,功能占

40%

,而价格则占

10%

。在分析性能时,数据库性能

占其中的

50%

,而文件性能占

30%

Web

性能占

20%

综上所述,这种全新的服务器测试方法更够更准确更直接的对服务器进行测试,而且数据更加精确。

希望能给又需要的读者朋友带来一定的帮助

谢谢采纳。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 服务器硬盘检测失败的解决方法

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情