怎么排除服务器中RAID5故障
怎么排除服务器中RAID5故障
但是,对HP的一些老服务器(如HP LH6000)数据的恢复与新服务器(如HP ProLian系列服务器)的数据恢复是不同的。所以不同的服务器对RAID 5故障的处理也是不同的。曾接触过两台服务器因意外断电而造成的RAID 5阵列卡数据故障,由于采用了不同的策略而解决了问题。
故障修复
一台是HP LH6000的服务器,4块18GB的硬盘做成RAID 5磁盘阵列,其阵列卡是NetRaid;另一台是HP ProLian ML370服务器,4块146GB的硬盘做成RAID 5磁盘阵列,其阵列卡是Smart Array 642并带有热备份硬盘(Hot Spare)。两者操作系统都为Window 2000,数据库是Server 2000。
HP LH6000的故障如下: 一块硬盘红灯闪亮,机器还在正常运行,但没有多久,系统就不能正常运行,这时才发现另一块硬盘的红灯也在闪亮。
解决办法如下:
1启动服务器,自检至阵列时按Ctrl+M进入NetRaid管理程序。查看阵列信息,发现硬盘状态为Failed,运用修改配置将一硬盘强行设置成OnLine。重新启动服务器,在进入系统前的硬件自检时无效,启动失败。
2启动服务器,自检至阵列时按Ctrl+M进入NetRaid管理程序。选择磁盘阵列,将原来OnLine挂起来的硬盘手工Fail掉,然后再把另一块Failed的硬盘手工设置成OnLine,重新启动服务器就可以进入系统了。
3查看系统及数据库都运行正常后,再进阵列配置工具把Failed的硬盘手工设置成Rebuild,100%完成重建后再重启服务器,所有的阵列及系统都恢复原状了。
另一台运行ERP系统的服务器(HP ProLiant ML370),由4块146GB热插拔硬盘通过RAID卡(Smart array阵列卡)配置成一台具有RAID 5级的磁盘阵列。其中一块硬盘在运行过程中突然出现故障。服务器RAID 5自动启用热备份硬盘(Hot Spare),对损坏硬盘进行逻辑替代。整个硬盘的数据访问任务仍然完整地运行在原来的读写进程序列中,应用程序和数据库没有发生影响。
通过HP自带的ACU工具查看硬盘状态进行检查,发现红灯示警的硬盘处于脱机状态。如果HP ProLiant服务器中的Raid 5有两块硬盘出现亮红灯时,表明系统已经崩溃,数据库也就不能访问,但系统不会自动关机。当第二块硬盘亮红灯后,用常规的手段是不能恢复数据的,只有付费找专业的第三方数据恢复公司恢复数据。
因此,对惠普老型号HP LH6000系列服务器来说,阵列的设计方面与现在HP ProLiant系列服务器的阵列有很多不同。就操作方法看,HP LH6000服务器的阵列操作方法有很多可选项,包括阵列失败后可以重新删除阵列并重建等,初始化也是手工选择的。但是HP ProLiant系列服务器阵列的初始化是在配置阵列后自动在后台执行的,所以ProLiant系列服务器在阵列出错后是不能重配阵列的。
HP LH6000服务器会因其他意外的原因导致阵列中的磁盘出现掉线现象,可让维护人员手工选择用Online或Offline、Rebuild等来恢复数据。但是现在的HP ProLiant系列服务器在阵列中不会再出现像老的服务器那样有磁盘掉线的现象,所以硬盘亮红灯的时候,这块硬盘基本上是损坏了需要更换。当然可以选择热插拔硬盘来重建(Rebuild),看硬盘还能不能再用一段时间。
做好技术后备
从以上两个例子可以看出,同一品牌、不同系列的服务器因其内含技术的不同,其Raid 5磁盘故障的排除也是不同的。但经过重建(Rebuild)数据后,数据被拯救了,从中可以得出以下经验:
我们认为任何先进的技术手段都不是万无一失的。如果要确保数据安全,就一定要做好备份工作,最好每天做一次数据库的异地备份。至少备用一块新硬盘。需要指出的是,加入阵列的硬盘必须大于或等于故障硬盘的容量。
如果条件允许,推荐“RAID 5+热备盘”的阵列创建方案。这样在数据丢失前,我们有两次更换硬盘的机会。对于一般的应用,只用RAID 5即可,可以同时提供数据的存取性能、可靠性和最大的磁盘空间。
管理员必须经常观察阵列的状态,包括查看磁盘阵列的**警告灯和管理软件里的驱动器状态。出现故障,及时排除。无论是什么级别的阵列,在排除故障前,都应做好数据备份。
;电脑显示英文missing mbr-helper的原因:
1、操作系统文件损坏。
2、MBR表损坏。
3、硬盘数据线松了。
4、硬盘坏了。
解决方法: 1、重新安装操作系统。 2、用U盘或光盘引导,进入PE系统,用分区软件修复MBR表(有的软件叫修复引导)。 3、检查硬盘数据线、电源线,将接头插紧,如果是线坏了就更换新的。 4、BIOS里能认到硬盘,就重装系统试下,如果重装不了,尝试重新给硬盘分区,如果分不了区,尝试低级格式化硬盘。BIOS里认不到硬盘,只能更换新硬盘了。如果你以前做的RAID 1首先你要先备份你的数据然后开机进入系统把那个坏的硬盘用新的替换掉就可以了系统后台会自动重建RAID 1其他的不需要你操作
不可行,普通状态下的硬盘模式和RAID模式下是不一样的,不管你是需要把系统单独装在一个硬盘里面,还是装在RAID里面都需要重新安装系统,然后在安装系统之前做RAID的相应设置才行,还有一点就是,你要用RAID模式就最好不要用GHOST系统,不然很容易崩的,原装镜像网上大把,随便都能下,主板驱动之类的最好上官方找或者驱动精灵之类也行,系统激活码上淘宝找个人帮忙激活一下也不过就几块钱而已。
电脑机箱主板,又叫主机板(mainboard)、系统板(systemboard)或母板(motherboard);它分为商用主板和工业主板两种。它安装在机箱内,是微机最基本的也是最重要的部件之一。主板一般为矩形电路板,上面安装了组成计算机的主要电路系统,一般有BIOS芯片、I/O控制芯片、键和面板控制开关接口、指示灯插接件、扩充插槽、主板及插卡的直流电源供电接插件等元件。
主板采用了开放式结构。主板上大都有6-15个扩展插槽,供PC机外围设备的控制卡(适配器)插接。通过更换这些插卡,可以对微机的相应子系统进行局部升级,使厂家和用户在配置机型方面有更大的灵活性。总之,主板在整个微机系统中扮演着举足轻重的角色。可以说,主板的类型和档次决定着整个微机系统的类型和档次。主板的性能影响着整个微机系统的性能。
主板(英语:Motherboard, Mainboard,简称Mobo);又称主机板、系统板、逻辑板、母板、底板等,是构成复杂电子系统例如电子计算机的中心或者主电路板。
第一个问题,建议你按如下步骤操作:
1、拔出所有驱动器(直接拔SCSI电缆,内部和外部电缆都要拔)
2、把ServeRAID 4lx阵列卡从PCI插槽上拔掉
3、启动服务器
4、进入BIOS设置并选择“Restore to BIOS defaults”,将BIOS设置恢复默认
5、保存设置并关机
(以上步骤可以清除服务器本身潜在的设置问题)
6、关机至少30秒后,重新插上SR 4lx,并开机
7、按Crtl+I进入阵列卡设置界面,依次选择“Advanced functions”=>“Restore to factory defaults”
8、保存设置并关机,同样等待30秒钟
(以上操作用以确定到底是阵列卡损坏还是存在配置错误)
9、把所有的驱动器都插回去,并开机
10、按Crtl+I进入阵列卡设置界面,选择Advanced functions”=>“Read configuration from drives”
11、检查一下是否所有的驱动器都被检测到了,同时注意看是否阵列信息是正确的(与原来的阵列形式是否一致,如RAID 1)
12、保存设置并关机
(以上步骤实际上是从磁盘读取原始的阵列信息,因为老的4lx阵列卡是将所有的阵列信息都保存在磁盘上的)
SR4系列阵列卡的这类故障通常是由于阵列卡对设置的错误执行或BIOS中PCI设备的设置错误引起的,尤为是在5x的BIOS版本下,这类错误出现的几率很高。
(以上答案参考自一个昵称是“jessie25”的外国网友的帖子,原帖内容请访问参考资料内引用的网址)
第二个问题楼上回答的很好,我就不赘述了。
raid磁盘阵列为服务器提供安全的、可靠的、可申缩的外部存储空间。但是多数的服务器使用者对raid并不是十分了解再加上服务器的广告上都太过强调了raid阵列的错容功能,使得很多服务器的使用者受到一种“raid不会出现故障”的错误引导。因此在服务器的使用过程中忽视了raid磁盘阵列的潜在风险,对服务器数据的备份或者应急预案不足,一旦服务器出现故障将为企业带来极大的影响。Raid磁盘阵列出现故障的原因通常可以归结为如下几点:
Raid控制器出现故障导致raid失效
突然断电导致raid信息故障
Raid5一块硬盘出错,系统管理员未及时更换硬盘的情况下另一块硬盘出错导致raid5失效。
壹基比小喻将为读者介绍服务器磁盘阵列中raid1、raid0、raid5三种raid形式出现故障时的数据恢复思路和方法。
1raid1阵列数据恢复
··Raid1是所有raid阵列中最为简单的一种阵列形式,raid1中两块硬盘互为镜像,所有数据都是完全一样的。如果因为raid控制器故障或者raid信息出错导致raid1磁盘阵列数据无法访问,只需要将两块硬盘中的其中一块硬盘从服务器上拆卸下来后作为单独的硬盘挂载到计算机上即可读取数据。
··如果raid1中其中一块硬盘出现故障时是不会影响服务器的正常运行的,此时需要将故障硬盘更换为正常硬盘即可。如果服务器一块硬盘故障时未能及时更换硬盘另一块硬盘也出现故障,则raid1磁盘阵列失效。此时想要进行数据恢复需要利用后出现故障的那一块硬盘进行数据恢复即可。
2raid0磁盘阵列数据恢复思路
··Raid0是所有磁盘阵列中最脆弱的磁盘阵列形式,raid0磁盘阵列没有任何冗余性能,阵列中只要有一块硬盘故障则服务器数据就会丢失,所以是一个风险极大的阵列形式。通过下图可以看出,raid0的数据是分布到每一块磁盘上的,如果服务器中任何一块硬盘出现故障都会导致服务器的数据不完整。
··对于raid0磁盘阵列的数据恢复要求数据恢复工程师对阵列中的所有数据进行重组,又由于raid0阵列已不可用,所以只能将硬盘从raid控制器中取出来作为单块硬盘进行分析和数据恢复。
如上图所示,对于单块硬盘1来说,其中的数据为A/E/I/M,硬盘2中的数据为B/F/J/N,都只是部分数据,只有把阵列中的所有硬盘数据按照A/B/C/D/E/F/G/H····这样的顺序拼接好,才能真正恢复raid0阵列中的数据。
··那么应该怎么按照顺序拼接这raid0阵列中的所有硬盘数据呢,这里需要注意两个因素,一个是raid0磁盘阵列中每个数据块的大小,也就是A或者B这些数据块所占用的扇区数;另一个因素是raid0阵列中的硬盘排列顺序,也就是说需要确定哪一块硬盘是阵列中的第一块硬盘,哪一块是第二块、第三块····
··以上图中的raid0磁盘阵列为例,我们假设数据块的大小为16个扇区,硬盘的顺序就以图中的为例,那么我们在进行数据恢复时只需要在硬盘1中提取0~15扇区的信息,再到硬盘2中提取0~15扇区信息,再到硬盘3中提取0~15个扇区的信息,再到硬盘4中提取0~15个扇区的信息,再返回到硬盘1中提取16~31扇区的信息····以此类推,就可以将这个raid0阵列里的所有数据提取出来了。
3raid5磁盘阵列数据恢复原理
··Raid5阵列中数据的分布与raid0阵列类似,与之不同的是raid5中每个平行的数据块中总有一个数据块是校验块,如下图中的p1/p2/p3/p4。Raid5支持在一块硬盘掉线的情况下保证数据的正常访问,但是如果有两块或者两块以上的硬盘同时离线,阵列便会失效,需要对磁盘阵列进行数据重组了。Raid5的数据重组方式与raid0也是相同的,只需要将硬盘中的数据按照顺序拼接好即可
··由于raid5阵列中的每一块硬盘中都有校验信息,所以分析raid5阵列时需要比raid0阵列多分析一个校验块的位置和方向。也就是说raid5阵列分析有3个因素,分别是硬盘排列顺序、每个数据块所占的扇区数、阵列中每个数据块的大小。
··以上图中的raid5阵列为例,假设该raid5阵列的数据块大小为32个扇区,盘序如图所示,那么在提取数据时只需要按照从1~4的顺序分别提取0~31扇区的信息(硬盘4中0~31扇区的信息为校验块,跳过不取),然后再返回到硬盘1中提取32~63扇区信息,以此类推,即可把所有提取出来的数据组成一个完整的raid5阵列镜像文件。
硬盘阵列错误是指分区表出现问题,引导区也出现了问题。根据查询相关资料信息,Raid模块升级或重装系统导致raid信息丢失或被重新创建,可能导致服务器数据受到严重破坏,找一些专业的数据恢复公司,帮忙恢复数据。
0条评论