请问 华为S2200T 异常掉电 阵列中的磁盘状态为离线状态 怎么把状态拉回来 revive*这个命令是没有的?

请问 华为S2200T 异常掉电 阵列中的磁盘状态为离线状态 怎么把状态拉回来 revive*这个命令是没有的?,第1张

一、磁盘阵列出现故障的过程

本次进行数据恢复的是某个网站的一个2850型号服务器,这台服务器一共安装有6块硬盘,每块硬盘的容量为300GB,服务器上层安装了linux操作系统和EXT3文件系统。在服务器运行过程中有一块硬盘因为未知原因离线,但是由于服务器的阵列级别为raid5,所以一块硬盘掉线并未影响服务器的正常运行,直到又出现一块硬盘掉线,服务器系统瘫痪。

二、强制上线操作

管理员查看阵列情况后并不能确定两块硬盘的离线顺序,只好选择其中一块硬盘尝试强制上线操作(强制上线操作具有一定风险,如进行操作需提前备份)。管理员将其中的一块硬盘强制上线后发现操作系统在启动时出现异常,为了避免损坏数据,只好将服务器关机并联系数据恢复机构进行专业修复。

三、数据恢复故障分析

在数据恢复操作中经常会遇到这类故障情况,很多管理员由于发现不及时或者第一块硬盘掉线时没有及时处理导致两块硬盘甚至多块硬盘掉线,这样阵列就会彻底崩溃。此时管理员可以对后离线的硬盘进行强制上线操作,虽然具有一定的风险但是也具有一定的可操作性行。

但是在进行强制上线时最好由经验丰富的管理员或者数据恢复工程师进行操作,以免对数据造成不可挽回的破坏,今天这个案例就是如此。

四、数据恢复过程

首先将服务器内的所有硬盘进行镜像备份,在备份过程中发现除了已经掉线的两块硬盘外,其他正常硬盘内也有存在坏道,但并没有离线所以暂不必进行特殊处理。备份后分析原raid阵列的组成结构,构建虚拟raid环境。由于管理员曾经对阵列进行强制上线操作,破坏了部分数据结构,所以需要恢复人员在验证raid结构后手工修复被破坏的那部分结构,然后导出阵列内的所有数据。这样数据就恢复成功了,只需重新搭建阵列并迁移就可以了。

五、数据恢复结论

本次数据恢复一共用时2个工作日,所有数据恢复成功。

由于RAID服务器数据恢复的复杂性和技术难度较高,在RAID服务器阵列出现故障时,一定要找有经验的专业数据恢复中心提供数据恢复帮助。判断专业数据恢复中心的标准包括数据恢复中心所使用的RAID数据恢复工具、数据恢复工程师从业经验等。因为RAID阵列中存储的数据一般都比较重要,一旦被彻底损坏,将造成无法挽回的损失 。

2009年3月,继成功突破SCIS缺陷硬盘数据恢复后,DATACOMOPASS(缩写为:DC)成功解决Raid阵列数据丢失问题,立刻引起了储存和数据恢复业界的关注。据了解,DC具备磁盘阵列标 准恢复流程,可以自动搜索阵列、分析阵列的硬盘顺序,手动、自动设置阵列参数,还能对坏扇区的磁盘、阵列卡损坏、阵列坏道等情况进行数据恢复。

在原有功能基础上,将RAID数据恢复还原功能加入了升级程序,让DC具备了完整的Raid功能:{RAID0、RAID5及最新的RAID5E、RAID5EE(IBM)、RAID ADG(HP)}。据介绍,升级后的DC具有磁盘阵列标准恢复流程,达到“自动+手动”两种可选分析模式(能够自动分析掉盘的情况、能够自动分析MBR不存在的情况、支持MBR不在0扇区的分析、支持分区链表破坏情况的分析),改变了传统的手动模式,简化了操作者的流 程和负担,让更多人掌握阵列数据恢复技术。

还针对客户推出了另一款SCSI数据恢复程序,该程序支持固件丢失、无法读取的SCSI阵列硬盘的数据恢复,该技术并已经为部分客户创造了经济效益。有需要的客户可直接与技术支持联系,通过远程协助享受效率源周到售后服务。

1、避开危险操作:切勿强行上线

在服务器的某一个硬盘出现故障时,一般服务器都会有一个Offline指示灯提示,此时要求用户更换一个完好的相同硬盘,并且重新校验算法。按理说这是非常正常的操作过程,但是殊不知很多RAID灾难就是由此而引起的。

以一个硬盘数量比较多的RAID5硬盘阵列数据恢复为例,很可能同时采购的多个硬盘中,有几个已经出现了不稳定现象。而服务器的Offline提示可能并不是最准确的,经常会误报(也有硬盘不稳定的因素)或是遗漏其它也同样存在隐患的硬盘。在看似平常的强制上线过程中,硬盘需要进行大量的读写操作,此时就是一场严峻的考验:运气好的话自然平稳度过,而运气不好就会导致其它硬盘突然掉线,此时就令问题更加棘手了。

当然,出现一个硬盘掉线提示,或是在RAID容错范围以内的掉线提示,强制上线还是必须执行的操作。但是在进行这一步前,强烈建议检测一下每个硬盘的稳定性情况,这样才更加保险。不要忽视这样一个小细节,往往这一步能够让RAID服务器免于瘫痪。

2、保证数据安全的关键:什么都不做?

对于厂商而言,所有的质保承诺仅仅局限于硬件设备,也就是说硬盘阵列故障后所引发的数据安全危机与之毫无关系,负责为用户更换或者维修已经算是“克尽职守”。但是用户所需要的并不是找回硬盘或是重建RAID,而是“无可复制”的数据。如果寻找整机厂商,此时无异于“自讨苦吃”,因为所谓的售后服务根本没有从用户的本源需求出发,尽快确保硬件设备完好反而牺牲了数据。当然,知名品牌的服务器厂商或是代理商会主动选择为大客户的RAID阵列数据恢复服务费“埋单”,但是这也仅仅是个别情况。

据介绍,因为寻找服务商的售后服务工程师修复而导致最终数据彻底破坏的案例几乎每个星期都会发生。毕竟售后服务工程师基本都偏向于硬件本身,而面对以软件类操作为主的RAID阵列数据恢复也略显不足。

此外,即便是简单的检验性操作,也有可能为后期的阵列数据恢复带来不便。以普通RAID5硬盘阵列数据恢复为例,当硬盘损坏超过容错能力时,必须将损坏硬盘的镜像完全提取才能进行最终的阵列数据恢复。而如果频繁对硬盘上电,很容易造成磁头进一步疲劳损伤,甚至划伤盘片。面对这种数据安全问题时,正确的处理方法应当是立即咨询专业数据恢复服务商。

3、硬盘阵列数据恢复捷径:寻求专业数据恢复服务商帮助

根据有关资料显示,很多数据恢复失败的案例都是因为用户采取了并不正确的解决途径。如一些服务器售后服务,他们在处理这类阵列数据恢复案例中,轻易选择重建,导致数据丢失情况更加严重,这也是企业数据安全管理人员在面对重大服务器阵列数据恢复时应该注意的问题。

此外,在选择数据恢复服务商时,根据规模以及业界口碑来判断是一条可行的捷径。比如效率源(国际)科技,加盟商服务网点遍及全国,有着深厚的积累,能够帮助遭遇RAID阵列数据灾难的用户及时度过难关,专业的数据恢复人员进行服务器硬盘阵列数据恢复。

解决方法:创建每一块成员盘的物理镜像,然后分析raid的类型,条带大小等参数,用恢复软件重组raid,提取数据。比较简单的做法是买一块同样的阵列卡,从硬盘加载阵列配置,可以直接搞定。

华为技术有限公司是一家生产销售通信设备的民营通信科技公司,由任正非于1987年创立,总部位于中国广东省深圳市龙岗区。

从技术的角度来看,RAID恢复服务提供商不仅需要具备包括原先的5种(或者6种,如果包括RAID 0或者无RAID保护)基本的RAID阵列级别或者技术的能力,而且需要具备RAID 5E、RAID 5EE、RAID 6、RAID 10、RAID 50、RAID 51、RAID 60以及RAID ADG等其它级别的能力。这些RAID级别可以利用多个连接和磁盘驱动器的类型以及各种各样的以太网连接。技术挑战之外就是由服务器和存储系统厂商以及有些介质制造商带来的RAID技术的变化。 1、找一家支持您的硬件的RAID恢复服务。底线是你需要详述受损的RAID集的特性:部件的型号和生产商、RAID软件的固件版本、驱动器的大小和型号、连接的类型、使用的操作系统、甚至把数据写入存储的可能的业务应用程序。然后你需要找一家对你现有的配置有经验的服务提供商。  2、了解RAID故障的原因。不要接受厂商有时会做出的有关“RAID故障的四个基本原因”的简单的保证。尽管由于硬件RAID故障、软件RAID故障、人为错误以及应用程序错误,的确出现RAID系统中断,但是对根本原因的分类的了解并不代表把数据从受损的RAID集进行恢复的能力。  3、寻求认证的RAID恢复服务提供商。如果服务提供商具备恢复服务的基本实践方面的认证,例如国际标准ISO 4级、美国联邦标准10级的洁净室认证(Cleanroom Certification)(管控执行工作的设施中悬浮粒子污染等级,如果工作是在服务提供商的公司执行)、遵从敏感数据资产安全处理的SSAE 16 Type II审计准则以及可能适用你的数据的性质以及法律/监管规定的数据保存和保护要求的其它认证,这通常是一个好兆头。你也应该从硬件厂商寻求你的RAID系统基于的设备或者软件的认证。  4、条款清晰的合同是关键。寻找详述提供服务的内容以及预期结果的时间跨度的简洁易懂的合同。您可能喜欢在开始时有一个诊断的步骤,以查明你的数据是否完全可恢复。这最好是一项免费的服务,因为实际的恢复可能价格高昂,尤其对于SAN或者对于某些把内容寻址(content-addressable)存储算法与RAID进行组合的系统。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 请问 华为S2200T 异常掉电 阵列中的磁盘状态为离线状态 怎么把状态拉回来 revive*这个命令是没有的?

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情