数据库服务器与磁盘阵列问题,急!!!!!
在盘阵开着的情况下,重启下服务器,开机可能会自检,若没有扫描磁盘,启动后在磁盘管理里对盘阵分区做下差错扫描。属性-工具-差错-开始检查(扫描并修复)。这样应该就可以了,但有些数据可能在上一次先关闭盘阵中丢失。。。祝你好运!
应该是那块硬盘离线了
可能是逻辑性的:重新复原一次,如果不能恢复,就可能是物理故障,需要更换硬盘
如果你对这些技术比较熟练,可以自己操作,否则请找专业的人员吧
万一操作失误可能会损失里面所有的数据
这个时候我要看你做的是哪一类型的阵列,如果是1系列这恢复的可能性不是特别大,只能通过扫盘。但如果你做的是阵列5,那么可以通过读取阵列的形式交数据重新恢复,但是需要整理。和少盘的这个速度数据是差不多的。在网上有详细的这个恢复教程和详细的过程,建议对你的服务器配备一个UPS。防止下一次出现同类型的问题。
由于某些不可避免的客观原因,可能会造成一些磁盘阵列故障,如果是逻辑故障,可以通过有针对性的技术修复,恢复硬盘的在线状态。 在网络平台的搭建过程中,基于数据资源应用的可靠性与安全性考虑,通常会对服务器的硬盘进行阵列化处理,形成依托RAID 5技术(Redundant Array Inexpensive Disk,廉价磁盘冗余)的数据保护与管理体系是目前广泛采用的做法。
但实际应用中,由于某些不可避免的客观原因,可能会造成一些阵列故障,最常出现的状况就是硬盘出现自行脱机,联机状态改变为DDD (Defunct Disk Drive),硬盘出现物理故障或逻辑故障。如果是物理故障,只有进行硬盘更换。需要指出的是: 加入阵列的硬盘必须大于或等于故障硬盘的容量。如果是逻辑故障,可以通过有针对性的技术修复,恢复硬盘的在线状态,继续保持其原始阵列中的硬盘数据条带化分布状态,延续数据存储体系的一致性。
笔者所在单位有一台运行远程教学系统的服务器(IBM Xseris 235),由6块1468GB热插拔硬盘,通过RAID卡(IBM ServerRAID 5i)配置成一台具有RAID 5级的磁盘阵列。其中一块硬盘在运行过程中突然出现上述故障。进入IBM ServerRAID Mini Configuration模块进行检查,发现红灯示警的硬盘已被系统标示成DDD,处于脱机状态。服务器RAID 5功能自动启用热备份硬盘(Hot Spare),对损坏硬盘进行逻辑替代,整个硬盘的数据访问任务仍然完整地运行在原来的读写进程序列中。网络教学发布的相关应用没有受到任何影响。由于RAID 5硬盘架构支持热插拔,于是将磁盘卸载下来,委托IBM进行技术鉴定。确认该盘出现了逻辑故障,通常这种故障是由于阵列的配置信息发生变化所引起的。
具体的硬盘修复及其数据恢复,可以归纳为以下两个环节:
第一, 对服务器系统进行微码升级,搭建RIAD支撑环境
进入阵列硬盘逻辑故障修复之前,首先需要对RAID 5体系的驱动微码进行升级,作为最低级别的软件,微码直接影响着硬件的操作。它从逻辑上位于操作系统之下,驻留在计算机设备的只读内存(ROM)中。服务器中的很多系统部件和硬件设备都需要微码驱动。通过微码更新,可以在很大程度上提升硬件的综合性能。刷新服务器微码,旨在保证RAID 5体系的硬件驱动条件基于当前最新版本。全面地融合最新功能补丁,从而具备完整的服务器功能支持。
登录IBM网站,下载最新x235 - BIOS升级程序: rawriteexe和42c5655img,具体操作步骤如下:
● 将rawriteexe和驱动都拷到C盘根目录下。
● 在Windows的命令提示符程序中,运行cd\回到C盘根目录下,敲入c:\rawrite回车,后续操作如下:
c:\Enter disk image Source file name(输入42c5655img并回车);
c:\Enter target diskette drive(输入a并回车)
c:\Please insert a formatted diskette into drive A: and press ―Enter-:(插入格式化好的软盘并回车)
直到屏幕出现C:\标识符,微码升级盘制作完毕。
● 将上面做好的升级盘放到软驱A中,重启系统。
● 系统会从软驱中的升级盘启动,然后自动进入刷新界面,出现几种刷新形式的菜单,从几种形式中选择一个,选1 - Update POST/BIOS。
● 屏幕提示,是否要把当前的代码备份到本地的ROM时,如果选择Y,当前的POST/BIOS代码会被立刻保存在ROM中,不需要保存就选N。
● 如果当前系统的POST/BIOS支持Asset Tag feature,刷新程序还会提示是否要更改,如果需要更改,就选择Y,程序会要求输入一个新的号码,否则就选N。
● 接下来还会询问是否要把当前版本的POST/BIOS保存到磁盘,如果需要保存就选Y,然后插入一个格式化好的软盘,否则选择N。
● 然后,会提醒是否继续刷新POST/BIOS,如果选择Y,系统将用新代码刷新系统,整个刷新过程完成后,系统自动重启。
● BIOS升级后系统第一次启动时,选择F1进入Setup Utility,选择Load Optimized Defaults,再选择Save & Exit Setup,最后,在提示“Save to CMOS and Exit(Y/N)”时,按Y接受保存即完成POST/BIOS升级。
至此,服务器微码升级结束。但要注意,在整个BIOS刷新过程中必须保证服务器不能中途断电。
第二, 制作RAID 5引导盘,还原磁盘阵列系统的原始配置
运行RAID 5 的服务器在进行系统安装之前,必须制作与阵列卡运行版本相对应的驱动程序引导盘。除了用以实现服务器加载和初始化磁盘阵列之外,另一个重要用途就是在丢失阵列信息的情况下,对出现逻辑故障的硬盘,进行RAID 5阵列原始逻辑配置的还原。该盘制作步骤如下:
● 插入系统光盘IBM ServerGuide Driver Repository(购买服务器时随机配送),选择Hard disk adapters,点击Next。
● 选择IBM ServeRAID Adapter,点击Next。
● 选择IBM ServeRAID Support for Microsoft Windows Server2003,点击Next。
● 插入格式化好的144MB软盘,点击Next。
至此,RIAD引导盘制作完毕。
重启服务器,进入IBM ServerRAID Mini Configuration模块,在主菜单中选择Advanced Function,进入下一级菜单copy the configuration from drives to the controller插入制作好的RAID引导盘,按提示键入Y确定。
进入view logical driver status 可以看到,系统表示为DDD的硬盘已经被系统修复成HPS(热备份盘),原来的热备份盘被置换成ONL(联机硬盘)。RAID 5重新恢复了原有的系统机制。
从来不喜欢复制粘贴,不过你这个问题就是给别人粘贴的嘛,我给个现有的资料你:
RAID--磁盘阵列概念详解
概述:
RAID是英文Redundant Array of Inexpensive Disks的缩写,中文译作廉价冗余磁盘阵列,简称磁盘阵列。简单的说,RAID是一种把多块独立的硬盘(物理硬盘)按不同方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据冗余的技术。在这一组硬盘中,数据按照不同的算法分别存储于每块硬盘上从而达到不同的效果这样就形成了不同的RAID级别(RAID LEVEL)。
按照RAID级别划分,常见的有RAID0,RAID1,RAID3,RAID5, RAID10,RAID50还有不常用的RAID2, RAID4,RAID6,RAID7以及硬件厂商自己定义的RAID如惠普Smart Array阵列卡实现的RAID ADG和IBM的RAID 5E。
RAID 0 (定义,优势,弱点,适用范围,使用技巧)
定义:
RAID 0是由一块以上的硬盘组成,每块硬盘被等分成容量相同的条带集,数据也被分割成条带,在同一时间内向多块磁盘写入。
优势:读写性能快
如果是四块硬盘做RAID0,系统向逻辑设备发出的I/O指令会被转化为4项操作,其中的每一项操作都对应于一块硬盘,通过建立带区集,原先顺序写入的数据被分散到所有的四块硬盘中同时进行读写。四块硬盘的并行操作使同一时间内磁盘读写的速度提升了4倍。四块硬盘组合在一起形成一个独立的逻辑驱动器,容量相当于任何任何一块单独硬盘的4倍。
弱点:数据安全性差
需要注意的是:这种 RAID 级别不具有容错性能,如果阵列中的任何一块磁盘出现故障,整个阵列中的数据都将会受到破坏,无法继续使用。从上面这个例子来说,此时使用RAID 0方式的安全性仅相当于单独使用一块硬盘的1/4(因为本例中RAID 0使用了4块硬盘)。
推荐适用范围:
• 视频处理
• 图像编辑
• 视频点播
使用技巧:
在创建带区集时,合理的选择带区的大小非常重要。如果带区过大,可能一块磁盘上的带区空间就可以满足大部分的I/O操作,使数据的读写仍然只局限在少数的一、两块硬盘上,不能充分的发挥出并行操作的优势。另一方面,如果带区过小,任何I/O指令都可能引发大量的读写操作,占用过多的控制器总线带宽。因此,在创建带区集时,我们应当根据实际应用的需要,慎重的选择带区的大小。
RAID 1 (定义,优势,弱点,适用范围,使用技巧)
定义:
RAID 1又被称为磁盘镜像,由两个以上偶数个硬盘组成,每一个磁盘都具有一个对应的镜像盘,对写入任何一个磁盘的数据都会被复制镜像盘中,同时系统可以从这一组镜像盘中的任何一个磁盘读取数据。
优势:数据安全性高
RAID 1下,任何一块硬盘的故障都不会影响到系统的正常运行,而且只要能够保证任何一对镜像盘中至少有一块磁盘可以使用,RAID 1甚至可以在一半数量的硬盘出现问题时不间断的工作。当一块硬盘失效时,系统会忽略该硬盘,转而使用剩余的镜像盘读写数据。
弱点:磁盘利用率较低
显然,磁盘镜像肯定会提高系统成本。因为我们所能使用的空间只是所有磁盘容量总和的一半。
适用范围:
• 数据库服务器
• 文件服务器
使用技巧:
通常,我们把出现硬盘故障的RAID系统称为在降级模式下运行。虽然这时保存的数据仍然可以继续使用,但是RAID系统将不再可靠。如果剩余的镜像盘也出现问题,那么整个系统就会崩溃。因此,我们应当及时的更换损坏的硬盘,避免出现新的问题。更换新盘之后,原有好盘中的数据必须被复制到新盘中。这一操作被称为同步镜像。同步镜像一般都需要很长时间,尤其是当损害的硬盘的容量很大时更是如此。在同步镜像的进行过程中,外界对数据的访问不会受到影响,但是由于复制数据需要占用一部分的带宽,所以可能会使整个系统的性能有所下降。
RAID 3 (定义,优势,弱点,适用范围,使用技巧)
定义:
RAID3至少由三块以上硬盘组成,以其中一块特定的硬盘来存放数据的奇偶校验位(由真实数据通过一定的算法得出),真实数据则分段存储于其余硬盘中。
优势:有冗余,硬盘利用率高
如果数据盘(物理)损坏,只要将坏硬盘换掉,RAID控制系统则会根据校验盘的数据校验位在新盘中重建坏盘上的数据。利用单独的校验盘来保护数据虽然没有镜像的安全性高,但是硬盘利用率得到了很大的提高,为(N-1)/N 其中N为RAID中硬盘的个数。
弱点:读写性能差
当向RAID 3写入数据时,情况会变得复杂一些。即使我们只是向一个磁盘写入一个数据块,也必须计算与该数据块同处一个带区的所有数据块的校验值,并将新值重新写入到校验块中。由此我们可以看出,一个写入操作事实上包含了数据读取(读取带区中的关联数据块),校验值计算,数据块写入和校验块写入四个过程。读写性能尤其是写性能大大降低。
RAID 3所存在的最大一个不足同时也是导致RAID 3很少被人们采用的原因就是校验盘很容易成为整个系统的瓶颈。我们已经知道RAID 3会把数据的写入操作分散到多个磁盘上进行,然而不管是向哪一个数据盘写入数据,都需要同时重写校验盘中的相关信息。因此,对于那些经常需要执行大量写入操作的应用来说,校验盘的负载将会很大,无法满足程序的运行速度,从而导致整个RAID系统性能的下降。鉴于这种原因,RAID 3更加适合应用于那些写入操作较少,读取操作较多的应用环境,例如数据库和WEB服务器等。
适用范围:
• 流媒体
• 视频点播
• WEB服务器
• FTP服务器
使用技巧:
RAID 3虽然具有容错能力,当一块硬盘出现故障时,RAID系统在降级模式下的运行情况。该磁盘上的所有数据块必须使用校验信息重新建立。此时如果我们是从好盘中读取数据块,不会有任何变化。但是如果我们所要读取的数据块正好位于已经损坏的磁盘,则必须同时读取同一带区中的所有其它数据块,并根据校验值重建丢失的数据,整个系统的性能会受到严重的影响。当我们更换了损坏的磁盘之后,系统必须一个数据块一个数据块的重建坏盘中的数据。整个过程包括读取带区,计算丢失的数据块和向新盘写入新的数据块,都是在后台自动进行。因此,如果有硬盘损坏必须及时更换,并且重建活动最好是在RAID系统空闲的时候进行。
RAID 5 (定义,优势,弱点,适用范围,使用技巧)
定义:
RAID5是在RAID 3的基础上进行了一些改进,同样也是由三块以上的硬盘组成,也是以数据的校验位来保证数据的安全,但它不是以特定硬盘来存放数据的校验位,而是将数据段的校验位交互存放于各个硬盘上。
优势:克服RAID3校验盘性能问题,有冗余,硬盘利用率高
如果数据盘(物理)损坏,只要将坏硬盘换掉,RAID控制系统则会根据校验盘的数据校验位在新盘中重建坏盘上的数据。利用单独的校验盘来保护数据虽然没有镜像的安全性高,但是硬盘利用率得到了很大的提高,为(N-1)/N 其中N为RAID中硬盘的个数。
弱点:读写性能差
当向RAID 5写入数据时,情况会变得复杂一些。即使我们只是向一个磁盘写入一个数据块,也必须计算与该数据块同处一个带区的所有数据块的校验值,并将新值重新写入到校验块中。由此我们可以看出,一个写入操作事实上包含了数据读取(读取带区中的关联数据块),校验值计算,数据块写入和校验块写入四个过程。读写性能尤其是写性能大大降低。
适用范围:
• 文件和应用服务器
• 数据库服务器
• WEB,Email服务器
• 局域网服务器
• 使用范围较广
使用技巧:
RAID 5虽然具有容错能力,当一块硬盘出现故障时,RAID系统在降级模式下的运行情况。该磁盘上的所有数据块必须使用校验信息重新建立。此时如果我们是从好盘中读取数据块,不会有任何变化。但是如果我们所要读取的数据块正好位于已经损坏的磁盘,则必须同时读取同一带区中的所有其它数据块,并根据校验值重建丢失的数据,整个系统的性能会受到严重的影响。当我们更换了损坏的磁盘之后,系统必须一个数据块一个数据块的重建坏盘中的数据。整个过程包括读取带区,计算丢失的数据块和向新盘写入新的数据块,都是在后台自动进行。因此,如果有硬盘损坏必须及时更换,并且重建活动最好是在RAID系统空闲的时候进行。
RAID 10
RAID10也被称为镜象阵列条带由至少四块硬盘组成,象RAID0一样,数据被分割成条带,在同一时间内向多块磁盘写入;象RAID1一样,每个磁盘都有一个镜象磁盘。其目的是在保证数据安全的情况下,提高数据的读写性能。
RAID 50
RAID50也被称为镜象阵列条带由至少六块硬盘组成,象RAID0一样,数据被分割成条带,在同一时间内向多块磁盘写入;象RAID5一样,也是以数据的校验位来保证数据的安全。其目的在于提高RAID5的读写性能。
RAID 2
RAID2又被称为带海明码校验磁盘阵列,是为大型机和超级计算机开发的。磁盘驱动器组中的第一个、第二个、第四个……第2的n次幂个磁盘驱动器是专门的校验盘,用于校验和纠错,例如七个磁盘驱动器的RAID2,第一、二、四个磁盘驱动器是纠错盘,其余的用于存放数据。使用的磁盘驱动器越多,校验盘在其中占的百分比越少。RAID2对大数据量的输入输出有很高的性能,但少量数据的输入输出时性能不好。RAID2很少实际使用。
由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码ECC码的硬盘,对于控制器的设计来说,它又比RAID3,4或5要简单。但是利用海明码校验必须要付出数据冗余的代价。
RAID 4
RAID4和RAID3很相似,不同的是RAID4对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。 RAID3是一次一横条,而RAID4一次一竖条。所以RAID3常须访问阵列中所有的硬盘驱动器,而RAID4只须访问有用的硬盘驱动器。这样读数据的速度大大提高了,但在写数据方面,需将从数据硬盘驱动器和校验硬盘驱动器中恢复出的旧数据与新数据通过异或运算,然后再将更新后的数据和检验位写入硬盘驱动器,所以处理时间较RAID3长。
RAID 6
几乎没有进行商用。它使用一种分配在不同的驱动器上的第二种奇偶方案,扩展了RAID 5。它能承受多个驱动器同时出现故障,但是,性能尤其是写操作却很差,而且,系统需要一个极为复杂的控制器。当然由于引入了第二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载。
IBM RAID 5E
RAID 5E是在 RAID 5级别基础上的改进,与RAID 5类似,数据的校验信息均匀分布在各硬盘上,但是,在每个硬盘上都保留了一部分未使用的空间,这部分空间没有进行条带化,最多允许两块物理硬盘出现故障。看起来,RAID 5E和RAID 5加一块热备盘好象差不多,其实由于RAID 5E是把数据分布在所有的硬盘上,性能会比RAID5 加一块热备盘要好。当一块硬盘出现故障时,有故障硬盘上的数据会被压缩到其它硬盘上未使用的空间,逻辑盘保持RAID 5级别。
0条评论