什么是容错备份系统和灾难备份系统?谢谢..

什么是容错备份系统和灾难备份系统?谢谢..,第1张

容错是用冗余的资源使计算机具有容忍故障的能力,即在产生故障的情况下,仍有能力将指定的算法继续完成。

容错的基本思想首先来自于硬件容错,1950-1970年,硬件容错在理论和应用上都有重大的发展,目前已成为一种成熟的技术并应用到实际系统中,如双CPU,双电源等,军事上出现了容错计算机;软件容错的基本思想是从硬件容错中引伸过来的,70年代中期开始认识到软件容错的潜在作用;数据容错的策略即数据备份;网络容错将硬件容错和软件容错两方面的技术融合在一起并有新的发展。

容错技术是指在一定程度上容忍故障的技术,也称为故障掩盖技术(fault masking)。采用容错技术的系统称容错系统。

容错主要依靠冗余设计来实现,它以增加资源的办法换取可靠性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。

硬件冗余是通过硬件的重复使用来获得容错能力。

软件冗余的基本思想是用多个不同软件执行同一功能,利用软件设计差异来实现容错。

信息冗余是利用在数据中外加的一部分信息位来检测或纠正信息在运算或传输中的错误而达到容错。在通信和计算机系统中,常用的可靠性编码包括:奇偶校验码、循环冗余码CRC、汉明码等。

时间冗余是通过消耗时间资源来实现容错,其基本思想是重复运算以检测故障。按照重复运算是在指令级还是程序级分为指令复执程序复算。指令复执当指令执行的结果送到目的地址中,如果这时有错误恢复请求信号,则重新执行该指令。程序复算常用程序滚回技术。例如将机器运行的某一时刻称作检查点,此时检查系统运行的状态是否正确,不论正确与否,都将这一状态存储起来,一旦发现运行故障,就返回到最近一次正确的检查点重新运行。

冗余设计可以是元器件级的冗余设计,也可以是部件级的、分系统级的、或系统级的冗余设计。冗余要消耗资源,应当在可靠性与资源消耗之间进行权衡和折衷。

容错系统工作过程包括自动侦测、自动切换、自动恢复。

(1)自动侦测(Auto-Detect)

运行中自动地通过专用的冗余侦测线路和软件判断系统运行情况,检测冗余系统各冗余单元是否存在故障(包括硬件单元或软件单元),发现可能的错误和故障,进行判断与分析。确认主机出错后,启动后备系统。

侦测程序需要检查主机硬件(处理器与外设部件)、主机网络、操作系统、数据库、重要应用程序、外部存储子系统(如磁盘阵列)等。

为了保证侦测的正确性,防止错误判断,系统可以设置安全侦测时间、侦测时间间隔、侦测次数等安全系数,通过冗余通信连线,收集并记录这些数据,作出分析处理。

数据可信是切换的基础。

(2)自动切换(Auto-Switch)

当确认某一主机出错时,正常主机除了保证自身原来的任务继续运行外,将根据各种不同的容错后备模式,接管预先设定的后备作业程序,进行后续程序及服务。

系统的接管工作包括文件系统、数据库、系统环境(操作系统平台)、网络地址和应用程序等。

如果不能确定系统出错,容错监控中心通过与管理者交互,进行有效的处理,决定切换基础、条件、时延、断点。

(3)自动恢复(Auto-Recovery)

故障主机被替换后,进行故障隔离,离线进行故障修复。修复后通过冗余通信线与正常主机连线,继而将原来的工作程序和磁盘上的数据自动切换回修复完成的主机上。这个自动完成的恢复过程用户可以预先设置,也可以设置为半自动或不恢复。

例如网络容错。电话线作为数据专线的备份,服务器采用双机磁盘镜像、双网卡方式实现双网络备份。应用具有容错功能的网络设备,如3COM的交换机,CISCO的路由器,MOTORLA的调制解调器等都具有容错功能。

灾难备份,是指利用技术、管理手段以及相关资源,确保已有的关键数据和关键业务在灾难发生后在确定的时间内可以恢复和继续运营的过程。“灾难备份所防范的‘灾难’,包罗万象,包括地震、火灾、水灾等自然灾难,以及战争、恐怖袭击、网络攻击、设备系统故障和人为破坏等无法预料的突发事件,可谓‘天灾人祸无所不包’。”“诸如地震、火灾等天灾人祸,是永远无法彻底避免的。一系列已发生的突发事件表明,如果没有一定的应急响应能力,突发事件将给我们社会或生活带来灾难性的后果;加强灾难备份和应急响应建设,就可以有效减少灾难所带来的社会成本和压力。它是应对紧急事件、保护信息的相应的防范、化解与控制措施,是保障业务连续性的重要环节,灾难备份中心与数据中心不一样

适当的服务器备份方法可以最大限度地减少备份数据占用的存储空间,减少对计算资源和网络带宽使用的影响,从而保证数据安全,并在灾难发生后尽可能快速轻松地恢复数据。。以下是一些服务器备份方法,以及一些可操作的正确服务器备份建议。

1完全备份完整备份是最简单的备份形式,包含所有需要备份的文件夹和文件。。我们通常会压缩文件大小以节省空间,但即使压缩文件大小,完整备份也会占用大量存储空间。。对备份磁盘的大量访问还需要额外的网络带宽资源。完整备份的优点是易于恢复。。数据恢复更快更容易,因为完整的数据随时可用。。完整备份是所有备份方法中最全面的。。然而,这样的操作往往需要很多时间。

2增量备份由于“完整备份”需要很长时间,我们可能需要“增量备份”来减少执行备份所需的时间。增量备份,仅备份自上次备份以来更改的数据。。例如:假设在星期一进行了完整备份,则可以在星期二执行增量备份以备份自星期一以来已更改的文件。。在星期三,对自星期二以来已更改的文件执行另一次增量备份。。由于每次增量备份的数据量都比较小,可以节省存储空间,减少网络带宽。。它还允许保留同一文件的多个版本。

3差异备份差异备份,介于“完全备份”和“增量备份”之间。。差异备份是在完整备份和差异备份之间添加或修改的文件的备份。差异备份本质上是自上次完整备份以来所做的所有更改的累积备份。。恢复“差异备份”比恢复“增量备份”更快,并且只需要最后一次完整备份和最后一次差异备份即可创建完整恢复。。如果要节省存储空间,可以设置差异备份覆盖上次的差异备份。。与增量备份一样,差异备份需要额外的网络带宽来比较当前文件和备份文件,以便仅查找和备份更改的文件。

4镜像备份基于映像的备份允许创建整个系统(一个或多个分区)的完整磁盘备份。操作系统、应用程序以及与之关联的所有数据,而不仅仅是文件和文件夹。。备份保存为称为“图像”的文件。当您需要恢复整个系统时,镜像备份是最快的恢复选项。。它在灾难恢复方面非常有效。。可以选择将整个服务器恢复到与新服务器完全相同的状态,即使服务器具有不同的硬件。。还可以从基于映像的备份中恢复单个文件,而无需恢复整个系统。。备份图像可以保存到各种不同的媒体,为您提供额外的备份副本。

超融合的本质是虚拟化+分布式存储,集群构建时就会配置副本策略,双活、备份等高级功能并不属于必须项,但目前大部分超融合也都会提供相关的服务,是否配置看业务需要吧。具体来说,主流的超融合数据保护机制包括以下六种:

多副本:同一份数据会保存多份(通常设置为 2 副本或 3 副本),即使副本所在的节点宕机也不会造成数据丢失;

HA(高可用):节点宕机时,该节点上的虚拟机自动迁移至集群内其它节点,降低业务中断时间;

机架感知:根据机房物理拓扑结构,将副本分配在不同的机架、机箱、主机上,有效减少甚至避免物理硬件(电源、交换机等)故障导致的数据丢失。理论上,3 副本结合机架感知配置,系统可最多容忍 2 个机架上的主机全部失效;

快照:为虚拟机打快照,在其发生故障时将数据恢复至快照状态;

双活:同城双数据中心,灾难时无损快速恢复业务(RPO=0);

备份:异地主备数据中心,灾难时尽可能挽回数据损失。

目录

一、灾备的定义

灾备指的是用现有的科学技术手段和方法,提前建立起可靠的应急方式,来应对突发事件的发生。

灾备包括容灾系统和备份系统。

备份: 保障数据的安全性 ,备份指的是将全部或部分数据集合从生产主机硬盘或阵列中保存到其他的存储介质的过程。

容灾: 保障业务的连续性 ,容灾指的是在较远的异地建立两套或者多套相同的、包含完整基础设施(计算、网络、存储、电力制冷等)的IT系统,通过网络的方式实现数据的传输,当主数据中心发生故障,可以利用备数据中心快速恢复业务。

保护对象 :备份保护的是 数据 ,容灾保护的是 业务连续性 。

实现方式 :备份采用备份软件技术实现,而容灾通过复制或者镜像软件实现。

时间周期: 数据保护的周期不一致,复制或者镜像的时间周期更短。

补充:归档使用的是备份。

只有备份:

如果只有备份,业务无法快速恢复,数据恢复需要时间,这段时间对某些行业带来的损失是无法估量的。另外,备份一般是周期性执行的,一旦发生数据丢失,从恢复复时间到上次备份时间之间的数据就会丢失。

只有容灾:

如果只有容灾,业务可以快速恢复,数据也可以被保护,但是生产段有错误的操作,或者系统升级失败之类的,也会被同步到容灾端,从而造成业务的中断。

(数据是无价的,丢了的话问题很大哇!)

云服务器备份服务(CSBS): Cloud Server Backup Service,为云服务器提供整机备份功能,支持基于多云硬盘一致性快照技术的本地备份,以及对备份数据的远程复制,并支持利用备份数据恢复云服务器数据,最大限度保障用户数据的安全性和正确性,确保业务安全。

云硬盘备份服务(VBS): Volume Backup Service,基于云硬盘的备份服务。用户可为云硬盘创建备份,利用备份数据回滚云硬盘,以最大限度保证用户数据正确性和安全性。

同步复制: 实时同步进行复制。

异步复制: 异步复制数据,数据一致性有待商榷。

本地生产中心:

同城容灾方案(<100km):

异地容灾方案(>100km):

优点:

本地高可用: 本地高可用通常为近距离的同一个机房内,使用 实时镜像 和 同步复制 的方案,由于带宽和距离很近,通常要求RPO=0。

优点:

关键技术: HyperReplication

优点:

关键技术: HyperMetro

补充:

备份窗口 :它指用户正常使用业务系统不受影响的情况下,能够对业务系统中的业务数据进行数据备份的时间间隔,或者说是用于备份的时间段。

完全备份: 又叫全量备份,对某一时间点上的所有数据的一个完全拷贝。备份发起后变更的数据将在下一次进行备份,又称为全量备份。

累积增量式备份: 以上一次完全备份为基准 进行备份,若之前从未进行过备份,则备份所有数据。

差异增量式备份: 以上一次备份为基准 进行备份,若之前从未进行过备份,则备份所有文件。

恢复点目标(RPO): 当业务发生故障时,可以容忍 数据丢失的数量 ,单位为时间。

举例:8点进行备份,9点丢数据,RPO=1小时,丢了一个小时的数据。

恢复时间目标(RTO): 当业务发生故障时,可以容忍 业务中断的时间 ,单位为时间。

举例:比如灾难发生后半天内需要恢复数据,那么RTO就是12小时。

RTO/RPO 与灾难恢复能力等级关系(GB/T 20988-2007)

这个在备份组网那一块再详细补充

这里参考:图解三种备份方式(LAN,LAN free,Server free)_star&storage的技术博客_51CTO博客

LAN-Base,这种方式很简单,直接在生产服务器上安装备份代理,部署一台备份服务器,这样即可完成备份,不过这种方式不适合数据量非常大的环境。因为如果备份数据量非常大,会占用以太网的带宽,虽然说备份操作一般在晚上进行。但是这种方式还是不适合大数据量的情况。因此有了LAN-Free备份。

LAN-Free,顾名思义,即释放了LAN的压力。如上图所示,数据流直接从File server经过FC switch备份到Tape,而不经过Lan,这样就不会占用主网络的带宽。但是数据仍然会通过文件服务器的本地磁盘--内存—FC switch这步,因此仍然会消耗File server的资源。因此有了下面的Server Free备份来尽可能的减少生产服务器的压力。

Server-Free,即备份时数据不流经服务器的总线和内存,如上图,文件服务器使用SAN的File Server Storage空间,现在需要备份文件服务器,则只需将File Server Storage的数据直接备份到Tape。此时文件服务器只需要发出SCSI扩展复制命令,剩下的事情就是File Server Storage和Tape之间的事情了,这样就减轻了文件服务器的很多压力,使它可以专注于对外提供文件服务,而不需要再消耗大量CPU、内存、IO在备份的事情上了。

或者还有一种方式即NDMP,Network Data Management Protocol,网络数据管理协议。它是一种支持智能数据存储设备、磁带库设备及备份应用程序之间互相通信以完成备份过程的通信协议。服务器只要向支持NDMP协议的存储设备发送NDMP指令,即可让存储设备将其自己的数据直接发送到其他设备上,而不需要流经服务器主机。

主机层数据复制: 在生产中心和灾备中心的服务器上安装专用的数据复制软件,如卷复制软件,以实现远程复制功能。两中心间必须有网络连接作为数据通道。可以在服务器层增加应用远程切换功能软件,从而构成完整的应用级容灾方案。这种数据复制方式相对投入较少,主要是软件的采购成本;兼容性较好,可以兼容不同品牌的服务器和存储设备,较适合硬件组成复杂的用户。但这种方式要在服务器上通过软件来实现同步操作,占用主机资源和网络资源非常大。

网络层数据复制: 在生产中心和灾备中心的服务器上安装专用的数据复制软件,如卷复制软件,以实现远程复制功能。两中心间必须有网络连接作为数据通道。可以在服务器层增加应用远程切换功能软件,从而构成完整的应用级容灾方案。这种数据复制方式相对投入较少,主要是软件的采购成本;兼容性较好,可以兼容不同品牌的服务器和存储设备,较适合硬件组成复杂的用户。但这种方式要在服务器上通过软件来实现同步操作,占用主机资源和网络资源非常大。

存储层数据复制: 要实现数据的复制需要在生产中心和灾备中心都部署一套这样的存储系统,数据复制功能由存储系统实现。如果距离比较近(几十公里之内),之间的链路可由两中心的存储交换机通过光纤直接连接;如果距离在200公里内,可通过增加DWDM等设备直接进行光纤连接;超过200公里,则可增加存储路由器进行协议转换途径WAN或Internet实现连接。因此,从理论上可实现无限制连接。在存储层实现数据复制功能是很成熟的技术,而且对应用服务器的性能基本没有影响。目前,这种容灾方案稳定性高、对服务器性能基本无影响,是容灾方案的主流选择。

本文作者:SkyBiuBiu

本文链接:https://wwwcnblogscom/Skybiubiu/p/14992848html

异地容灾,顾名思义就是在不同的地方(异地:可以是同城的两个不同的机房或者是两座不同的城市),构建一套或者多套相同的应用或者数据库,进一步提高了数据抵抗各种可能安全因素的容灾能力,可以对企业应用和数据库起到安全性、连续性等方面的作用。

两大分类

考虑到不同企事业单位对数据安全和业务连续性的要求不尽相同,我们将异地容灾分为两大类:数据级容灾和应用级容灾。

数据级容灾:就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个可用复制。在本地数据及整个应用系统出现灾难时,至少在异地保存有一份可用的关键业务的数据。该数据可以是与本地生产数据的完全实时复制,也可以比本地数据略微落后,但一定是可用的。

应用级容灾:在数据级容灾基础上,在异地建立一套与本地生产系统相当的备份环境,包括主机、网络、应用、IP等资源均有配套,当本地系统发生灾难时,异地系统可以提供完全可用的生产环境。

CDP异地容灾VS传统异地容灾

传统的异地容灾方案大多基于远程复制技术。远程复制是指运用复制技术将数据以同步或者异步的方式存储到异地灾备中心中,其主要实现方式有三种:1利用主机远程复制软件或硬件 。2利用存储自身的复制软件。3利用数据库软件产品。远程复制的方式可以实现数据级的容灾,但是一旦发生灾难,无法保证业务的连续性。此外,一旦出现数据库逻辑错误或人为误删除的情况,远程复制不能修复数据错误,也不能找回误删除的数据,更谈不上100%恢复数据并保障数据的可用性了。

和力记易的异地容灾方案以CDP持续数据保护技术为核心,可以构建异地桌面端或服务器端的文件、数据库和应用的全需求平台,能够防范数据丢失、修复数据错误,还能保障业务连续,全方位满足客户不同的数据安全和业务连续性要求。

1、正常备份(Normal): 也叫完全备份。正常备份是最普遍的一种备份方式,是将整个系统的状态和数据完全进行备份,包括服务器的操作系统、应用软件以及所有的数据和现有的系统状态,系统状态在Windows server 中包括注册表、启动文件、COM+注册数据库、活动目录和系统卷等等。正常备份最全面,最完整,如果发生数据损坏,可以通过灾难前一天的正常备份就可以完全恢复数据。但是正常备份缺点也很明显,因为正常备份是备份服务器的所有数据,需要占用大量的备份空间,并且这些数据有大量的重复内容,在备份的时候也需要花费大量的时间,是一种虽然完整,但是效率比较低下的备份方式。2、副本备份(Copy):副本备份和正常备份非常相似,也是完全的备份系统状态和所有数据的一种备份方式,和正常备份唯一不同的是在进行备份的时候,正常备份会清除文件的存档属性,而副本备份不会清楚存档属性。所谓存档属性就是为文件做的一个标记,来标示文件是否已经被备份过。副本备份不会更改文件的任何属性,也不会对系统产生任何影响,主要是为了不影响其他的备份方式而设立。3、差异备份(Differential):差异备份是将上一次正常备份之后增加或者修改过的数据进行备份。打个比方,假设企业周一进行了正常备份,那么如果周二进行差异备份,那么将仅备份周二更改过的数据;如果周四进行差异备份,则备份周二周三和周四更改过的数据。这样一来就大大节省了备份时所需的存储空间和备份所花费的时间,如果需要恢复数据的时候,只需用两个备份,就可以恢复到灾难发生前的状态。4、增量备份(Incremental):增量备份是将上一次备份之后增加或者更改过的数据进行备份,这里需要注意以下,差异备份是备份上一次正常备份之后发生或更改的数据,而增量备份是备份上一次备份之后发生过更改的数据,并不一定是针对上一次正常备份的。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 什么是容错备份系统和灾难备份系统?谢谢..

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情