两台云服务器可以做双机热备吗
所谓双机热备,就是将中心服务器安装成互为备份的两台服务器,并且在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会迅速的自动启动并运行。我们来看看在WIN2000服务器版下的实现过程。
一、 硬件准备及基本安装综述
网络服务器 两台
网络服务网卡 四块
服务器硬盘 两块
SCSI磁盘阵列 一个
SCSI硬盘 三块
首先是将两台服务器都配置成双网卡,并分别安装Win2000 Advance Server(高级服务器版)。之后配置网络环境使之畅通:将两台服务器加入到域当中,成为域成员,并在每台服务器上设置管理员权限。
另外就是注意所有磁盘必须设置成基本盘并做成采用NTFS格式分区,磁盘阵列分区一定要大于2个。最后将三块SCSI硬盘做成磁盘阵列,笔者建议为RAID5(在配置阵列时,一定注意单独分一个至少1G的分区出来,用于存放配置数据库的检测点以及日志文件)。
二、 具体安装要点。
配置服务器网络环境要点
1、 在前一步中,我们将两台服务器都安装了双网卡,一个用于连接公网(internet),一个连接内部局域网。
将连接内部局域网的网卡建立点对点的通信和群集状态信号,然后每个终端的公网适配器连接该群集到公网上,并在此驻留客户。
2、 待win2000高级服务器版安装好后,开始配置每台服务器的网络参数。在网络连接将连接公网的改为“外网”,连接局域网的改为“内网”,然后将两台服务器的各自网卡分别指定IP地址为:
服务器A:外网IP为:1921680160,内网IP为:1010101,子网掩码为:2552552550 网关为:19216801(此处网关为你主域控制器的IP地址)
服务器B:外网IP为:1921680161,内网IP为:1010102,子网掩码为:2552552550 网关为:19216801
安装服务软件要点
配置服务器A
1、 所有的设备都先关闭后再开启磁盘阵列。
2、 启动服务器A,用事先设置的管理员帐号登陆到域;然后在添加/删除程序选项里添加“集群服务”组件,并注意在安装过程中将此组件设置为集群的首节点,接着创建集群名称(任取即可,比如
myserver)。
3、 由于我们只有一个共享的磁盘阵列,所以应该将此阵列中的分区都配置成群集磁盘。
4、 开始配置群集网络。外网和内网的配置相同,即群集网络的外网、内网的名称和IP地址要保持跟网络适配器一致,至外还要选中该网络可用于集群服务,外网要选中所有的通信(混合网络)选项,而内网只选中用于内部群集的通信选项。在接着出现的“使用网络顺序”对话框中,调整为表里的第一个连接是内网(解释:在正常的操作中,该连接将用于群集通信。如果此连接失效,群集服务将自动切换到表里的下一个网络),继续下一步会出现集群的IP地址和掩码选项,设置集群IP地址为1921680162,子网掩码为:2552552550。单击完成即可。
配置配置服务器B
首先一定保持磁盘阵列和服务器A的开机和可用,然后才启动服务器B。接着同样安装“集群服务”组件,安装过程大致与服务器A相同,唯一注意的地方是在创建或添加群集的对话框中,在群集中选择第二个或下一个节点,并单击下一步;接着输入前面所创建的群集名称(本例为myserver),在下一步中将连接到群集设为未选中,这样群集服务配置向导会自动提供前面在安装服务器A时选定的帐号名,输入该帐号的口令后一路点击下一步并最终结束配置。
最后我们应检测以上操作是否成功。依次单击“开始”—“程序”—“管理工具”,打开“群集管理器”,如果看到显示有这两个节点,表明群集已被正常配置并已开始运行。
三、 功能检测。
我们主要来看看它的容错能力,以下是笔者的一些检测:
1、 在两台服务器以及集群服务同时运行的情况下,断掉其中一台服务器的外网连接,此时运行在此服务器上的集群服务会被迫自动断开并转移到另外一个连接正常的节点上(此过程所需时间视你服务器开展的服务数量而定,一般4秒钟左右)。或是可以更改一台服务器的系统时间,经过几分钟,被改动的时间会自动调整成同另一台节点相同。
2、 在集群服务上开启web服务,并设置好下载项目。在用户端开始下载项目,接着马上断掉集群中的一个节点,结果用户端并无明显的感觉掉线!
由以上检测办法可以看出,Win2000服务器版的集群服务在容错方面具有良好的表现!一般在瞬间即可把出错的节点上的服务接管过来,而用户端并不会感觉有明显的变化!
双机的概念就是两台服务器通过双机软件检测双向的心跳,二者具备同样的功能,只不过一台作为主机,另一台作为备机,平时是由主机工作,备机通过双机软件检测主机的心跳(方法很多,如检查一些关键进程是否存在,很多双机软件死掉的进程检查不出来),如果没有检测到,表明主机出问题了,这时双机进行切换,主备机角色发生转换,备机变成工作主机,而原来的主机变成了备机,因此采用双机是一种容灾的模式。目前在大型的软件应用上被广泛的应用。
双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由两台服务器系统和一个外接共享磁盘阵列柜( 也可没有,而是在各自的服务器中采取RAID 卡) 及相应的双机热备份软件组成在这个容错方案中,操作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。
双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。
双机热备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即: 双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍。
双机热备模式即通常所说的active/standby 方式,active 服务器处于工作状态;而standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入( 通常各服务器采用RAID 磁盘阵列卡) ,保证数据的即时同步。当active 服务器出现故障的时候,通过软件诊测或手工方式将standby 机器激活,保证应用在短时间内完全恢复正常使用。典型应用在证券资金服务器或行情服务器。这是采用较多的一种模式,但由于另外一台服务器长期处于后备的状态,从计算资源方面考量,就存在一定的浪费。
双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。配置相对要好。
双机双工模式: 是cluster(群集)的一种形式,两台服务器均为活动,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份,需要利用磁盘柜存储技术(最好采用San 方式)。WEB 服务器或mail服务器等用此种方式比较多。
双机主要分两种,一种是磁盘阵列柜的硬件双机热备;一种是没有磁盘阵列柜的纯软双机热备如果没有磁盘阵列柜的话,只能做纯软双机,那你需要购买两个双机软件,才能做,一个是双机热备份软件:如ROSS或PLUS WELL等,别一个是双机镜像软件MirrorHA,
以ross为例:
1纯软件双机热备份
两台服务器通过网络连接,硬件配置少了磁盘阵列 , 软件配置上,除了 Cluster 之外,新增了 NT Mirror , NT Mirror 是 ROSE 公司的网络数据镜像软件。
图 2 纯软件双机热备份系统
2 、 系统工作原理
与常规的双机系统相比,纯软件双机热备份系统的两台服务器之间少了公共的存储设备(通常是磁盘阵列),但是多了网络数据镜像软件 Mirror 。没有了公共存储设备磁盘阵列,对于某一个需要进行切换的服务而言,怎样保证其所用的数据在两台服务器上是一致的呢?这就是数据镜像软件 ROSE NT Mirror 的功能所在——— NT Mirror 通过网络,将某一台服务器上指定路径下的数据采用同步或异步方式,镜像到另一台服务器。
镜像软件取代双机热备份系统的磁盘阵列,关键之处在于其必须与 Cluster 软件协同工作。当某一服务运行于服务器 A 时,它所使用的特定数据在服务器 A 上对应于一个数据集合Ф A, 通过 NT Mirror 将源数据集Ф A 镜像到服务器 B 成为目标数据集Ф B, 当 NT Cluster 将该服务程序从服务器 A 切换到服务器 B 时,它使用服务器 B 上的数据Ф B, 同时 NT Mirror 自动修改原来从Ф A 到Ф B 的镜像成为从Ф B 到Ф A 的镜像。对一个服务程序是这样,对多个服务程序,则一一建立服务程序与数据镜像集之间的关系。这样,无论服务程序运行于哪一个服务器,始终保证其所使用的数据在对端服务器有一份镜像存在;当一台服务器由于硬件或软件原因发生故障失效 , 另外一台可在保证提供自己原有服务的同时 , 启动失效服务器的应用程序从而取代其服务器功能。
3 、运作方式:
在正常的运作情形之下,主机之间透过冗余侦测线路互相侦测,当任一主机有错误产生时, ROSE HA 提供严谨的判断与分析,确认主机出错之后,启动备援接管动作。
支持各种操作系统平台: Unix 、 Linux 、 Windows Server 等。
支持各种数据库: 数据库SQL 、 Oracle 、 Informix 、 Sysbase 、 Exchenge 、 Lotus/Nose 、 DB2 等
接管动作包括 :
文件系统 ( File System)
数据库 ( Database)
网络地址 ( IP Address)
应用程序 (AP)
系统环境 (OS)
容错备援运作过程
• 当一台活动服务器宕机时,其 IP 地址、服务器名称及运行的作业会自动转移至另一台服务器,客户端软件不需要重新设定,只要重新连结至原来的 IP 地址及服务器名称即可继续作业;
• 两台服务器的信息交换可通过: RS232 、 TCP/IP
• ROSE HA 采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时间并防范错误,提供故障警告;
• ROSE HA 可设定故障排除后自动或手动回复 ( switch back );
• ROSE HA 安装时不需要修改操作系统的核心、更改应用软件,也无需特殊的硬件;
• ROSEHA 提供基于 GUI 的监控中心,管理员能查看 ROSE HA 的状态、检查错误信息和警告、修改系统参数及从远程工作站管理 ROSE HA 系统;
• 与数据库无关,可以支持各种数据库,包括 ORACLE 、 Sybase 、 Informix 等
管理工具:
• 友好、直观、易于操作的 GUI 界面
• 有关 ROSE HA 的配置都可以在 GUI 中完成,支持动态配置和实时同步
• 网卡的状态,磁盘的状态都可在 GUI 中显示出来
• 用户可通过第三方 Web 浏览器进行远程管理
监控的对象资源:
• Volume
• IP 地址
• 计算机别名
• 共享文件
• NT 服务
• 用户自定义
总之, ROSE HA 软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的运行。
四、系统特点
纯软件高可用方案,是双机高可用软件和网络数据镜像软件的完美结合。可以概括如下:
• 系统成本低:不需要磁盘阵列,降低了系统成本。
• 系统抗灾难能力强。
• 构成双机系统的两台服务器通过网络连接,可以相隔很远的物理距离,增强了系统的抗灾难能力。
• 双向的失效切换功能。
• 双向的失效切换,又称 ACTIVE/ACTIVE 冗余方式,是指为用户提供两台可运行重要应用的全功能服务器 并确保它们中任何一台失效时另外一台可自动代替其功能。
• 系统资源占用少系统效率高。
• 数据镜像可以绑定到某一对网卡上完成,不占用服务器网络资源,减轻服务器负载,提高系统效率。
• 服务器无需相同。
• 双机热备份的两台服务器在硬件和软件配置上无须相同。
• 无需停机的设备维护能力。
• 由于应用程序可以在两台服务器之间自由切换,用户可由此实现在不停止网络服务前提下对其进行维护工作,如日常检查 维修或测试;而此时前台工作站可以完全透明地保持在工作状态。
• 简单易用功能全面的管理窗口。
• 面向对象的管理窗口使您只需移动鼠标,就可以配置和管理整个双机热备份系统。
• 从资源定义到服务程序的切换,都可以轻松完成。
系统要求:
• 两台服务器配置无需相同 ( IBM 服务器有例外)
• window NT/windows 2000 、 2003 操作系统版本一致
• 用于公用网络的网卡( Ethernet,Fast Ethernet,FDDI 或 ATM 卡 ) 用于私用网络的网卡或 RS-232 串口线
2硬件双机热备份:可以用Win2003企业版也可以做
0条评论