灾备演练在灾备系统建设完成之后,对于鉴定灾备系统的有效性,起到至关重要的作用。但灾备演练应该如何进行?应该演练哪些场景?是很多企业的IT管理人员还很困惑的问题。灾备系统建设完成后,面临的灾难不外乎数据级别、应用系统级别和灾备中心级别这三种,所有的演练,都是基于这三种级别中某一特定的场景,每一次灾难场景不同,演练的技术过程也不相同。
几乎所有的灾备系统的灾难恢复预案的最初版本都是根据建设目标假设的场景提出的,这样的灾难恢复预案的有效性以及流程是否符合企业IT部门应对灾难的需求,企业IT部门人员技术储备、各种资源协调,灾难恢复过程组织等等都需要企业IT部门进行多次多场景的演练验证来确认。
演练的目的决定演练的方法,通常演练方法分为以下几种:
- 沙盘推演
- 模拟演练
- 实际业务接管演练
沙盘推演
沙盘推演也叫“桌面演练”,是在“模拟演练”前进行的,沙盘推演是对初始灾难恢复预案的一个理论验证,所有参加演练的人员和部门以会议方式,按照预先准备的灾难场景的灾难恢复预案,由参加演练的人员描述自己负责的任务模块的响应和处理过程。
沙盘推演可以检验灾难恢复预案和时间安排是否合理、人员组织是否有效、参演人员职责分工,技术储备及处理过程是否达到预案要求。推演的结果与恢复预案的差距,进而完善恢复预案。
模拟演练
模拟演练以沙盘推演结果(优化后的灾难恢复预案)为基础,模拟演练由IT部门与相关业务部门参加。它是对可能发生的灾难的处理过程的虚拟操作,通过模拟演练来验证灾难恢复预案是否可以达到预期的目标。
模拟演练启用实际的灾备系统来实现系统和业务恢复,采用模拟数据和模拟业务系统运行来验证演习预案。目前许多灾备技术可以完全提供不影响现有生产系统和容灾系统的灾备中心启动功能,因此可以在灾备中心随时获得真实的灾备系统启动环境并且可以在这个环境中施加应用系统的各个模块。演练的处理过程是高度接近真实灾难发生时的处理过程,通过演练可以检验灾备系统的可用性、灾难恢复预案的可行性以及增加参演人员对灾难处理过程的感知度,参演人员对整个灾难处理流程的熟悉程度和各自负责任务的熟练程度,增加灾难处理过程中各环节参加人员配合的默契程度。
通过模拟演练来进一步完善沙盘推演阶段形成的灾难恢复预案,发现演练流程中存在的问题,总结演练中指挥,控制,通信等的有效性,时间安排的合理性以及资源调用,调配是否满足演练的需求。
模拟演练是一种对现有生产环境没有影响的演练方式,但是可以实现灾难恢复预案的比较完整的验证。
实际业务接管演练
实际业务接管演练与灾难发生时处理的结果一样,需要灾备中心真正接替生产运行一段时间。
实际业务接管演练可以最大限度的检验灾备系统的灾难恢复能力和灾难恢复预案。验证灾备中心在灾难发生时的实际业务处理能力。
在实际业务接管演练中,数据回切是一个比较复杂的环节。对于数据回切,有以下两种方式处理:
1) 灾备中心运行阶段验证正确之后,放弃验证的数据,直接启动生产中心系统恢复生产。
2) 将灾备中心运行的数据,以增量方式恢复到生产中心,在生产中心启动生产。这种方式具有较大风险,如果设定的灾难场景是大型灾难(如地震等),数据的回切则可能以全量方式进行。
绝大多数企业的灾备系统演练都需要按照目标和风险度来设计。灾备演练的三种方法,以递进的方式从纸面理论到实际操作,从业务模拟到业务实际参与等不同层面,不同深度来验证已建成灾备系统的可用性,有效性,通过演练结果来修正、补充、完善灾备恢复预案并为灾备系统的升级建设提供理论依据及数据指标,从而使企业在信息系统灾备建设中有据可依,从而保证建成的灾备系统能充分实现建设的目的、达到建设的目标。
达到灾备演练的目标和完善预案是灾备演练的设计宗旨,对企业而言,切忌贪大造成不必要的生产风险和浪费。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
揭开灾备真相——那些年我们见过的灾备术语
作为数据保护的最后一道屏障,灾备系统的重要性不言而喻。IT圈好像一夜之间都在说灾备,那么到底什么是灾备?为什么灾备如此重要?未来发展趋势如何?本系列文章带你认清灾备真相。
-
年营收平均环比增长200%+ 英方是如何做到的?
英方自2014年全面开拓灾备市场以来,至2017年每年的营业收入平均环比持续增长超过200%。那么,是什么造就了如此高的业务发展速度?
-
存储极客:大话“双十一”与经济适用型双活
有了存储复制/双活之后,在一些关键应用中,同时进行数据库层面的逻辑或者物理复制保护也是有必要的。此外,为了保证跨数据中心双活存储的自动切换和避免脑裂,像第三站点仲裁这样的技术EMC、戴尔等厂商也是支持的。
-
Fujitsu基于Ceph推出Eternus CD10000
Fujitsu最新推出基于Ceph的Eternus CD10000,该产品加入了优化的纠删码、容量侧重和性能侧重的存储节点、内部备份以及为灾备设计的分离式集群等特色。