如何应对恢复故障过程中的各项问题

日期: 2012-07-17 作者:Paul Kirvan翻译:张瀚文 来源:TechTarget中国 英文

许多灾难恢复(DR)规划旨在当灾难事故发生后,将关键的系统和数据恢复(或称故障切换)到另一个站点,并在之后恢复(或称故障恢复)至原来系统的原始运营状态。而当系统恢复到其原始运营状态时,企业就能够恢复业务运作。 故障切换和故障恢复流程相当之复杂,并且必需在事先仔细规划并测试。当切换到一个备用站点,相应的技术应当能够接管应用,尤其是运营系统、网络访问以及带宽、足够的数据存储、数据库、文件和设备。

不过,在切换回原系统之前必需解决一些额外的情况。本篇将分析在故障切换和恢复系统至主站点之前所要解决的各项问题。 如果企业规模较大,有诸多办公室和完善的IT部门,那么在你故障切换和故障恢复时可能不会遇到太大的……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

许多灾难恢复(DR)规划旨在当灾难事故发生后,将关键的系统和数据恢复(或称故障切换)到另一个站点,并在之后恢复(或称故障恢复)至原来系统的原始运营状态。而当系统恢复到其原始运营状态时,企业就能够恢复业务运作。

故障切换和故障恢复流程相当之复杂,并且必需在事先仔细规划并测试。当切换到一个备用站点,相应的技术应当能够接管应用,尤其是运营系统、网络访问以及带宽、足够的数据存储、数据库、文件和设备。不过,在切换回原系统之前必需解决一些额外的情况。本篇将分析在故障切换和恢复系统至主站点之前所要解决的各项问题。

如果企业规模较大,有诸多办公室和完善的IT部门,那么在你故障切换和故障恢复时可能不会遇到太大的障碍。这是因为你在仓库中应当会留有备份资源,比如服务器、桌面系统、笔记本电脑和其它设备,在恢复站点可以进行快速地替换。不过如果你的企业规模较小并且没有这种额外的资源,你的恢复选择可能会比较局限。

对于中小型企业(SMB),有许多种灾难恢复可供选择,不过必需在财务资源、员工、物理空间、已有系统和所需数据之间进行平衡。

不过当你准备恢复(故障恢复)至原系统时,事故发生后的环境可能和之前一样,但也可能不一样。在故障恢复时,你通常有两种可能性:你之前的办公环境(假如和事故前没什么两样);抑或是一个不同的场所,部分或甚至全部失去了你原有的办公空间。

在故障切换时,应当将以下问题作为整体解决的一部分加以考虑确认:

  • 现有系统和相关软件可以复制在备用站点中(物理设备和基于云的解决方案)。
  • 所有的重要数据(例如日常工作文件)和信息(例如用户记录)可以复制在备用站点中,并且时间节点尽可能接近事故发生时。
  • 特定的故障切换软件(例如Double-Take)在两个站点都可用来启动故障切换作业。
  • 有足够的网络带宽(例如通过因特网)传输数据至进行故障切换的备用站点。
  • 当准备恢复至原站点时,测试系统和基础架构来确保其工作正常;确保有足够的存储容量处理返回的系统和数据;并且确保有足够的网络带宽来用于故障恢复。

现在,如果你的原站点并不可用,你的灾难恢复规划必须启动如下步骤:

  • 获取新的硬件(例如服务器、存储和路由器)和软件(例如操作系统和应用程序)来支持你实现和原环境类似的运作环境。
  • 确保空间来放置新的IT设备。
  • 获取新的桌面系统和周边设备。
  • 安装故障切换/故障恢复软件,如果在你的恢复规划中有这部分策略的话。
  • 确保网络带宽足以支持故障恢复工作。

再次提醒下,如果你是中小型企业,请考虑购买数TB的外部存储来备份你的系统和数据。这些存储设备可以在许多办公供应商那里购得。同时,部署“第二层备份”也是个不错的作法,以防你的故障切换和故障恢复部署没有如期工作。

好消息是市场上有大量用于中小型企业(以及大型企业)的故障切换和故障恢复工具。无论部署何种策略,你需要牢记以下关键点:

  • 确保灾难恢复规划中的故障切换和故障恢复活动的正常运作。
  • 和已确定的数据恢复供应商协作安排应急备份和恢复。
  • 将灾难恢复规划文档化,其中清晰地概括故障切换到备用站点以及故障恢复回主站点或新站点的各项步骤(例如具体脚本)。
  • 建立IT硬件和软件的主和备用源。
  • 每年测试故障切换和故障恢复流程和系统,确保其工作正常。(最好每周末时进行一次测试,不过桌面的演练同样有效)
  • 明确灾难事故中员工的角色和职责。
  • 培训IT员工故障切换和故障恢复的流程内容

总结

确保在进行灾难恢复规划时,你会考虑将IT运营故障切换至另一个备用站点,并且你如何恢复(故障恢复)至原始站点或可能的新站点。很有可能你的故障恢复会比故障切换更为复杂,因此准备好仔细检验所有的可用方式。

相关推荐

  • 数据中心灾难恢复规划模板与指南

    阅读本篇有关数据中心灾难恢复规划指南,然后免费下载我们提供的模板,评估数据中心设施及其基础架构在灾难期间的表现。

  • 揭开灾备真相——行业现状及趋势

    笔者在上一篇文章《揭开灾备真相——那些年我们见过的灾备术语》里介绍了灾备领域常见的一些专业术语,本文将站在行业角度,介绍灾备市场的现状及未来趋势。

  • 揭开灾备真相——那些年我们见过的灾备术语

    作为数据保护的最后一道屏障,灾备系统的重要性不言而喻。IT圈好像一夜之间都在说灾备,那么到底什么是灾备?为什么灾备如此重要?未来发展趋势如何?本系列文章带你认清灾备真相。

  • 存储经理人2017年11月刊:如何选择正确的DRaaS供应商

    《存储经理人》2017年11月刊重点介绍如何选择正确的DRaaS提供商:DRaaS供应商应当具备四项关键技能,以能够全方位应对所有潜在灾害。本期杂志还介绍了下一代线性磁带开放标准LTO-8,云中数据存储的注意事项以及驱动企业采用云存储的主要因素,同时阐述了冷存储需求不断高涨以及二级存储的现代化转型等现状,提醒大家在文件同步和共享时应确保数据安全,以及如何为未来的闪存做好准备。