业务连续性不再是大型企业的专利

日期: 2008-02-17 来源:TechTarget中国

  业务连续性是我们今天所广泛探讨的话题,一般而言,业务连续性的实现对大型企业来说相对较为容易。因为这些企业有自己的IT员工和丰厚的资金保证,可以花费数以百万计的美金来建立备用的数据中心,把所有信息在远程的灾备中心进行异地保存,同时还应用了许多其他灾难恢复技术。
 
  以911事件为例,有多家金融服务机构就位于世贸大厦中或者周边地区,著名的双子大厦倒塌后,这些金融服务机构却没有丢失任何一笔交易数据,并在灾难之后数小时内就完全恢复运营。这是为什么呢?因为这些机构在远程的数据中心有运行着OpenVMS操作系统的昂贵服务器,随时可以进行业务切换。只要系统瘫痪了,强大的网络就可以转换到备份的站点上。


  然而并不是所有的企业都有如此庞大的财力和人力来构建标准的容灾中心,同样是处于911事件中的另外一家律师事务所,采用常规的磁带备份方式来备份业务数据和客户资料。911事件发生后,他们的资料随着大厦一同化为灰烬,以至于该事务所的业务在相当长一段时间内不能恢复正常。


  由于容灾中心的运转过程太过复杂,维护它有效运营的成本也太过沉重,对于大多数企业来说,业务连续性似乎成为了一个奢侈的目标。那么如果我们无法建立容灾中心,传统的备份就不能实现业务连续性目标了吗?


  徒劳无功的备份与恢复


  如果数据无法恢复,那么备份就是浪费时间和金钱。然而根据业务分析公司 Enterprise Strategy Group调研数据分析,全球大约有40%的数据恢复失败了,失败的原因并不在于备份软件或者磁带上,而是由于备份任务本身的复杂性决定的。


  如果我们研究备份的过程和原理,我们会发现,整个备份操作将贯穿应用程序、服务器、存储设备和网络层,且备份本身是一个很容易受到影响的过程,除非在整个备份的过程中,一切都正常运转,否则很有可能这次备份将成为一次失败的操作。一旦备份失败,我们也很难找到失败的根源,因为有些备份解决方案供应商估计他们花了90%以上的时间在与软件无关的问题之上。


  备份的目的就在于:要完全精确地保证正确的数据在正确的时点得到恢复。为了达到备份的目的,备份的时候:
  1. 所有访问业务数据库的应用程序和服务都必须停止。
  2. 要找到最后一次完全备份的数据,装载恢复。
  3. 然后所有的相关的增量备份拷贝也要找到,按照正确的顺序装载恢复。
  4. 最后,必须正确使用数据库日志(假设日志可用)。


  要实现上述的这些步骤,Windows文件系统和文件必须在一个合适的时间得到保存,这一般是部署一个开放式文件管理器的必要条件。备份软件要做的就是读取很多的文件系统元数据,来判断哪些文件有所变化,然后就把整个文件系统以及/或者数据库进行拷贝,或者仅仅对有变化的一部分文件进行拷贝。


  这个过程取决于系统的大小,可能会花上数个小时,且整个备份过程占用了大量的运算资源和带宽,对应用程序的运营影响极大,为尽量避免对业务程序的影响,大部分公司选择做备份不超过一天一次,一般会选择在业务运营量最小的午夜至第二天凌晨的时段内进行。


  RPO和RTO是我们在衡量备份和业务连续性的时候,经常会用到的两个概念。恢复点目标(RPO)是在发生灾祸的情况下公司可接受的数据丢失量的衡量标准。受到目前备份和恢复技术上的限制,很多企业设定的RPO是24小时——在预定的增量备份过程发生之间。换言之,即使企业通过备份系统完全恢复数据,也损失了24小时的业务数据量。


  恢复时间目标(RTO)是指灾难发生后,业务恢复运营所用的时间,一般的企业从数小时到数天都是比较实际的RTO。然而这也是由于目前备份技术和操作上的限制造成的,而不是业务需求。


  真正的业务连续运营要求完全为零的RPO和RTO,虽然我们不可能完全达到,但至少可以无限接近。


  改善传统备份的性能


  面对这种痛苦的,混乱的备份过程和缓慢的不可靠的恢复,有些客户在寻找替代的技术,比如快照(snapshot)或者克隆(clone)。这些技术,虽然一定程度上减少了混乱,也提高了恢复效率,但只能解决部分问题,而且增加了操作成本和复杂度。


  克隆(clone)可以在某一时间点提供一份额外的数据视图,依赖于执行的同步性,这将是一个最近的或最接近的视图。举例来说,一个应用程序错误导致了主数据集的损失,也会导致从数据集的损失,结果就是损失了两次。


  快照(snapshot)可以帮助保护用户丢失的数据,但不能从硬件或站点错误中恢复数据。快照可以返回一个数天前特定时间的文件系统。然而,快照不提供政策管理和备份软件解决方案的可用性,因此它们在管理大规模的数据和较早的数据上效率极低。很多快照技术和私有硬件系统密不可分,因此限制了它们的应用。


  备份保护间隔一般是24小时;快照保护间隔一般是1至3小时;克隆无法保护由病毒或黑客造成的损失,且克隆的数据也是有问题的,只有最后一个版本可用,不能恢复过去的数据。


  最重要的是,决定实施快照以及/或者克隆的公司仍然需要他们的备份系统来保护他们的数据。这就留给这些公司,特别那些中层的公司,两个同样不痛不痒的选择:忍受备份的痛苦和不可靠性,或者接受成本、复杂度和技能需求的增加,来支持备份和新技术的日常操作。


  连续性数据保护(CDP)是近来兴起的可实施的,占用系统资源较小的,且价钱合理能够负担的一种解决方案,可在尽可能最短的时间内来恢复最大量的数据丢失和损坏。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 业务连续性和灾难恢复测试模板免费下载

    业务连续性和灾难恢复测试对于任何组织来说都是重大的挑战。我们的免费模板提供了在整个管理流程中集成测试的方法。

  • 远离勒索软件 维护业务连续性

    勒索软件已经成为今天信息安全方面最大的担忧。从业务连续性的角度来看,勒索软件是各个组织面临的重大风险。本文将从信息安全和业务连续性方面入手介绍各项技巧,帮助您的组织严密保护数据,远离勒索软件的威胁。

  • 业务连续性管理者的九项必备技能

    如果您想成为业务连续性管理者,拥有多个领域的专业能力会让您在职业发展中占得先机。这里是业务连续性管理者的九项必备技能。

  • 如何确保恢复时间目标是最新的?

    随着预期的恢复时间目标(RTO)持续下降,对恢复时间目标的审查应该与作出关于RTO价值决定的流程责任人进行。实现RTO则是配置技术,运营程序和员工的问题。