从央视新址工地大火谈到企业灾难恢复(二)

日期: 2009-02-11 来源:TechTarget中国 英文

  设备失效。设备失效定义比较广,应该说所有服务于企业业务的设备都属于这个范畴。比如说电力设备,如果电力设备突然失效,那么企业依靠计算机的那部分业务首当其冲受到影响,业务控制,ERP、数据处理等诸多问题都会受到影响,电力设备的失效对企业来说绝对是头疼的事情。还比如说软硬件的失效,比如说关键设备(服务器、存储设备)的突然失效,那将会对企业关键业务造成严重的影响;还有员工工作的PC或者笔记本出现的硬件故障,也会对员工工作造成一定的影响;还有一些关键业务软件也可能会遇到失效的时候;设备的失效对企业造成的影响范围很大。

  自然灾害。自然灾难应该是最好理解的灾难了。所有大自然界对企业业务造成影响的自然现象都属于这个范畴,比如说:地震、暴雨、飓风、海啸、火山爆发等等,大自然的力量不可阻挡,当然这种灾难属于小概率事件,但是破坏性也是惊人的。应对这种灾难,也是需要企业在灾难恢复方面最多工作的。

  蓄意破坏行为。蓄意破坏行为应该是对企业业务破坏很大的一种行为;通常人为事故、设备失效、自然灾害可能都或多或少存在一些无意的因素。但是蓄意破坏行为则是带有非常明确的目的性,它的目的就是为了破坏企业的关键业务,从而让企业的关键业务陷入瘫痪。比如说去年英国的银行卡信息被盗事件。对于那些蓄意搞破坏的人来说,入侵的概率及产生的危害将会是永无休止的;从纵火、破坏公司各种设备到入侵企业的网络系统,通过黑客行为或者传播病毒,让企业业务系统陷入瘫痪等等。

  大概罗列了灾难的一些种类,接下来该谈的就是如何去预防和应对这些灾难了,也就是该谈谈灾难恢复了。

  什么是灾难恢复?

  简单的讲灾难恢复就是为了保持业务连续性的一部分,其主要负责的是在灾难或者紧急事件发生的情况下如何保证业务的持续进行。或者说灾难恢复是指一个公司从灾难中恢复重新开始正常运营的能力。

  在遭遇到一场大灾难的时候,业务恢复的首要目标就是保证机构最低限度的服务水平。同时在尽可能短的时间内使得公司恢复正常运营也是尤为重要的。这就意味着在灾难恢复的过程中需要采用交叉的手段:一方面对于重要的功能和流程需要及早修复,同时也需要完成所有流程和功能的修复。灾难恢复计划的制定过程需要公司内部多个职能部门的关键人员共同协商挖成。(接下来的文章会谈到如何制定灾难恢复计划)

  谈了很多灾难和灾难恢复的概念,最后为了能够加强各位对灾难恢复领域的重视,引用在备份领域经常提到的墨菲定律:“墨菲定律(Murphy‘s Law)缘于美国一位名叫墨菲的上尉。他认为他的某位同事是个倒霉蛋,不经意说了句笑话:”如果一件事情有可能被弄糟,让他去做就一定会弄糟。“这句话迅速流传。经过多年,这一”定律“逐渐进入习语范畴,其内涵被赋予无穷的创意,出现了众多的变体,”如果坏事有可能发生,不管这种可能性多么小,它总会发生,并引起最大可能的损失“、”If anything can go wrong, it will.(会出错的,终将会出错)“、”笑一笑,明天未必比今天好。“”东西越好,越不中用“、”别试图教猪唱歌,这样不但不会有结果,还会惹猪不高兴!“

  企业为什么需要灾难恢复?

  根据“墨菲定律”:

  一、任何事都没有表面看起来那么简单;

  二、所有的事都会比你预计的时间长;

  三、会出错的事总会出错;

  四、如果你担心某种情况发生,那么它就更有可能发生。

  我们都有这样的体会,如果在街上准备拦一辆车去赴一个时间紧迫的约会,你会发现街上所有的出租车不是有客就是根本不搭理你,而当你不需要租车的时候,却发现有很多空车在你周围游弋,只待你的一扬手,车随时就停在你的面前。如果一个月前在浴室打碎镜子,尽管仔细检查和冲刷,也不敢光着脚走路,等过了一段时间确定没有危险了,不幸的事还是照样发生,你还是被碎玻璃扎了脚。如果你把一片干面包掉在你的新地毯上,它两面都可能着地。但你把一片一面涂有果酱的面包掉在新地毯上,常常是有果酱的那面朝下。

  墨菲定律告诉我们,容易犯错误是人类与生俱来的弱点,不论科技多发达,事故都会发生。而且我们解决问题的手段越高明,面临的麻烦就越严重。所以,我们在事前应该是尽可能想得周到、全面一些,如果真的发生不幸或者损失,就笑着应对吧,关键在于总结所犯的错误,而不是企图掩盖它。

  2003年美国“哥伦比亚”号航天飞机即将返回地面时,在美国得克萨斯州中部地区上空解体,机上6名美国宇航员以及首位进入太空的以色列宇航员拉蒙全部遇难。“哥伦比亚”号航天飞机失事也印证了墨菲定律。如此复杂的系统是一定要出事的,不是今天,就是明天,合情合理。一次事故之后,人们总是要积极寻找事故原因,以防止下一次事故,这是人的一般理性都能够理解的,否则,或者从此放弃航天事业,或者听任下一次事故再次发生,这都不是一个国家能够接受的结果。

  人永远也不可能成为上帝,当你妄自尊大时,“墨菲定律”会叫你知道厉害;相反,如果你承认自己的无知,“墨菲定律”会帮助你做得更严密些。

  这其实是概率在起作用,人算不如天算,如老话说的“上的山多终遇虎”。还有“祸不单行”。如彩票,连着几期没大奖,最后必定滚出一个千万大奖来,灾祸发生的概率虽然也很小,但累积到一定程度,也会从最薄弱环节爆发。所以关键是要平时清扫死角,消除不安全隐患,降低事故概率。

  实际上,你越是怕什么,就越来什么。“

  由此得出的教训是:如果做某项工作有多种方法,而其中有一种方法将导致事故,那么一定有人会按这种方法去做,而且往往将会以最坏的结果出现。

  那么企业为什么需要灾难恢复?因为企业要做好最坏的打算,做到未雨绸缪!这样才能在灾难面前立于不败之地。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 数据中心灾难恢复规划模板与指南

    阅读本篇有关数据中心灾难恢复规划指南,然后免费下载我们提供的模板,评估数据中心设施及其基础架构在灾难期间的表现。

  • 揭开灾备真相——行业现状及趋势

    笔者在上一篇文章《揭开灾备真相——那些年我们见过的灾备术语》里介绍了灾备领域常见的一些专业术语,本文将站在行业角度,介绍灾备市场的现状及未来趋势。

  • 揭开灾备真相——那些年我们见过的灾备术语

    作为数据保护的最后一道屏障,灾备系统的重要性不言而喻。IT圈好像一夜之间都在说灾备,那么到底什么是灾备?为什么灾备如此重要?未来发展趋势如何?本系列文章带你认清灾备真相。

  • 存储经理人2017年11月刊:如何选择正确的DRaaS供应商

    《存储经理人》2017年11月刊重点介绍如何选择正确的DRaaS提供商:DRaaS供应商应当具备四项关键技能,以能够全方位应对所有潜在灾害。本期杂志还介绍了下一代线性磁带开放标准LTO-8,云中数据存储的注意事项以及驱动企业采用云存储的主要因素,同时阐述了冷存储需求不断高涨以及二级存储的现代化转型等现状,提醒大家在文件同步和共享时应确保数据安全,以及如何为未来的闪存做好准备。