恢复时间目标和恢复点目标是两个基本指标,用于制定数据备份和恢复计划、业务连续性和灾难恢复以及运营弹性计划。RTO侧重于系统或业务流程的最大可接受停机时间,而RPO则指定在中断期间可能丢失的最大数据量。这两个指标都以秒、分钟、小时或天表示。
本文将研究RPO和RTO、如何计算它们、这些指标的成本和风险影响,以及如何将它们构建到各种业务连续性/灾难恢复(BCDR)和复原计划中。
什么是RTO?
恢复时间目标(RTO)是指,在发生破坏性事件后,受影响的资源恢复正常运行的时间。
RTO与支持恢复所需的成本之间存在反比关系。具体来说,RTO的时间越短,恢复成本就越高,反之亦然。因此,在确定RTO值时,有必要让业务部门领导参与进来。
如何定义RTO
在业务连续性/灾难恢复规划中,业务影响分析(BIA)确定关键业务流程及其支持系统,并确认它们中断多长时间会显著影响组织的运营能力。计算RTO(有时被称为最大可容忍中断期)意味着确定恢复每个系统需要多长时间,这些系统通常来自IT部门。
对于某些企业来说,例如金融和制造业,停机时间必须控制在最低值——例如,不到一分钟。其他系统和流程可能没有那么关键,它们的RTO会更高。业务部门领导必须认同恢复时间目标值,因为所涉及的成本可能很大。例如,对具有快速故障转移和故障恢复功能的高可用性系统和网络资源的需求可能更大。
什么是RPO?
在数据备份和恢复活动中,恢复点目标(RPO)尤为重要。低RPO值意味着数据在中断后再次使用时必须尽可能保持最新。
由于RPO值与实现RPO的成本之间存在反比关系,例如,10秒到30秒的RPO意味着企业必须经常备份数据。为了实现这种RPO,企业可能需要高速备份技术,例如数据镜像或持续复制。可能还需要广泛的数据备份功能,可能在多个公司位置(例如备用数据中心)使用云备份资源和/或其他数据存储阵列。
你如何计算 RPO?
在BIA期间确定RPO值时,用户部门必须说明,已备份数据在需要之前可以在数据存储中保持不变的时间。从数据备份到中断后需要数据的时间就是RPO。较短的RPO值,例如不到一分钟的RPO值,意味着在中断事件发生后几乎立即需要备份数据。还必须检查备份计划,以确定特定数据、数据库和系统备份的频率。
RPO与RTO:相同和不同之处
RTO 和 RPO 是 业务连续性/灾难恢复和复原规划中的重要指标。它们相似之处在于,它们定义了系统不可用的时间以及在无法使用之前数据可以老化的时间限制。它们的不同之处在于,每个指标都关注不同的业务要求:系统可用性与数据可用性,这会影响组织恢复正常运营所需的时间。下图详细介绍了这些相似之处和不同之处。
RPO 和 RTO 示例情景
RTO和RPO是关键的备份和恢复指标,可确保关键数据和系统在需要时可用。下表举例说明了在灾后情景中错过 RTO 和 RPO 将会如何影响企业。
错过RTO和RPO将如何影响企业 |
|||||
资产 |
计划的RPO |
实际RPO |
计划的RTO |
实际RTO |
分析 |
关键任务应用程序 |
0.5小时 |
1.5小时 |
0.5小时 |
2.0小时 |
应用程序备份资源不足;技术无法足够快地恢复 |
关键数据库 |
0.25小时 |
2.0小时 |
0.25小时 |
2.0小时 |
应用程序备份资源不足;技术无法足够快地恢复 |
关键网络交换机 |
NA |
NA |
0.5小时 |
2.0小时 |
技术无法足够快地恢复 |
HVAC系统和相关应用程序 |
0.25小时 |
2.0小时 |
0.25小时 |
2.5小时 |
HVAC系统备份资源不足;HVAC系统无法快速恢复 |
虽然上述每项资产的RPO和RTO时间值看起来很进取,但结果表明,这些资产并没有像预期的那样受到很好的保护。恢复所需的时间表明需要以下:
- 为应用程序优先级重新配置数据存储资源和备份平台。
- 重新配置和/或重新设计网络基础设施资源,以减少延迟,并提高恢复速度。
- 备件,可以作为恢复过程的一部分。
- 更加关注关键基础设施、环境系统和维护业务运营方面的工作。
比较RPO和RTO策略
在比较RPO和RTO时,时间表可能有所不同。RPO 是在事件发生之前分配,而 RTO 是在事件发生后指定。在实践中,短的RTO通常需要同样短的RPO,特别是当需要数据保护和系统恢复时。
如果灾难恢复策略仅涉及系统备份和恢复问题,则 RTO 值可能足以确定如何进行恢复。但是,如果要恢复的系统也处理关键和时间敏感的数据,那么RTO和RPO都应该同步。
虽然IT部门可以确定实现RTO和RPO值所需的资源,但他们不能任意分配RTO和RPO值——这取决于业务部门和管理层。每个指标都有助于实现BCDR,还可帮助IT团队确定实现预期值所需的资源和相关成本。如果实现期望的RTO/RPO值的成本高得令人望而却步,业务部门和高级管理层可能需要决定这项投资是否会充分减轻业务损失的风险,或者是否需要替代方案。相反,企业可能会决定投资资本和运营资金,以部署所需的资源,以实现RTO和RPO目标。
优化 RPO 和 RTO 的最佳做法
以下是优化 RPO 和 RTO 的最佳做法:
- 使用来自风险分析和BIA的事件数据来确定可能发生的频率和可能性,对企业的影响,以及哪些缓解策略最有可能成功。这种分析还可能识别潜在的威胁和漏洞。
- IT管理员应找到基础设施资产,并确定措施,在发生威胁时,帮助减少威胁或减轻其严重程度。
- 测试各种备份和恢复安排,以确定提供所需 RTO 和 RPO 结果的具有成本效益的方式。
云应用程序和存储中的RTO和RPO
随着IT运营继续迁移到云环境,RTO和RPO值同样重要,因为云供应商可以更好地控制实现所需的RTO和RPO值所需的资源。在基于云的数据存储和检索等情况下,用户必须将他们想要的RTO和RPO值传达给供应商,然后看看他们如何回应。
如果 RTO 和 RPO 值是关键指标,云服务级别协议应包括这些值。由于云供应商可以扩展资源以满足客户需求,因此实现RTO和RPO可能并不难。这里的挑战是将额外成本降到最低,以实现新的或修订的RTO和RPO值。
计算RPO和RTO
在业务影响分析期间,业务部门领导和高级管理层必须确定从业务中断恢复的最佳情况,并分配数字值。
RTO和RPO值是严格的数字时间值。例如,关键服务器的RTO可能需要一小时,而非关键数据事务文件的RPO可能需要24小时。
随着RTO和RPO值的下降,实现这些指标的成本可能会增加。确定真实成本的唯一方法是,首先确定所需的 RTO 和 RPO 值,然后进行研究,以确定在发生中断时实现指标所需的资源。如上所述,可能有必要测试各种解决方案,以确定哪种解决方案能提供最佳结果。
如果他们不想投资额外的资金来实现给定的指标,可能会出现来自管理层的潜在阻力。管理层必须明白,如果发生破坏性事件,可能会带来额外的风险和损失。
将RTO和RPO构建到数据备份和恢复计划中
在数据备份、数据恢复和其他基于弹性的计划中,涵盖RTO和RPO指标至关重要,还需要确保提供足够的程序、人员和技术资源,以实现这些指标。这些指标指示恢复栏的设置位置。
对于数据备份和恢复,RTO和RPO值对于规划至关重要,因为它们有助于确定最佳的数据备份和技术配置,以实现目标。例如,从合规性和数据备份审计的角度来看,它们也很重要,因为审计师可能会寻找这些数值的证据,作为关键的数据备份和恢复控制。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
翻译
相关推荐
-
Broadcom停止VMware的vVols存储功能
Broadcom将不再提供通过外部存储平台连接和管理VMware的功能。 该供应商表示,他们将弃用VMware […]
-
闪存、AI和云:Pure Accelerate大会的3个IT重点
对于IT专业人士来说,各种会议活动为他们提供了绝佳的机会,以衡量技术选项的状态,以及了解他们自己与同行的差距。 […]
-
在购买前,请考虑这5个存储即服务问题
存储即服务旨在通过将管理外包给供应商,以简化管理,并简化采购,类似于购买公共云存储。但供应商之间并不总是一致, […]
-
26个基本Linux存储命令可用于管理
在Linux设备上,管理存储空间可能具有挑战性。不过,我们可以利用Linux存储命令来帮助监控和管理存储空间, […]