CDP内部一览 存储网络工业协会(SNIA)把CDP定义为“一种方法论,能够连续的捕捉或者跟踪数据变化,并把这些变化独立于主数据之外进行存放,使得可以从过去的任意点进行恢复…….数据变化是连续捕捉的…….存储在单独的位置…….[RPO]是不确定的,而且不需要在实际恢复前事先确定。” 请注意,你在上面没有看到“快照”一词。虽然,真实的情况是今天的许多CDP系统允许用户创建预先知道的恢复点,但这不是必须的。作为CDP,一个系统必须能够恢复到任意时间点,而不只是在做了快照的时候。
CDP系统起源于“数据分流”或“写分离器”。写到主存储的数据被“分流”或“分裂”成两条路径;每次写操作被发送……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
CDP内部一览
存储网络工业协会(SNIA)把CDP定义为“一种方法论,能够连续的捕捉或者跟踪数据变化,并把这些变化独立于主数据之外进行存放,使得可以从过去的任意点进行恢复…….数据变化是连续捕捉的…….存储在单独的位置…….[RPO]是不确定的,而且不需要在实际恢复前事先确定。”
请注意,你在上面没有看到“快照”一词。虽然,真实的情况是今天的许多CDP系统允许用户创建预先知道的恢复点,但这不是必须的。作为CDP,一个系统必须能够恢复到任意时间点,而不只是在做了快照的时候。
CDP系统起源于“数据分流”或“写分离器”。写到主存储的数据被“分流”或“分裂”成两条路径;每次写操作被发送到其原始目标的同时,也发给了CDP系统。数据分流可以是在受保护主机上的代理,或者是驻留在存储网络的某个地方。作为主机代理运行,数据分流已经没有或很少对主机系统产生影响,因为所有的“繁重工作”是在其他地方完成的。把数据分流部署在存储网络的CDP产品,可以使用存储系统达到这个目的,例如思科系统公司的MDS系列和其SANTap Service功能,EMC公司的Clarion嵌入式分离器功能,还有博科通讯系统公司的Storage Application Services API。某些CDP系统还提供把数据分流部署在什么地方的选项。
用户然后需要确定一个必须恢复到同一时间点的卷和主机的一致性组。某些CDP系统允许建立包含多个一致性组的“组中组”,无损的建立多层次粒度。用户也可以选择在受保护主机上执行应用级快照,例如把Oracle设置成备份模式,或者在Windows系统中执行Volume Shadow Copy Service (VSS)快照。(记住,快照不是必须的。)一些CDP系统简单记录了这些发生在应用级的快照,另外一些则提供了帮助,以执行这些快照的。这是非常有帮助的,在连续数据保护系统维护集中的应用级快照记录的时候,因为它们可能非常有用。
每次写操作都被传送到首选恢复设备,通常是数据中心中其它什么地方的设备和磁盘阵列。这种与受保护数据的接近度允许写操作进行同步复制或者很小间隔的异步复制。即使一个CDP系统支持同步复制,大部分用户都会选择异步的方式,以避免对生产系统造成任何的性能影响。CDP系统支持可适应的复制模式,在可能的情况下采用同步方式,但在压力大的时期,缺省(默认)采用异步方式。
数据存储在两个地方:“恢复卷”和“恢复日志”。恢复卷是受保护卷的副本,在恢复的时候替换受保护卷。恢复日志是顺序存放着所有对受保护卷的写操作的日志;它被用于在恢复的时候按时间向前或向后回滚恢复卷。它也被用作高速缓存,用于存放没有应用到恢复卷的写操作。这种设计允许恢复卷使用较廉价的存储,只要恢复日志使用的是和受保护卷一样快或更快的存储即可。
一旦数据被复制到首选地恢复设备,然后就可以复制到异地。根据广域网链路的性能,CDP系统需要考虑可用带宽的变化。这就要求在情况发生变化的时候,它必须能够“变慢”和“变快”。对于一些你可以确定一个可接受的延迟时间(从几秒到一小时或更长时间)的系统来说,可以解释为复制系统的RPO。CDP系统以大批量的形式发送所有的写操作。如果一个单独的数据块在这期间被更改了很多次,你可以指定只有最后的改变在一个被称作“折叠写”的过程中被发送。显然,这意味着灾难恢复副本与本地的恢复系统不具备相同的恢复粒度级别,但这也表明了工作系统与非工作系统之间的区别。
现代的连续数据保护也提供一种固定的、长期的存储可选方案。你可以选择一个短的时间范围(例如,从每天的中午12点到12点30秒),让CDP系统只保留那些必须保留的恢复点的数据块,并且删除这些恢复点之间的变化数据块。通常使用应用级快照的用户,通过这种调整,可与他们的一致性恢复点目标相匹配。对这些无关变化数据的删除,使CDP系统可以保留数据更长的时间。为了更长时期的保存,也可以把某些恢复点从磁盘上导出,备份到磁带上。很多公司使用全部这三种方法:对每个变化,保留几天;小时级恢复点保留一周;其后每日的恢复点会在90天后保存到磁带。
真正精彩的是CDP是如何处理恢复的。无论什么应用需要一个恢复卷或测试卷, CDP系统可以立刻提供,可以向前或向后回滚到任意想要的时间点。(前面已经提到,许多用户选择回滚到他们建立应用一致性影像的时间点。尽管这意味着他们会丢失那个时间点到现在之间的变化数据,很多人喜欢回滚到一个已知的一致性影像,而不是采用应急恢复流程。)
根据产品,恢复LUN可能是真正的恢复卷(向前向后回滚),也可能是用于测试恢复的虚拟卷,或者是已经被向前或向后回滚并提供给应用程序的恢复卷的中间的什么地方,而现实中实际的向前向后回滚是在后台发生的。某些系统针对同一个恢复卷能够同时提供多个时间点。
一旦原来的生产系统被修复,恢复流程会被翻转。通过把数据复制回原始的地方,恢复卷被用来重建原始生产卷。(如果系统仅仅是宕机,而不必替换,通常可能只是通过发送宕机期间的变化数据来更新一下当前时间点。)随着原始卷更新完成,应用程序可以被迁回其原来的位置并开始反向复制过程。
从典型的CDP恢复场景和传统的备份系统恢复流程的对比中,你会意识到连续数据保护就是备份和恢复的未来。
上一篇文章 连续数据保护归来(上):CDP的新生
翻译
相关推荐
-
Pure Storage推出ObjectEngine备份设备
闪存存储先驱Pure Storage公司开始进入云备份领域,让客户可对亚马逊云计算服务(AWS)上的数据进行重 […]
-
对象存储备份最大的好处是什么?
对象存储使得云备份更加实用,并且支持大规模的可扩展,因为对象存储主要是为了扩展而设计的,所以在低成本的商品硬件上存储对象存储通常是可以接受的。
-
揭开灾备真相——那些年我们见过的灾备术语
作为数据保护的最后一道屏障,灾备系统的重要性不言而喻。IT圈好像一夜之间都在说灾备,那么到底什么是灾备?为什么灾备如此重要?未来发展趋势如何?本系列文章带你认清灾备真相。
-
面向海量规模与高度扩展方向转化的二级数据存储
在闪存领域的投资,以及线上的二级数据存储架构帮助企业能够处理更多的数据,与此同时提高在闪存上的投资回报。