无硬件的软件复制

日期: 2015-12-06 作者:Chris Evans 来源:TechTarget中国

在灾难恢复解决方案中,数据复制是其中一个关键的影响因子。基于磁盘阵列的数据复制一直以来大行其道。然而,如今应用部署方式的改变意味着可以从另一方面达成数据保护,即通过软件,而非硬件如磁盘阵列。另外,软件解决方案可以解决基于硬件复制存在的一些问题和限制,在保护数据方面,提供了更大的灵活性和更多的选择。

基于阵列的数据复制技术 基于阵列的数据复制跟Integrated Cached Disk Array(ICDA)即今天的SAN 存储历史几乎一样长,它组合了磁盘,缓存,微码信息以便提供优化的I/O和从一个位置到另一个位置的数据复制功能。 IBM大型机存储部署的点对点拷贝技术是利用一种硬件——I/O子……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

在灾难恢复解决方案中,数据复制是其中一个关键的影响因子。基于磁盘阵列的数据复制一直以来大行其道。然而,如今应用部署方式的改变意味着可以从另一方面达成数据保护,即通过软件,而非硬件如磁盘阵列。另外,软件解决方案可以解决基于硬件复制存在的一些问题和限制,在保护数据方面,提供了更大的灵活性和更多的选择。

基于阵列的数据复制技术


基于阵列的数据复制跟Integrated Cached Disk Array(ICDA)即今天的SAN 存储历史几乎一样长,它组合了磁盘,缓存,微码信息以便提供优化的I/O和从一个位置到另一个位置的数据复制功能。

IBM大型机存储部署的点对点拷贝技术是利用一种硬件——I/O子系统来复制数据。其技术最新演化的代表是EMC公司的Symmetrix Remote Data Facility (SRDF)产品和日立公司的TrueCopy产品。基于阵列的复制技术把复制数据最繁重的工作从中央处理器直接转移到了磁盘阵列。这个过程将持续提供诸多独特的优势:

转移负载 。阵列执行所有复制任务,减少了对主机的CPU和内存资源的消耗。

数据一致性。阵列本身负责写顺序的完整性,确保数据复制到另一个位置,而数据的更新应用于数据一致性的保证。

性能。阵列能够在两个复制位置把I/O缓存在非易失性内存中,以改善同步和异步传输的性能。

粒度。阵列可以复制和管理单个LUN、LUN组(一般叫做一致性LUN组)和整个阵列的的故障切换。

数据完整性。当有任何数据失败而要切换到目标磁盘阵列时,源阵列能够跟踪数据改变,仅仅将改变的数据传回到源站点而不需要完全的重新同步。这对于完全的故障切换场景来说非常重要,这其中,恢复过程会在非保护的灾难恢复状态下运行一段时间(那时需要执行完全的重新同步)。

优化。复制过程一般在两点间进行针对已改变的数据的复制(其块大小由阵列底层架构决定,可以是磁道或块),优化了带宽。

扩展效率。阵列级别的故障切换适用于许多服务器数据复制,能够在短时间内实现数据在远程位置可用。当与脚本化组合,这个过程会扩展的很好,也将减少故障切换过程中大量存储管理人员的需要。

虽然有如此多可观的优势,基于阵列的复制还是存在着不可回避的一些重要的劣势:

成本。阵列复制是个很昂贵的解决方案,产商一般以TB为单位收费,所以必须将其应用到关键需求数据上。复制方案也需要昂贵的网络方案,在很多情况下,还需要专用的光纤通道链路。

私有性。基于阵列的复制方案局限于特定的生产商,并不提供跨生产商的支持。复制方案的设计通常利用底层物理架构,以块或磁道级别进行数据移动。这意味着数据不能从一个生产商的设备移动到另一个生产商,对用户来说,就有了生产商锁定的问题。

复杂性。 基于阵列的复制方案利用本地非易失性内存来缓存I/O,进而提供性能。附加的高级功能如快照和克隆也必须在复制的框架内进行管理,导致了复杂的配置。这一般不是问题,除了在失败场景下或者软件bug改变系统原有状态下。

服务器崩溃下的拷贝。如果没有代理应用,基于阵列的复制就会无法感知数据本身,仅仅在不同位置间进行匿名块的移动,虽然保持着写顺序的完整性。这表明,如果进行故障切换的话,整个系统看起来就像服务器崩溃了,这也会导致数据损坏问题或延长系统重启时间。


粒度。对于基于块的系统,最小复制级别就是LUN,在虚拟环境下,LUN可能涉及多个虚拟机。对单个LUN进行故障切换,其结果是对所有虚拟机进行故障切换,不管这种故障切换是否必要(基于文件的系统可以在文件级别进行复制,提供了较细的复制粒度)。

基于阵列的复制方案有多种改进选项,其依赖于要解决的具体问题。下面我们就分别阐述:

复制设备

利用专用的复制设备承担从存储阵列到一个独立的存储设备、运行在物理或虚拟服务器上的软件间数据拷贝的任务。一个很好的例子是EMC的RecoverPoint软件(收购自Kashya公司)。此软件实际位于数据路径,抓取每次的写I/O数据,然后拷贝(本地数据用记录机制来保护)到位于远程位置的一个类似的设备上(在那里,这些数据就应用到对应的远程拷贝上)。这个过程允许数据复制到非生产商提供的磁盘阵列,在保持数据一致性的同时易于管理,所以,提供了磁盘阵列内建的复制方案的所有好处。但是,也有许多问题没有解决,特别是那些涉及数据一致性的问题,因为这个解决方案实际上一直在阵列级别进行数据移动。

虚拟机监视器内的复制

消除与复制方案相关的一些传统组件意味着把数据的管理往应用端迁移。对于虚拟系统,这表示虚拟机监视器比如威睿的vSphere或者微软的Hyper-V。虚拟机监视器了解数据的内容(至少知道数据是个虚拟机),因此,能够以合适的粒度管理数据的复制(例如一个虚拟机自身的复制而不是包含这个虚拟机的整个LUN)。


威睿和微软两个厂商都在其虚拟机监视器技术中提供复制功能。威睿的 vSphere提供vSphere Replication功能,这是由vCenter系统恢复管理器管理。微软的Hyper-V通过Hyper-V来实现,其管理则通过系统中央虚拟机管理器(SCVMM)。

当然,复制的任务仍然需要在某个地方执行。在这种情况下,责任就放在了虚拟机监视器上,这就对中央处理器,内存,网络资源的需求增加了。这些解决方案也不是免费的,所以使用虚拟机监视器进行复制有一定的成本负担。

跟复制设备一样,虚拟机监视器复制提供了把数据放到低成本存储或其他产商提供的并非全功能设备的能力。然而,选择便宜和低效存储作为复制目标阵列也许是个错误的选择,除非负载特征是特殊的(例如,没有被复制的测试数据在一个灾难中丢失了)。

虚拟机内的复制

不利用虚拟机监视器提供的复制功能,而是利用虚拟机进行复制。有两种方法来达到。一些解决方案用虚拟机拦截来自虚拟机的数据,而另一些复制应用配置虚拟机作为一个代理数据存储,其中实际的数据存储在外接或本地的存储上。这个“数据存储虚拟机”可以看到所有的I/O业务、复制写I/O到其他位置同时也提交到本地存储。

Zerto公司适用于威睿的复制软件使用威睿应用编程接口(VMware APIs)来监控和拦截写I/O,利用位于源和目标主机商被Zerto称作虚拟复制设备(VRAs)的虚拟设备来进行复制。Atlantis公司的ILIO USX可以为虚拟机池化来自任何类型的存储,在系统间复制数据来保证高可用性。

基于虚拟机的复制消耗虚拟机监视器的资源,很明显,随着更多的虚拟机添加到集群中,需要对复制进行仔细的监控。另外,需要给执行复制的虚拟机优先级以便保证其能够执行复制命令。

LVM卷管理器内的复制

逻辑卷管理器(LVMs)是以LUNs和卷的形式位于物理存储资源层和数据的逻辑表示层之间。因为LVM可以看到主机和物理存储之间的所有的 I/O ,所以是个管理复制的完美区域。DataCore公司的SANsymphony-V软件和StarWind软件公司的虚拟SAN实现了对物理存储资源的逻辑卷抽象,同时添加了高级功能包括同步镜像、异步复制和近持续数据保护功能。这些解决方案在存储设计中引入了复杂性,但是为得到所有这些高级功能,这些方案是可以接受的。

新解决方案

当然,有一批软件公司对近20年的P2P复制技术提出了挑战。对象存储软件公司正在通过简单镜像或数据分发技术如纠删码(即熟知的前向纠错码)来实现数据保护。纠删码算法把多个冗余的数据片段地理上分散存储,允许仅从部分片段中恢复数据。数据保护和复制功能是在读和写的过程中实现的。

低性能会是这些解决方案明显的缺陷。然而, Scality和Cleversafe等公司正在把闪存集成到他们的架构中(这两个产品可以以纯软件方式提供)以提高性能。开源项目如ceph里利用镜像(数据复制)和纠删码技术等构建分布式数据存储,可以存储块,文件,对象数据。虽然这个技术仍处于早期发展阶段。但由于Inktank公司(该公司提供ceph开发和支持服务)被红帽公司收购,我们可以期望在几年之后,该技术能够走向成熟。

云中的复制

作为题外话,我们应该承认私有云和公有云基础设施的正逐渐普及。基于软件的复制提供了一种机会,以一种比采用基于阵列的复制更加实际的方式往云基础设施内外移动数据。虽然带宽可能使得迁移整个虚拟机不太现实,但是基于软件的复制方案为私有云和公有云解决方案在数据移动性方面提供了最高级别的灵活性。

一些硬件厂商提供的解决方案,是将他们的硬件放在云服务提供商所在位置。这些方案仅仅提供了短期的修复,因为随着我们进入异构世界,基于软件的复制方案将占统治地位。


文章选自存储经理人2014年11月刊:轻松备份虚拟机,欢迎下载阅读!

作者

Chris Evans
Chris Evans

Chris Evans已经在IT行业工作了25年以上。早期的职业生涯始于大型机领域,然后进入存储和系统编程领域,专注于开放系统存储和目前流行的虚拟化和云技术。

相关推荐

  • Pure Storage推出ObjectEngine备份设备

    闪存存储先驱Pure Storage公司开始进入云备份领域,让客户可对亚马逊云计算服务(AWS)上的数据进行重 […]

  • 数据中心灾难恢复规划模板与指南

    阅读本篇有关数据中心灾难恢复规划指南,然后免费下载我们提供的模板,评估数据中心设施及其基础架构在灾难期间的表现。

  • 对象存储备份最大的好处是什么?

    对象存储使得云备份更加实用,并且支持大规模的可扩展,因为对象存储主要是为了扩展而设计的,所以在低成本的商品硬件上存储对象存储通常是可以接受的。

  • 揭开灾备真相——行业现状及趋势

    笔者在上一篇文章《揭开灾备真相——那些年我们见过的灾备术语》里介绍了灾备领域常见的一些专业术语,本文将站在行业角度,介绍灾备市场的现状及未来趋势。