“云灾备”蓝图 作为当下最热门的高技术,云计算不仅仅用于移动设备和平板电脑目前,云被业界热炒的程度,甚至已经超出了其自身的价值。这产生了意想不到的结果,有时候甚至遮盖它真正的功能。 尽管基于云的容灾仍然只是一个新的概念,我们能够见到的产品和服务也不多,但有些公司,尤其是那些创新的小公司,已经开始利用云计算技术提供容灾服务了。对于许多IT资源有限的用户来说,基于云的容灾不失为一个好的选择,因为云服务是一种随用随付费的模式,而企业如果自建容灾设施的话,在大多数时间又处于闲置和备用状态,所以云非常适合那些中小企业。
在利用云服务设立容灾站点之后,企业对数据中心空间、IT基础设施和IT资源的依赖程度会大……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
“云灾备”蓝图
作为当下最热门的高技术,云计算不仅仅用于移动设备和平板电脑目前,云被业界热炒的程度,甚至已经超出了其自身的价值。这产生了意想不到的结果,有时候甚至遮盖它真正的功能。
尽管基于云的容灾仍然只是一个新的概念,我们能够见到的产品和服务也不多,但有些公司,尤其是那些创新的小公司,已经开始利用云计算技术提供容灾服务了。对于许多IT资源有限的用户来说,基于云的容灾不失为一个好的选择,因为云服务是一种随用随付费的模式,而企业如果自建容灾设施的话,在大多数时间又处于闲置和备用状态,所以云非常适合那些中小企业。在利用云服务设立容灾站点之后,企业对数据中心空间、IT基础设施和IT资源的依赖程度会大幅下降,进而导致运营成本的大幅下降。借助云,小型企业也能实施容灾系统,而在此之前,只有大型企业才能做到这一点。
“有了基于云的容灾,用户关注的问题就不再是数据中心空间和硬件,而是云资源的容量规划。”ESG资深分析师Lauren Whitehouse说。
但是,基于云的容灾还不是一个完美的方案,用户在尝试它之前必须清楚它的短板和挑战。以下是用户最关注的问题,而对安全的顾虑首当其冲。
•数据是否能够安全地迁移到云平台,并在云平台安全保存?
•怎样对用户进行认证?
•密码是唯一的安全保障吗?除此之外,云服务供应商是否提供某种类型的双认证方式?
•云服务供应商是否能够满足用户对需求的调整?
因为云平台是通过Internet访问的,所以用户必须明白足够的网络带宽是应用的基本保证。如果没有经过仔细的分析,只根据数据迁移到云平台的需求规划带宽是不够的,因为其风险在于,一旦灾难发生,远程访问云端的数据是否有充足的带宽保障?我们可以看看下面的问题:
•你是否有足够的带宽和网络能力将所有的用户重定向连接到云平台?
•你是否有恢复计划,将数据从云平台恢复到准备好的基础设施,这个恢复过程需要多长时间?
行业专家、云备份和开源备份应用服务商Zmanda公司的创始人、CEO Chander Kant 说:“如果你将基于云的备份作为容灾体系的一部分,那么你需要为恢复设计备份策略。”另外,云服务提供商的可靠性、可用性以及他们在灾难恢复过程中的服务能力都是需要考虑的关键因素。选择云服务提供商或者管理服务提供商(MSP,managed service provider)是非常重要的,要看他们具体能够提供哪些服务条款。一旦选错了对象,后果可能相当严重,轻则颜面扫地,重则可能因此失去工作。
设计灾难恢复蓝图
与传统的容灾一样,基于云的灾难恢复也没有一个简单且固定的蓝图。每家公司运行的应用系统、应用程序与业务之间的关联关系以及行业背景都是不同的。因此,对于一个公司来说,基于云的灾难恢复蓝图(灾难恢复计划)通常是按需定制的,跟其他公司都不一样。
做一套基于云的容灾计划依然要遵循传统容灾的规范和流程,逐层的筛选、定义、分析。一个容灾计划的设计过程通常是从定义应用、服务以及数据的种类和优先级开始的;然后确定每一项应用的停机切换时间,这个时间长度必须是用户可以接受的,因为停机时间过长会给业务带来巨大影响。灾难恢复的手段和路线则由优先级和RTO(目标恢复时间)这两项参数决定。
定义关键的资源和恢复的方法是设计过程中最核心的部分。因为用户需要确保所有的关键应用和重要数据都包括在容灾蓝图之中。出于同样的原因,为了控制成本以及确保快速且准确的执行恢复计划,用户还应该将不相干的应用和数据排除出考虑范围。总之,企业越重视容灾计划,那么他们就会定期测试这个计划,进而在真正按计划流程执行操作时,达到预期目标的可能性也就越高。
在明确了应用范围、优先级以及RTO指标之后,用户就能决定选择最佳的和最具成本效益的方案以达到RTO的要求。为此,需要相应的应用软件和服务。在极端的情况下,用户可能只采用一种容灾手段,用于保护所有的应用系统和数据,但这种情况很少见;大多数时候用户会选择几种技术手段分别用于不同的应用系统,并达到相近的RTO指标。Acronis公司的虚拟化实施经理Seth Goodling就此表达了自己的观点:“容灾技术指标因素和成本因素是一个混合模型,它带动了不同层面的灾难恢复技术的发展。”
基于云的灾难恢复应用
| 可管理的应用及可管理的容灾 | 基于云的备份和恢复 | 基于云的数据复制 |
典型应用 | * CRM应用Salesforce.com * 基于云的Email应用 | * 企业数据中心到云的备份 * Cloud to cloud云到云的备份 | *企业数据中心到云的复制 * Cloud to cloud云到云的复制 |
优势和价值 | * 完全可管理的容灾 * 基于使用资源的付费模式 * 最简单 | * 只需要云存储资源,可选云虚拟机资源; * 复杂度通常低于复制方案 | * 最佳的RTO和RPO指标 * 支持应用一致性恢复 |
挑战 | 为生产和容灾系统制定可行的SLA | RTOs 和 RPOs指标低于复制方案 | 复杂程度最高 |
实施方案 | N/A | 备份软件和备份设备 | -复制软件 -云网关 -云存储软件,EMC Atmos、Hitachi HCP等 |
基于云的容灾,我们有哪些选择?
可管理的应用及可管理的容灾。同时将生产系统和容灾系统部署到云平台,并交给管理服务提供商(MSP)管理的案例越来越多。这样做,用户能获得云计算模式带来的一切好处,从随用随付费的模式到削减固定基础设施资产等都是很明显的优势。用户自己不需要做什么,把容灾交给云服务商或者管理服务提供商就可以了。但是,选择服务提供商以及确定SLA(服务水平协议)的谈判过程是极其重要的。如果将控制权交给服务商,用户必须绝对确认服务商能够按照SLA的条款交付连续性的服务,无论对生产系统和还是容灾系统。StorageIO Group的创始人、资深分析师Greg Schulz说:“ SLA服务水平协议的条款不能夸大;而且要根据SLA的范围访问应用程序。”
对于email和其他一些商业类应用来说,采用云服务已经变得越来越普遍,比如客户关系管理系统CRM,在这个领域Salesforce.com是领导者,而且目前引领了基于云的CRM市场。
从云端备份和恢复数据。现在,大多数应用程序和数据仍然保存在用户自己的数据中心里,因此我们可以利用云技术,将数据备份到云平台,并且在灾难发生时,将数据从云端恢复到指定的用户端硬件上。换句话说,将数据备份到云端已经演变为基于磁带的离线备份的一种替代方式。
在仔细研究基于云备份和恢复的时候,清楚地理解备份和恢复的问题,尤其是问题较多的恢复部分至关重要。将数据备份到云是相对简单的,而且有些备份软件厂商已经在他们的产品包中提供了相关的选件,该选件支持将数据直接备份到那些主流的云服务提供商,比如AT&T、Amazon、Microsoft、Nirvanix以及Rackspace等公司的云平台上。CommVault System公司的技术联盟总监David Ngo说:“CommVault的云连接器可以把数据去重、压缩、加密之后发送到云端,并且允许用户设定数据保存在云存储的时间周期。”Ngo的话很贴切的总结了用户所需要的云备份产品的特性。还有一类云网关产品,比如Cirtas Bluejet Cloud Storage Controller、F5 ARX Cloud Extender、Nasuni Filer、Riverbed Whitewater以及Twinstrata CloudArray等等,也支持将数据迁移到云平台。云网关是企业数据中心和云存储之间的桥梁,负责做企业数据中心和云平台之间的数据同步。
基于云备份的灾难恢复的挑战在于数据恢复。带宽是个限制,而且如果是TB级的数据做恢复,那么想在限定的RTO时间段内将数据恢复到生产端是个巨大的挑战。有些云备份服务提供商开发出了一个可选的服务项目,将数据先导入磁盘设备,然后再将磁盘发送到客户本地的数据中心进行恢复。另一个可选的服务项目是在用户本地数据中心部署一个大的缓存设备,作为远程备份的前置缓存,以便于从缓存中直接进行本地恢复。OS33公司基础架构部门总裁Jim Avazpour就这个问题表达了自己的观点,他说:“我确信备份需要在本地执行,然后再从本地将数据传输到云端。也就是说,云备份会变成二级离线备份。”另一方面,从数据恢复的角度考虑,压缩功能以及更重要的重复数据删除功能的存在使得从云端直接恢复数据成为一种可行的方案。这里我们列举一个成功案例,密歇根州的Rockford建筑公司使用了StorSimple的云备份产品保护他们的Exchange和SharePoint系统。Rockford建筑公司负责IT的高级副总裁Shaun Partridge说:“万一发生灾难,我们会从云平台传回备用的虚拟机,因为使用了StorSimple的重复数据删除功能,所以完美地解决了网络的问题。我们只需要传回一个完整的虚拟机拷贝就可以了,而其他公司在没有使用去重技术的情况下,需要传回的数据量要多得多。”
备份到云、也恢复到云。在这种应用模式下,数据不必恢复到用户原来的生产中心,而是恢复到云平台的虚拟机上。因此,必须同时拥有云存储和云计算资源,Amazon的EC2(Elastic Compute Cloud)就是这种类型。恢复一般在宣布灾难之后执行,也可以在日常的指定时间操作(经常做预恢复)。某些应用对RTO指标有比较苛刻的要求,因此提前部署容灾用的虚拟机,并且通过数据恢复操作保持定期更新虚拟机的数据状态是非常重要的。有些云服务商可以提供便捷的选择,他们将云平台上定制好的虚拟机作为容灾服务的一部分提供给用户。FalconStor Software公司负责企业级解决方案的高级副总裁Chris Poelker说:“有多家云服务提供商采用了我们的产品,为用户提供安全的、带去重的数据复制保护,并能够在云端直接启动虚拟机。”
将数据实时复制到云端的虚拟机。某些关键的核心应用对恢复时间和RPO(恢复目标点)指标有苛刻的要求,因此,基于应用感知的数据复制成为必然的选择。将数据复制到云端虚拟机的方式即可以用来保护部署在云平台的生产系统,也可以保护企业本地数据中心里的生产系统。换句话说,复制技术适合两种应用模式:cloud-VM-to-cloud-VM和on-premises-to-cloud-VM的数据保护。复制类的产品主要有两种,一种是基于持续数据保护/CDP技术的,例如CommVault Continuous Data Replicator;另一种基于快照或是基于对象的云存储,比如EMC的Atmos以及Hitachi Content Platform (HCP)。HDS公司资深专家、高级内容服务总监Robert Primmer举了个例子,他说:“云服务提供商Peak Web Hosting公司实施了从企业数据中心HCP系统到Peak Web云平台HCP系统的复制方案,取代了另一个企业站点的HCP系统。”
老应用,新选择
云技术极大地拓展了灾难恢复的选择面,获益之处还在于明显降低了成本,使得容灾应用得以覆盖大量中小企业,而在此之前只有大型企业才有可能实施相关的项目。然而,容灾的基础工作内容并没有改变,仍然需要设计一个坚实的灾难恢复计划,定期进行测试,培训用户并且做好相关的准备工作。
本文选自存储经理人2011年5月刊:自动分层存储,请下载阅读PDF版本。
相关推荐
-
存储经理人2016年4月刊:软件定义存储,硬件还重要吗?
《存储经理人》2016年4月刊重点关注软件定义存储,内含统一阵列采购调查、最新NAS质量奖评选结果以及云归档技术探讨。同时,本月还关注NAS衍生趋势、云数据保护以及闪存可靠性等热门话题。
-
什么?我会担心灾难恢复?
有些厂家声称切换集群可以提供“实时”业务连续性或灾难恢复。要当心,那不是业务连续性也不是灾难恢复——有可能是灾难避免。
-
云容灾:小心应对多hypervisor!
云容灾供应商正在积极促进多hypervisor支持,但是企业在须在供应商的时候仍然要仔细考量四个因素。
-
从云端灾备回切生产系统要考虑的问题
从云端的灾备虚拟机(VM)回切到现场生产系统虚拟机,需要考虑的因素之一是虚拟机的IP地址修改。