重复数据删除的优缺点与认识误区

日期: 2009-04-14 作者:Pierre Dorion翻译:涂凡才 来源:TechTarget中国 英文

重复数据删除是一项相对较新的技术,在数据存储环境得到广泛的应用。不过,一种环境下适用并不代表所有环境下都适用,在部署重复数据删除技术之前必须要清楚它是否能够弥补存储环境的不足、是否有助于满足需求或节约成本。通常,存储厂商总是善于找到你存储环境中需要它们技术的地方,而不是提供满足你实际需求的技术。所以,你要留意厂商所谓的ROI计算器,它们总会输出一些诱人的节约量。

谈到重复数据删除业务分析(Business Case),人们总是喜欢用“开销”一词,而不是“投资”,因为我们说的是备份。除了备份服务商以外,几乎没人会从数据备份技术上获得盈利。对于大多数企业来说,备份只是一个防止损失的途径,所以思维定……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

重复数据删除是一项相对较新的技术,在数据存储环境得到广泛的应用。不过,一种环境下适用并不代表所有环境下都适用,在部署重复数据删除技术之前必须要清楚它是否能够弥补存储环境的不足、是否有助于满足需求或节约成本。通常,存储厂商总是善于找到你存储环境中需要它们技术的地方,而不是提供满足你实际需求的技术。所以,你要留意厂商所谓的ROI计算器,它们总会输出一些诱人的节约量。

谈到重复数据删除业务分析(Business Case),人们总是喜欢用“开销”一词,而不是“投资”,因为我们说的是备份。除了备份服务商以外,几乎没人会从数据备份技术上获得盈利。对于大多数企业来说,备份只是一个防止损失的途径,所以思维定势就是省钱。你肯定不会听到“通过向备份技术投资来增加收益”这样的话。因此,要想为重复数据删除做一个有说服力的Business Case,就得从省钱说起。

你要用重复数据删除解决什么问题?

首先,你需要搞清楚的问题是:你要用重复数据删除解决什么问题?尽管说采用新技术改善某些IT过程的工作方式没有什么不对的,但如果你的目的是为了节约成本或解决某些不符合要求的问题,获得项目资金就会更容易一些。在本文余下部分,我们将详细介绍重复数据删除的优缺点,帮助你做出有说服力的Business Case。

重复数据删除的优点

远程办公室:远程办公室有一个通病,就是缺乏场内(onsite)管理备份的技能,重复数据删除技术可以帮助解决这个问题。利用具有重复数据删除的磁盘阵列作为备份数据的主要存储介质后,就不用担心磁带是否随时可用的问题,也不需要加载磁带数据来进行恢复了。而且,你还可以通过广域网复制过程去重处理的数据,获得一个管理开销较低的备份解决方案。此外,通过广域网复制去重的数据可以降低网络带宽需求,是一个比磁盘镜像更加便宜的解决方案。虽然采用重复数据删除磁盘阵列不一定会有立竿见影的效果,但发生备份错误或备份丢失的机率都很低。

重复数据删除与重复文件:重复数据删除技术可以消除重复文件,这是它最有诱惑力的特点之一。从节约成本的角度来说,重复或相似文件数量较大的环境可以通过重复数据删除获得很大的好处。当环境中有大量的相同数据块时,重复数据删除的效果最佳。在完全备份比较频繁和数据变更率较低的情况下,重复数据删除的节约比率会非常诱人,可以节省巨大的存储成本。去重比例在5:1到10:1之间是非常正常的事,有些环境下重复数据删除比例甚至可以达到20:1。

减少存储介质操作:对于仍然需要磁带操作员和存放磁带库的磁带架的环境来说,重复数据删除提供了一个减少存储介质操作的绝好机会。通过远程拷贝去重数据,你不需操作场外(offsite)介质,也不需要大量的网络带宽就可以满足备份窗口要求。分布于多个地点且互相之间已通过网络连接的企业可以利用复制去重的数据来降低场外存储预算,将资源重新分配给那些生产效益更好的任务,而且这并不会花费太多的成本。

空间回收:数据中心的空间是需要成本的,所以减少磁带库占用的空间非常有意义。数据中心可以利用重复数据删除磁盘阵列代替磁带库,从而节约存储设备占用的空间。

磁带升级:任何考虑磁带技术升级的企业都应该认真考虑一下磁盘重复数据删除。尽管替换仍能满足需求的磁带子系统不一定会带来财务上的收益,但技术更新的需求往往会刺激人们考虑和评估其它的可选技术或方案。

重复数据删除的缺点

数据类型:重复数据删除并不是对所有的数据类型都适用。镜像文件、音频、视频等文件类型和压缩数据的重复数据删除效果并不明显。

加密:对于注重安全性、在数据源执行加密的企业,备份级重复数据删除并不是最好的选择,因为加密操作的第一件事就是让数据没有密钥就无法识别。这样,重复数据删除的大部分功效就没有了,除非加密过程是在重复数据删除之后执行。

过渡过程数据:保留时间非常短的数据通常不会有太好的去重比率,因为重复数据删除在生效之前首先需要为那些相同的数据块建立一个库,如果数据只是流经存储阵列或保留时间很短,重复数据删除算法就来不及将数据入库。对于保留时间较长的数据,重复数据删除的效果绝对会好很多。

重复数据删除认识误区

不要误以为重复数据删除VTL是取之不尽、用之不竭的磁带源。尽管厂商可能允许你配置128个甚至更多的逻辑磁带驱动,这并不会自动带来大的性能提升。比如说,你如果通过1GB的连接将数据传向100多个虚拟磁带驱动,其性能也不会超过1GB。你会发现,花了好几万美元之后,系统还是存在同样的性能瓶颈。

重复数据删除磁盘阵列虽然比磁带快,但同样有一些局限性,很多厂商就利用了这一点。磁盘重复数据删除技术与镜像或快照技术不同,数据如果是由备份产品管理就必须被重组,而且必须以应用能够读取的格式写入到文件系统。根据实际使用的重复数据删除技术的不同,大型恢复操作的性能也可能比较令人失望。

我们应该像对待任何其它技术一样看待重复数据删除技术,不要以为它是万能的新技术。除非它的采用可以弥补其它技术的不足或确实可以减少初始成本和运营成本,否则它将会令你感到非常失望。

相关推荐

  • 简单可靠的平面备份技术

    在过去,很少有人认为平面数据备份可以成为传统备份方式的靠谱的替代者。而到了现在,随着快照技术的不断增强,趋势正在改变。

  • 专家答疑:重复数据删除在云中是如何工作的?

    重复数据删除过程减少了存储系统中的数据量,但云中的重复数据删除可能比客户对云提供者更有价值。

  • 全闪数据中心的数据缩减攻略

    全闪存数据中心的概念之所以很吸引人,是因为它可以消除耗时的系统调优。它使数据中心得以支持最大的虚拟机密度,它的存储响应时间让大多数应用程序提供者都感到满意。

  • 存储采购并非易事

    硬盘市场的下滑并没有带来相应的固态存储市场的蓬勃发展,但固态存储将最终取代机械硬盘,在这一路上也会不断有惊喜。