去重最佳实践:该做的和不该做的

日期: 2009-10-12 作者:Curtis Preston翻译:曹同举 来源:TechTarget中国 英文

在进行数据备份时,采用重复数据删除技术可以减少硬盘的使用空间。但重复数据删除有时会受到其他应用程序的影响。有一些方法可以解决这个问题,但似乎不是很完美。 下面这篇文章给我们讲解了在执行重复数据删除时的注意事项。

目标端重复数据删除 这一部分只适用于目标端重复数据删除系统。包括目标端重复数据删除硬件设备和目标端重复数据删除软件(例如:CommVault CommVault的Simpana 和Symantec的NetBackupPureDisk )。 不要因为可以得到较好的重复删除比率就多次进行全备份。一些用户经常被告知,执行全备份可以增加重复删除的比率。

请不到这么做。经常做全备份可以更容易的恢复……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

在进行数据备份时,采用重复数据删除技术可以减少硬盘的使用空间。但重复数据删除有时会受到其他应用程序的影响。有一些方法可以解决这个问题,但似乎不是很完美。

下面这篇文章给我们讲解了在执行重复数据删除时的注意事项。

目标端重复数据删除

这一部分只适用于目标端重复数据删除系统。包括目标端重复数据删除硬件设备和目标端重复数据删除软件(例如:CommVault CommVault的Simpana 和Symantec的NetBackupPureDisk )。

不要因为可以得到较好的重复删除比率就多次进行全备份。一些用户经常被告知,执行全备份可以增加重复删除的比率。请不到这么做。经常做全备份可以更容易的恢复数据并且可以减少DBA同事的工作量(因为DBA经常在增量恢复时遇到问题)。不要只是为了增加重复删除的比例而一直进行全备份。

将更多的数据备份工作放在磁盘上进行。在硬盘上使用重复数据删除要比在磁带上效果更显著。如果你原来的设定是30天在磁盘上,60天在磁带上,现在考虑把90天的任务全部都放在硬盘上。如果重复数据删除比率高的话,用户肯定会为节省的空间感到惊叹。

将数据备份到虚拟磁带库时(VTL)不要使用复用技术。许多管理员把这一个技巧应用在了VTL上,但效果却截然相反。即使存储系统支持复用技术,但仍然建议用户关闭这项功能。如果想在10个虚拟磁带库上进行40个备份操作时,需要创建40个虚拟磁带库驱动并且关闭复用技术。

源端和目标端重复数据删除

不要过分关注重复数据删除比例。选择产品时要仔细检查这个数值。不要等到软件安装之后再去考虑这个问题,尤其是第一次安装时。重复数据删除的比例一开始比较低,以后会越来越高。用户应该定期检查一下重复数据删除的比率是否有大的变化,通过这种方式也可以发现一些隐藏的问题。

不要在数据重复删除之前进行加密。例如,不要对WIndows 加密文件进行重复数据删除操作,这样根本没有效果。重复数据删除系统需要把具有重复模式的数据进行删除,但加密过的文件并没有这种数据。

不要在重复数据删除之前进行数据压缩。主要有两个原因,重复数据删除包含压缩功能,所以不需要再次压缩。第二个原因是,压缩会破坏数据,这样会增加重复数据删除寻找重复数据的难度。(CommVault公司的产品可以在重复数据删除之后进行数据加密和压缩,而且不会影响重复删除的比率)。

不要对那些重复删除比率不好的数据进行此操作。在大部分的环境中,人工创建的数据(例如office 文档,数据库)重复删除的效果比较好,而对那些由系统自动生成的数据效果并不明显。图片,视频,音频,微型资料在内的这些数据都不是很合适,可以考虑把这些数据存储在无重复数据删除功能的设备上。(一些设备的重复数据删除功能是可以关闭的)。

仔细阅读产品的最佳实践文档,并且采用它们的建议。本篇文章提及的这些建议几乎适用于大部分的重复数据删除系统。但用户也需要知道自己已购买产品的特性。

在购买产品之前先进行测试。产品有好有坏,需要用户自己去测试对比,然后选择一款最适合自己的产品。

如果需要在磁带上进行重复数据删除,购买前需要先进行测试。这样才能看出它们真正的区别。

不要相信供应商所说的,例如在磁带转速最快时重复数据删除产品不会流化你的磁带等。时间可能很短,但它的确存在。而有些产品只能磁带流化5年或者6年。

用户在购买产品之前需要仔细测试,部署时需要仔细阅读文档并且采用厂家的建议。

相关推荐

  • 简单可靠的平面备份技术

    在过去,很少有人认为平面数据备份可以成为传统备份方式的靠谱的替代者。而到了现在,随着快照技术的不断增强,趋势正在改变。

  • 专家答疑:重复数据删除在云中是如何工作的?

    重复数据删除过程减少了存储系统中的数据量,但云中的重复数据删除可能比客户对云提供者更有价值。

  • 全闪数据中心的数据缩减攻略

    全闪存数据中心的概念之所以很吸引人,是因为它可以消除耗时的系统调优。它使数据中心得以支持最大的虚拟机密度,它的存储响应时间让大多数应用程序提供者都感到满意。

  • 存储采购并非易事

    硬盘市场的下滑并没有带来相应的固态存储市场的蓬勃发展,但固态存储将最终取代机械硬盘,在这一路上也会不断有惊喜。