有关“重复数据删除”的常见问题(1)

1. “重复数据删除”术语的真正含义是什么?
业内尚没有标准的定义,但我们正在逐步制定。目前普遍认为它是一种可以避免冗余数据存储的技术,而大多数人认为把这种重复数据删除的技术是数据块级的,而非文件级的。这是一项重要功能。举个例子来说,文件级数据压缩系统会将 20个具有不同首页的同一演示文档 (PPT) 视为 20个完全不同的文件;而数据块级系统则会认为各文件中除了首页之外的内容都是冗余的,并且只保留1个文件和所有的20个首页,从而大大节省存储空间。
最有效的重复数据删除技术使用的是“可变长度数据块”方法。采用这种方法的产品会将一组数据划分为很多长度不等的数据块,如果发现重复数据块,它们就会在源文件中插入一个指针,而不是将重复数据块连续存储两次。指针比数据块的占用空间小,因此为您节省了不少存储空间。对于重复数据块反复出现的备份作业来说,这种方法存储的数据量比传统磁盘高出 10 到 50 倍。
2. 如何将重复数据删除应用到数据复制?
复制是指将相同数据从源位置发送到目标位置的过程。如果您希望复制所有备份数据,那么必须有一个性能相对较高的网络提供支持。而借助重复数据删除技术,发送数据的源系统就能够挑拣出复制数据流中的重复数据块。如果某个数据块已发送到了目标系统,那么源系统就无需再重复发送此数据块,而只需发送一个指针即可。由于指针比数据块小很多,因此执行复制作业所需的带宽就大大降低了。
3. 哪些应用程序与重复数据删除技术兼容?是否有不兼容的应用程序?
对于备份作业来说,重复数据删除技术支持所有应用程序 — 电子邮件、数据库、打印和文件应用程序等等,当然还包括各符合条件的备份包。“可变数据块长度”重复数据删除技术能够挑拣出备份数据流中的所有冗余数据。某些文件类型(例如某些富媒体文件)首次采用重复数据删除技术进行发送时,这种方法并不会表现出多少优势,这是因为编写这些文件的应用程序已预先消除了冗余数据。但这些文件在备份多次之后,或者经过某些小改动后再进行备份,重复数据删除技术就会表现出十分强大的容量优势。
4. 如何了解重复数据删除技术为我的数据处理带来的优势?
四项主要变量会告诉您答案。数据变化情况(即加入了多少新数据块);数据的压缩效果;备份方法(例如,是完全备份还是增量备份);数据的计划保存时间。另外,一些供应商(包括昆腾)还将提供“优势计算器”来帮助您进行评估。
5. 重复数据删除技术有何实际好处?
好处有两个。1) 与传统的磁盘备份系统相比,重复数据删除技术可以让您在磁盘上存储更多的数据,这意味着您将可以在短时间内恢复更多的数据。2) 通过标准广域网和复制技术来实现数据恢复保护已切实可行,这减少了用户在磁带处理上的工作。

立新学士  发表于: 2009-11-26

我要回答

电子邮件地址不会被公开。 必填项已用*标注

敬请读者进行回答,本站保留删除与本问题无关和不雅内容的权力。

相关推荐