有关“重复数据删除”的常见问题(1)
1. “重复数据删除”术语的真正含义是什么?
业内尚没有标准的定义,但我们正在逐步制定。目前普遍认为它是一种可以避免冗余数据存储的技术,而大多数人认为把这种重复数据删除的技术是数据块级的,而非文件级的。这是一项重要功能。举个例子来说,文件级数据压缩系统会将 20个具有不同首页的同一演示文档 (PPT) 视为 20个完全不同的文件;而数据块级系统则会认为各文件中除了首页之外的内容都是冗余的,并且只保留1个文件和所有的20个首页,从而大大节省存储空间。
最有效的重复数据删除技术使用的是“可变长度数据块”方法。采用这种方法的产品会将一组数据划分为很多长度不等的数据块,如果发现重复数据块,它们就会在源文件中插入一个指针,而不是将重复数据块连续存储两次。指针比数据块的占用空间小,因此为您节省了不少存储空间。对于重复数据块反复出现的备份作业来说,这种方法存储的数据量比传统磁盘高出 10 到 50 倍。
2. 如何将重复数据删除应用到数据复制?
复制是指将相同数据从源位置发送到目标位置的过程。如果您希望复制所有备份数据,那么必须有一个性能相对较高的网络提供支持。而借助重复数据删除技术,发送数据的源系统就能够挑拣出复制数据流中的重复数据块。如果某个数据块已发送到了目标系统,那么源系统就无需再重复发送此数据块,而只需发送一个指针即可。由于指针比数据块小很多,因此执行复制作业所需的带宽就大大降低了。
3. 哪些应用程序与重复数据删除技术兼容?是否有不兼容的应用程序?
对于备份作业来说,重复数据删除技术支持所有应用程序 — 电子邮件、数据库、打印和文件应用程序等等,当然还包括各符合条件的备份包。“可变数据块长度”重复数据删除技术能够挑拣出备份数据流中的所有冗余数据。某些文件类型(例如某些富媒体文件)首次采用重复数据删除技术进行发送时,这种方法并不会表现出多少优势,这是因为编写这些文件的应用程序已预先消除了冗余数据。但这些文件在备份多次之后,或者经过某些小改动后再进行备份,重复数据删除技术就会表现出十分强大的容量优势。
4. 如何了解重复数据删除技术为我的数据处理带来的优势?
四项主要变量会告诉您答案。数据变化情况(即加入了多少新数据块);数据的压缩效果;备份方法(例如,是完全备份还是增量备份);数据的计划保存时间。另外,一些供应商(包括昆腾)还将提供“优势计算器”来帮助您进行评估。
5. 重复数据删除技术有何实际好处?
好处有两个。1) 与传统的磁盘备份系统相比,重复数据删除技术可以让您在磁盘上存储更多的数据,这意味着您将可以在短时间内恢复更多的数据。2) 通过标准广域网和复制技术来实现数据恢复保护已切实可行,这减少了用户在磁带处理上的工作。
立新学士 发表于: 2009-11-26
我要回答相关推荐
-
简单可靠的平面备份技术
在过去,很少有人认为平面数据备份可以成为传统备份方式的靠谱的替代者。而到了现在,随着快照技术的不断增强,趋势正在改变。
-
专家答疑:重复数据删除在云中是如何工作的?
重复数据删除过程减少了存储系统中的数据量,但云中的重复数据删除可能比客户对云提供者更有价值。
-
全闪数据中心的数据缩减攻略
全闪存数据中心的概念之所以很吸引人,是因为它可以消除耗时的系统调优。它使数据中心得以支持最大的虚拟机密度,它的存储响应时间让大多数应用程序提供者都感到满意。
-
存储采购并非易事
硬盘市场的下滑并没有带来相应的固态存储市场的蓬勃发展,但固态存储将最终取代机械硬盘,在这一路上也会不断有惊喜。
-
VMware发布VSAN 6.1 下一代产品将交付重复数据删除
VMware发布其VSAN 6.1版本,并着手准备下一代超融合架构系统的测试版,并最终在其方案中交付数据重复删除技术。