中小型企业应如何评估重复数据删除产品(上)

日期: 2009-05-05 作者:Marc Staimer翻译:涂凡才 来源:TechTarget中国 英文

在之前的文章中,我已经讲解了如何辨别不同类型的数据精简(data reduction)和重复数据删除技术,其中包括硬件与软件压缩、文件级重复数据删除、块级/可变块级重复数据删除、delta-block优化和应用感知的(application-aware)重复数据删除。此外,我们还探讨了如何在备份软件、NAS或VTL中在线(in-line)执行和线后(post-processing)执行数据精简和重复数据删除技术。在本文中,我们将分析重复数据删除和数据精简技术的优点和不足。 硬件压缩与软件压缩 如果数据未被压缩和加密,那么数据压缩就是一个很好的选择。

它还有利于延长陈旧存储系统的生命周期。硬件级压……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

在之前的文章中,我已经讲解了如何辨别不同类型的数据精简(data reduction)和重复数据删除技术,其中包括硬件与软件压缩、文件级重复数据删除、块级/可变块级重复数据删除、delta-block优化和应用感知的(application-aware)重复数据删除。此外,我们还探讨了如何在备份软件、NAS或VTL中在线(in-line)执行和线后(post-processing)执行数据精简和重复数据删除技术。在本文中,我们将分析重复数据删除和数据精简技术的优点和不足。

硬件压缩与软件压缩

如果数据未被压缩和加密,那么数据压缩就是一个很好的选择。它还有利于延长陈旧存储系统的生命周期。硬件级压缩比软件压缩要快一些,处理延迟要远远低于软件压缩的方法。不过,软件压缩可以从网上免费下载,而硬件压缩是需要成本的。

不管是硬件压缩还是软件压缩,两种方法都不能减少重复的数据。如果文件被重复地储存了多次,无论多好的压缩算法都无法将多个压缩文件复本删除。

另外,如果数据或文件被加密或压缩过(如Excel、Word、PPT、PDF、JPEG、MPEG、Zip文件、压缩的数据流,甚至有些数据库),数据压缩也不是一个非常行之有效的办法。在这些情况下,数据精简的好处几乎是可以忽略的。就如zip压缩一个zip文件一样,有时压缩后文件反而更大了。

文件级重复数据删除

文件级的重复数据删除非常擅长于去重VMware.vmdk文件,尤其是ISO和模板文件,如VDI模板。此外,文件级重复数据删除在CAS(content-addressable storage,内容寻址存储)方面也很强。由于相同的文件只存储一次,所以它保留的文件都是独一无二的。

文件级重复数据删除并不是精简存储的最佳选择。它不能去重多个文件中的重复数据或差异非常小的文件。当去重的数据被读取或恢复时,还会有延迟。

块级/可变块级重复数据删除

块级/可变块级(block/variable block)的重复数据删除对备份数据、重复数据或快照数据极其有效。存储中的重复数据越多,重复数据删除比率越高。扩展性较好的系统价值更大。此外,重复数据删除还可以延长数据在磁盘上的保留时间,从而使得数据恢复过程更快。

基于块级的重复数据删除还有一个强项,就是删减重复的VMware.vmdk文件(ISO文件、模板文件、VDI)以及各.vmdk文件中的重复数据。

但是,块级/可变块级的精简数据在迁移到其它类型的存储(如磁带存储、光存储,甚至是其它目标磁盘存储设备)之前,必须首先被复原。这也会大大增加备份数据或快照数据的恢复时间。尽管有些例外情况下性能也不会受到影响,但额外的延迟往往使其无法作为很多应用的主存储。

另外,与文件级重复数据删除一样,块级的重复数据删除也不太擅长于压缩数据和加密数据,它不会去重不能识别的数据。

Delta block优化

Delta block优化可以减少被备份或快照的数据量,从而减少数据存储量和数据保护所需带宽。

Delta block优化所不能做到的是删减不同服务器和文件中的重复数据块,即使这些重复的数据块由同一个软件保存在同一个数据存储中也无法通过Delta block优化删除。有些备份软件由于最初是针对磁带备份的,所以代码中存在一些很古老的问题。它可能会周期性地进行全卷(full volume)备份或虚拟全卷(virtual full volume)备份,这会大大地降低整体性能。

应用感知的(Application-aware)重复数据删除

对主存储来说,应用感知的重复数据删除是最为高效的数据精简技术,因为它非常擅于处理压缩文件,只是名义上有一个文件解压缩延迟。然而,应用感知重复数据删除需要一个运行于应用或NAS上的“读取器”或过滤器。此外,它还需要一个设备执行所有的应用感知去重任务并提供元数据。

相关推荐

  • 简单可靠的平面备份技术

    在过去,很少有人认为平面数据备份可以成为传统备份方式的靠谱的替代者。而到了现在,随着快照技术的不断增强,趋势正在改变。

  • 专家答疑:重复数据删除在云中是如何工作的?

    重复数据删除过程减少了存储系统中的数据量,但云中的重复数据删除可能比客户对云提供者更有价值。

  • 迎面走来的应用感知存储

    从存储的角度来看,虚拟化环境已经从一个支持固定和可预测的工作负载转变成支持不可预测的和不断变化的工作负载环境。

  • 全闪数据中心的数据缩减攻略

    全闪存数据中心的概念之所以很吸引人,是因为它可以消除耗时的系统调优。它使数据中心得以支持最大的虚拟机密度,它的存储响应时间让大多数应用程序提供者都感到满意。