TechTarget中国网站推荐

重复数据删除技术在数据保护过程中有何作用

2008-6-27  选择字号:  | |
打印本文章

  数据保护始于磁带

  50年以来,备份操作意味着把部分或全部数据复制到磁带机,以备将来恢复使用。数据大量复制到磁带,是因为磁带存储的成本低于保存原始数据的磁盘成本。

  磁盘备份出现

  最近几年,二级磁盘方案作为备份手段被部署,可存储少量的当前数据以便快速恢复――操作员无需查找磁带并将其插入磁带机,快进到所需的文件才能开始检索,从而显著提高了服务级别。

  但是,从经济角度考虑,磁带仍是存储的首选;在部署磁盘方案时,用户必须最大程度地减少存储在磁盘上的数据,以保持成本平衡。许多站点发现磁盘方案速度比磁带慢,因为它们作为备份设备没有进行优化。

  灾难恢复

  磁盘设备的不可移动性是磁盘存储的一个明显劣势――灾难发生时,需要将数据复制到远程站点,但许多站点无法负担建立高速通信网络所需的费用。

  数据重复删除技术问世

  昆腾享有专利的数据重复删除技术是由澳大利亚开发的。数据重复删除技术按自然边界把数据拆分为非常细粒度的子块元素。我们存储的数据具有很高的共性――用户之间、服务器之间甚至同一文件(如Office文档)的内容是通用的。利用数据重复删除技术,1TB的备份数据可根据备份数据的共性,存储为300-700GB不等。

  数据重复删除技术的真正价值在于处理已存储过的数据,特别是以下情况:

  从不同的服务器备份相同的数据(公用操作系统文件、应用程序文件甚至电子邮件和附件)

  大部分内容为“静止”的“活跃”数据,例如数据库、文档、电子表格和演示文稿

  已备份过一次的数据

  最值得注意的是最后一种类别。备份操作具有高重复性,日备份和周备份的数据大致相同,变化率至多只有5-10%.因此,可以利用数据重复删除技术进行高效的后续备份。在这种情形下,每月实现10:1到50:1的备份比率是完全可能的。

  在部署备份和恢复的普通磁盘时,经济因素限制了从磁带上卸载并转存到磁盘的数据量。

  使用数据重复删除技术,在相同的磁盘空间内,以前只能保存最近一周的数据,现在可以存储一个月或更长时间的数据,因此大大增强了恢复选项。

  灾难恢复得到改善

  当通过较低速度的网络连接复制数据时,数据重复删除的真正优势就会显现出来。以前,站点之间(远程办公室到公司总部或中小企业用户到服务供应商)的数据复制需要80小时,而现在只需二十分之一的时间。现在,无需移动磁带就可以实现基于网络的灾难恢复,这意味着不必要求技能拙劣的站点处理磁带,从而确保更高的备份可靠性。数据重复删除技术在企业级运行――如果总部已经存储了数据,则无需复制。

  数据重复删除技术如何打包?

  数据重复删除技术集成在昆腾的DXi系列设备中,在后台为现有备份流程提供支持。用户继续使用现有备份软件和策略,他们察觉不到重复删除的过程;存储的数据也因此增加了10到50倍。 


数据保护
 如何制定一个高效的数据保护计划
 飞康CDP:传统数据保护技术的革命
 如何为共享读写I/O操作系统提供数据保护
 IT多层备份方案实现数据保护绿色节能
 用革命性的CDP技术颠覆传统数据保护
 IBM借助FileX完善数据保护策略
 BakBone新数据保护方案 称30秒恢复数据
 重复数据删除技术在数据保护过程中有何作用
 如何开发虚拟磁带库(VTL)数据保护策略
 解析不同存储环境下的数据保护策略
 数据保护升温 磁盘加密成为热点
 解读持续数据保护发展新趋势

来源:中国IT实验室    
不要为磁带何时消失编制时间表。十多年来,一直有人宣称磁带是过时技术,但是现在大大小小的组织仍然在继续使用磁带,并将磁带作为数据保护策略的核心之一。
最近几年似乎出现了很多的安全事故。虽然有些事故比如网络服务器和数据库被黑客攻破可以归因于黑客,但是如果采取了适当的预防措施,许多其他的事故本来是可以避免的……
今天你所创建的磁带可能在多年以后还会被读取。这不仅需要一定程度的前向兼容性,还增强了升级需求,避免替换价格不菲的磁带库。所有这些都需要在选择磁带库时加以考虑。
目前,重复数据删除技术十分流行,而我们见证其成长的Lempel-Ziv (LZ)压缩技术虽然略显陈旧,却依然性能良好。
随着市场的推广,国内用户对重复数据删除技术的接受程度也得到快速提升。那么重复数据删除在实施过程中要注意哪些问题呢?
主存储将会是重复数据删除技术的下一个前进领域,但是这却也可能成为我们在如何更好的优化存储空间这个问题上遇到的最大的分歧点……
交换机在应用中会出现很多问题,为了在网络中能够满足更多的存储平台或主机服务器,交换机需要定期扩展或替换。交换机通过升级可以达到更好的性能,增强网络的有效性,限制网络流量并提供智能化功能,比如对网络的虚拟化。
磁盘阵列几乎是每个网管员必须掌握的一项技术。随着现在越来越多的厂商推出了各种磁盘阵列技术,在现在的存储应用中也越来越广泛。那么磁盘阵列技术对我们的影响有什么呢?
数据增长速度的加快、新应用需求的增加、对数据存档的监管力度的增大和业务连续性需求,正在让企业的IT预算越来越吃紧,同时也使得其传统存储架构的不足日益显露,而分层存储从某种程度上可以减缓这些压力。
最新更新
专家答疑
技巧
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……
Greg Schulz
我们有两个负载均衡网络服务器,都是可用的,正在尽力访问SAN上的相同的LUN。我们在操作系统和EMC SAN上用Windows2003标准版本。我们如何实现并行写入SAN……