重复数据删除技术是近年来存储领域经常谈论的一个热门话题。随着市场的推广,国内用户对重复数据删除技术的接受程度也得到快速提升。那么重复数据删除在实施过程中要注意哪些问题呢?它在国内的认可程度如何呢?带着这些问题我们采访了美国飞康软件公司的中国区高级技术经理谢剑锋先生。
TechTarget中国:重复数据删除是现在讨论的比较多的话题,那么重复数据删除的工作原理是什么?它对用户具有什么价值?用户的接受程度如何呢?
谢剑锋:首先,重复数据删除技术的原理就是通过某种算法,将存储、备份或归档等数据中的重复数据剔除,保留具有单实例的数据单元,最大限度地减少数据的存储量。
第二,从实用价值方面来讲,尽管今天企业信息数据存储空间的单位成本不断走低,但是随着信息社会的深入发展,企业信息系统及信息数据的快速增长,使企业需要存储或备份的信息数据量飞速上涨,导致了企业在数据存储空间方面巨大的投入。而重复数据删除技术的应用能真正的将传统IT信息数据的存储空间以10倍甚至20缩减,使企业在存储容量、空间方面的成本降低。
近年来随着各大厂商的宣传推广,用户对重复数据删除技术有了一定的了解,基本都已开始尝试试用一些重复数据删除技术的解决方案。尤其在咨询飞康的相关产品的用户中,几乎都希望了解重复数据删除技术并尝试购买,用户在通过详细咨询飞康的重复数据删除技术后购买率接近90%。
TechTarget中国:不同厂商的重复数据删除比率都有所不同,那么哪个比率对于用户来说是最合适的呢?
谢剑锋:重复数据删除比率的问题一直是企业最为关心的问题,可以说直接触及到了用户的底线。不同的厂商向外界声称的比率不同,从20:1到50:1,甚至高达300:1或400:1。由于重复数据删除与详细的备份数据和备份策略直接相关,从一种环境到另一种环境所产生的重复数据删除比率也会有很大的变化,即使它们是基于同一种重复数据删除运算法则。因此,厂商公布的重复数据删除比率不能作为选择这一产品的唯一标准。
重复数据删除比率与所用处理的颗粒精细程度相关。理论上讲,更细致的颗粒会带来更高的重复数据删除比率。然而,更细致的颗粒意味着大量的Hash(哈希)表,会导致相对差的重复数据删除性能和更高的CPU消耗。
因此一般来说,10:1的重复数据删除比率是很现实角度的评估起点,足以满足一般性的业务应用规划需求。
TechTarget中国:我们看到飞康VTL系列增强了重复数据删除功能,请问它在国内被认可的程度如何?
谢剑锋:飞康VTL系统中增加了重复数据删除功能,有效地将重复的数据进行删除以节约存储容间,帮助用户从存储信息数据的空间成本投入、日益增长的信息备份和备份窗口缩减等需求中解脱出来。
飞康提供的重复数据删除技术以企业用户为出发点,帮助用户从采购重复数据删除技术到应用重复数据删除解决方案,以及规划企业长远的存储空间等方面都有着良好的表现。主要体现在:不影响通过VTL已经优化了的备份窗口;、重复数据删除与备份任务相对独立,能24小时执行重复删除任务;重复删除后的精减库针对备份环境的所有主机数据有效,全局进行重复删除;可扩展性,随备份任务及备份需求增多,VTL备份系统和重复删除引擎能在线线性扩展;优秀的集群技术提高VTL系统的高可靠性;具有良好的保护措施。
因此,飞康VTL系统的重复数据删除技术已经完全被国内接受,在购买的飞康的VTL解决方案中有80%以上的用户选购了重复数据删除功能。而在飞康其它具有革新的数据保护解决方案及在线产品解决方案中,重复数据删除功能的选购已经接近到100%.
TechTarget中国:有用户问:重复数据删除在我们的理解是把重复的数据删除掉,保留一份完整的数据。那么当数据只有一个副本时,一旦这个副本坏掉,那么是否所有数据都没有了?这种情况下如何进行数据恢复?
谢剑锋:对于采用重复数据删除技术后,所有数据变为单一实例,将会面临一损俱损的极大挑战,这是阻碍企业用户采用重复数据删除技术的原因之一。
飞康VTL系统充分考虑这一因素,在设计之初就着重解决数据安全的问题,因此飞康VTL系统的重复数据删除技术中处处都体现着数据安全保护的措施
首先,对于重复数据删除后的单实例库,飞康VTL提供了镜像技术,能将单实例库镜像两份到不同存储设备的两份存储空间,实现存储空间的安全可靠。
第二,飞康VTL系统的重复数据删除功能脱离数据备份,在数据备份之后进行重复删除,因此,对备份的数据而言,除了将以前的所有备份存放在单一实例库中外,还有一份最近备份的数据。
第三,远程复制技术,在飞康的重复数据删除技术中还内置了远程传输技术,可以设定自动传输功能将单一的实例库进行异地存放。
因此,飞康VTL系统提供多种数据安全保护措施,最大限度确保数据的高可靠及可恢复性。
TechTarget中国:安全问题是大家所关心的,请问重复数据删除对数据安全问题有什么影响?
谢剑锋:首先,通过飞康VTL系统及重复数据删除技术可以知道,在启用了重复删除功能后,不会改变原有数据安全方面的保护或管理方式;同时飞康VTL系统通过内置的一些数据保护功能提升了数据安全方面的保护,如飞康VTL内置了数据加密功能,虚拟备份设备的用户权限访问等,充分考虑并增加企业用户所关心的安全问题。
TechTarget中国:一般国内的客户在采购新的存储设备之前,已有一些原有的设备,请问飞康VTL系列如何与其他的操作系统或存储设备兼容?
谢剑锋:一个高效的重复数据删除解决方案应该对当前IT环境的影响/中断越小越好。许多企业都选择利用VTL备份来避免影响/中断,以在不改变企业当前备份策略、处理或软件的情况下提升备份质量。因此,基于VTL的重复数据删除技术在部署时对环境影响也应该是最小的。它将更多的注意力集中在了备份这个巨大的重复数据存储池上。
基于VTL的重复数据删除解决方案通常要求使用专用设备,但这并不影响部署的灵活性。一个充分灵活的重复数据删除解决方案应该既可以以软件包形式提供给用户,也可以提供给用户整体的解决方案(Turnkey Appliance),从而最大限度的使用户的现有资源得以利用。
飞康是业界唯一提供全面开放平台的厂商,在兼容性方面,VTL系统及解决方案支持已有的存储设备及各厂商新发布的设备,并支持主流的如Windows、Linux、UNIX(AiX、HP-UX、Solaris等)系统平台,以及主流的数据备份软件如Veritas NBU,Backup Exec,Legato NetWorker,CommVault,CA BEB,IBM TSM,HP DP, BakBone及其它归档软件等。
TechTarget中国:国内客户与国外客户情况有很大的不同,您能具体解释国内客户部署重复数据删除与国外的情况有什么差异吗?基于这种差异,在部署时要注意哪些情况呢?
谢剑锋:国内客户在部署重复数据删除的情况与国外用户相比,主要差异体现在技术获取的节拍、品牌效应的影响、备份环境的复杂度、法规遵从及管理等多个方面。因此针对国内的实际情况选择合适的重复数据删除技术后,要根据情况做必要的调整,而不要盲目的跟从国外的同行。
因此,对于重复数据删除技术的应用来讲,国内客户主要受限于以下几个方面。
a.爆炸式的信息数据增长是用户始料未及的,也就是用户没有做好准备迎接信息数据快速增长的时代,在信息数据快速增长的过程中,不能盲目地跟从国外同行。
b.重复数据删除技术本身多种多样,各厂商提供的技术也各有所异。如有的应用在文件系统中,有的应用在备份软件中或集成在备份任务中,有的应用在备份过程中,有的是在备份完成之后应用此技术,使得用户在短期内还没有了解各种技术的优劣势及真正哪种技术适合自己应用。基于技术知识获取的节拍慢于国外,短期内的选择会盲目进行.。
c.删除重复数据后的单实例数据,一损俱损的数据安全性问题受到严重挑战。很多厂商跻身于重复数据删除技术的推厂,而忽视了删除重复数据后的单实例数据的安全保证问题。因此,在数据保护解决方案中起锦上添花的重复数据删除功能,很容易使用户在选择重复数据删除功能时忽视了数据保护问题。
d.在法规遵从方面,国内的法规针对行业性的要求与国外有很大的差异。金融,电信,政府等在审计、IPO等方面都有相关的约束。因此国内用户在考虑重复数据删除的技术时候,一定要在法规许可的范围采用重复数据删除新技术。
重复数据删除的技术已经被用户作为必备技术去了解、尝试,但是做为大规模的投产应用来讲,企业用户显得信心不足。
TechTarget中国:您认为重复数据删除在中国的应用前景如何?
谢剑锋:随着国内企业信息化建设的不断深入、信息数据的爆炸式增长,以及风险意识的逐步提高,重复数据删除技术在信息化系统中的应用一定越来越广泛.。它不仅能够直接减少备份、归档的数据存储空间,还能在容灾系统中减少网络传输,从而减少存储空间设备、网络建设等成本。更大的好处是,减少机房空间、能源、人力资源等隐性成本,真真切切地提高了投资回报率。
因此,对于重复数据删除技术在中国的应景前景是非常乐观的。它能够真正解决存储空间的问题,帮助企业用户节约成本,更好地做好长远存储空间及数据保护方案的规划。随着绿色环保概念的深入倡导,将引导企业用户有意识地选择重复数据删除产品或解决方案,这也符合中国绿色发展的大趋势。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
Pure Storage推出ObjectEngine备份设备
闪存存储先驱Pure Storage公司开始进入云备份领域,让客户可对亚马逊云计算服务(AWS)上的数据进行重 […]
-
对象存储备份最大的好处是什么?
对象存储使得云备份更加实用,并且支持大规模的可扩展,因为对象存储主要是为了扩展而设计的,所以在低成本的商品硬件上存储对象存储通常是可以接受的。
-
揭开灾备真相——那些年我们见过的灾备术语
作为数据保护的最后一道屏障,灾备系统的重要性不言而喻。IT圈好像一夜之间都在说灾备,那么到底什么是灾备?为什么灾备如此重要?未来发展趋势如何?本系列文章带你认清灾备真相。
-
存储经理人2017年11月刊:如何选择正确的DRaaS供应商
《存储经理人》2017年11月刊重点介绍如何选择正确的DRaaS提供商:DRaaS供应商应当具备四项关键技能,以能够全方位应对所有潜在灾害。本期杂志还介绍了下一代线性磁带开放标准LTO-8,云中数据存储的注意事项以及驱动企业采用云存储的主要因素,同时阐述了冷存储需求不断高涨以及二级存储的现代化转型等现状,提醒大家在文件同步和共享时应确保数据安全,以及如何为未来的闪存做好准备。