业务的不断增长致使存储管理员更加努力地处理日益激增的数据,文本、声频、视频、图像,不断增加的大容量邮件附件等都在加重企业数据备份的负担。为了解决这个问题,企业越来越多的转向重复数据删除技术,很多企业也都相继推出支持重复数据删除的产品。在国外,重复数据删除技术已经比较成熟,那么在我们国内的情况是怎样的呢?带着这个问题,我们TechTarget中国采访了存储和数据管理解决方案提供商NetApp公司的大中华区总经理柯志明先生。
TechTarget中国:NetApp都有哪些重复数据删除技术?
柯志明:A-SIS是NetApp重复数据删除技术中的一种,另外两个技术是SnapVault for NetBackup和NearStore VTL Deduplication。
A-SIS可以用于包括NetApp aka、FAS、R和V(7.3 及以上)系列的磁盘主存储或次存储系统。NetApp与赛门铁克合作开发了适用于NBU的SV,为NBU副本提供块级重复数据删除。而NetApp NearStore VTL Deduplication可以同内置硬件整合,删除虚拟磁带和虚拟磁带库中的冗余数据。
这三大技术为已有或潜在客户提供了一种简单易用的方法。比如,A-SIS作为一个认证的重复数据删除技术,可以免费部署在NetApp存储系统中。不同于其他厂商,NetApp 不需要凭借软件升级或任何代理网关实现重复数据删除功能。这一过程可以根据客户自身的需求,灵活选择。
TechTarget中国:NetApp重复数据删除如何运作?
柯志明:在卷上启用重复数据删除时,会创建一个数字指纹列表代表所有正在使用的块。这些指纹已经是Data ONTAP元数据的一部分,因此不必为每个块创建新指纹。通过比较这些指纹,可以比较容易地确定哪些块是重复的。然后,只需利用簿记更改参考指针并清除副本。
指纹只用于确定重复块;而不用于查询或访问数据。因此,数据访问仍然很快,不会因为数据重复删除过程而造成数据损毁。
另外,此基本流程与使用过十几年的Snapshot技术流程相同:使用一个“物理”数据块表示多个“逻辑”数据块。在用户需要回收存储空间的时候,可以定期对卷执行重复数据删除进程。因为此过程开销很低,NetApp重复数据删除可以在多种工作负荷下使用。
TechTarget中国:有的用户对重复数据删除的理解是:把重复的数据删除掉,保留一份完整的数据。那么当数据只有一个副本时,一旦副本坏掉,那么是否所有数据都没有了?这种情况下如何进行数据恢复?重复数据删除对数据安全有什么影响?
柯志明:大多数其他供应商提供的重复数据删除仅用于备份,而我们却支持用于主存储和二级存储的重复数据删除,因此我们格外注重数据安全性。
首先,从识别并消除重复数据所用的算法来讲,NetApp重复数据删除技术结合使用指纹和数据块逐个字节的比较,从而不会由于哈希冲突而误删任何唯一的数据块。
其次,从软硬件的可靠性来说,凭借NetApp存储,重复数据删除已是Data ONTAP运行环境中不可或缺的一部分,贯穿整个产品系列。此外,为了保护提交到磁盘的数据的可靠性,NetApp还开发了高性能的RAID-DP,这是一个具有双奇偶校验的RAID 6实施,可以在不牺牲写入性能的情况防范双磁盘故障。
经过重复数据删除处理的数据存储在NetApp存储系统中,多年的实践证明该系统采用的硬件和软件不仅可靠而且富有弹性。因此可以在恢复数据的同时取回已备份的数据。
TechTarget中国:请问国内的客户对重复数据删除的接受程度如何?
柯志明:中国的客户现在变得越来越成熟,他们开始考虑把磁带改成磁盘的备份,减少数据的重复,重复数据删除技术是一个很好的选择。重复数据删除跟容灾是两码事,不是说做了重复数据删除,就不用做容灾。而是做了重复数据删除,比做容灾更简单,所以重复数据删除必须做。以前10个数据,现在变成一个数据,是很危险的,但是以前10个的数据量,要做10个备份,现在把10个变成1个,只做一个备份,一个容灾就够了。这样不仅使可用性提高,而且使性能很多方面都加强了。所以对我们来讲,不只是用量减少,更重要就是前端的整个虚拟化的实施,怎么可以用得更好。
TechTarget中国:NetApp重复数据删除技术与其他竞争厂商相比有哪些独特优势?
柯志明:NetApp重复数据删除技术跟其他公司最大的不同,就是重复数据删除技术超越了单纯的数据备份,还包括归档、主数据的复制、一些虚拟化环境的应用。举个例子,在很多客户需要50/1节省空间的情况下,我们可以应用到VMware应用环境中。最近我们对运行大量基本相同系统的 VMware 客户进行了一次测试。在我们进行的测试中,我们看到通过重复数据删除节省了 95% 数据空间。但是,并不是说重复数据删除可以在所有地方都将数据减少 95%,但在特定的应用程序中确实可以通过重复数据删除节省大量的空间。
NetApp重复数据删除的另一个独特优势是它可以使用任何NetApp精灵卷(FlexVol),并且可以重复删除现有数据卷。不管数据如何写入卷,都可方便地确定和清除该卷内的重复块。如果两个或更多块是相同的,我们清除重复块并更改数据指针,以便所有副本都重新指向单个数据块。块的内容是什么或块属于哪个应用程序都无关紧要;如果块相同,则副本会被清除。这与其他重复数据删除产品形成强烈对比,那些产品主要限制用于单应用程序,例如备份。用户可以对已经使用很长时间的卷执行重复数据删除,从而恢复大量的磁盘空间。
TechTarget中国:您认为重复数据删除在中国的应用前景如何?
柯志明:重复数据删除技术能最大发挥功用的应用环境首先第一点是数据备份,因为无论是Oracle、MS Exchange,还是Sybase的数据库,应用NetApp的重复数据删除技术,都可以得到很好的投资回报。第二点,邮件和文件归档,这一点也是重复数据删除技术方面很好的客户回报。第三,主节点的数据,尤其是共享文件的数据,也是非常重要的。
重复数据删除技术不是一个独立的市场,而是今天客户需要具备的能力,尤其是客户要认识到这种重复数据删除技术的能力给他带来的价值。基于备份的重复数据删除,不是像大的项目,投资回报率需要六个月或更长时间。基于备份的重复数据删除技术,由于每天都在做重复性的数据备份,二十几天甚至更短就可以看到投资回报率。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
简单可靠的平面备份技术
在过去,很少有人认为平面数据备份可以成为传统备份方式的靠谱的替代者。而到了现在,随着快照技术的不断增强,趋势正在改变。
-
专家答疑:重复数据删除在云中是如何工作的?
重复数据删除过程减少了存储系统中的数据量,但云中的重复数据删除可能比客户对云提供者更有价值。
-
全闪数据中心的数据缩减攻略
全闪存数据中心的概念之所以很吸引人,是因为它可以消除耗时的系统调优。它使数据中心得以支持最大的虚拟机密度,它的存储响应时间让大多数应用程序提供者都感到满意。
-
存储采购并非易事
硬盘市场的下滑并没有带来相应的固态存储市场的蓬勃发展,但固态存储将最终取代机械硬盘,在这一路上也会不断有惊喜。