数据归档最佳实践之策略和规划篇

日期: 2013-05-22 作者:Brien Posey 来源:TechTarget中国 英文

几乎所有的存储管理人员即将或者正在面临的一个问题是存放不断增长的数据集。由于主存储相对成本较高,容量也相对有限,大多数组织最后都会选择将文件夹里的数据进行归档处理。这就将主存储上即将放满的空间重新释放出来以存放更多的数据。 从表面上来看,数据归档的定义并不复杂。

但从实际角度出发,操作起来常常比较有挑战。在进行归档操作前,我们通常建议进行详细的规划。本文将讨论归档概念中相对重要的几个方面。 确定需要被归档的数据首先第一步是要确定哪些数据需要进行归档操作。

通常来说,这就意味着对那些最近一段时间,甚至几个月里面没有被修改过的静态数据进行归档操作。一些企业甚至在归档前会选择查看文件的修改日期以确定最近……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

几乎所有的存储管理人员即将或者正在面临的一个问题是存放不断增长的数据集。由于主存储相对成本较高,容量也相对有限,大多数组织最后都会选择将文件夹里的数据进行归档处理。这就将主存储上即将放满的空间重新释放出来以存放更多的数据。

从表面上来看,数据归档的定义并不复杂。但从实际角度出发,操作起来常常比较有挑战。在进行归档操作前,我们通常建议进行详细的规划。本文将讨论归档概念中相对重要的几个方面。

确定需要被归档的数据

首先第一步是要确定哪些数据需要进行归档操作。通常来说,这就意味着对那些最近一段时间,甚至几个月里面没有被修改过的静态数据进行归档操作。一些企业甚至在归档前会选择查看文件的修改日期以确定最近一次被访问的时间是何时。

但是,除此之外,还有其它的一些因素需要考虑进来,比如说数据类型。举个例子,用户在对文件服务器类型数据进行归档操作的时候使用的是一套归档策略及归档方法,但是对SQL服务器数据则是另外一套策略和归档方法。很遗憾的是,迄今为止还没有一套完整的以不变应万变的归档方法适用于各种场景。移动文件数据本身并不复杂,但是却很难归档整个数据库表空间,因为表空间本身很可能也被其它应用占用着。相反的,数据库归档还包括将旧数据从表空间移出来,并放入新数据。

数据删除策略加上数据生命周期管理

另外一个需要面临的问题是整体数据生命周期管理。假设一个用户决定归档那些三年内没有被修改或者访问的数据。那么这些决定将会引申到一系列其它与数据生命周期相关的问题。比如说,是否所有满足三年标准的数据都应该被归档?或者有一些数据就可以简单的做删除处理?或者说,这些数据将会永久的保存在归档存储里或者有一天还是会被调出来查看?用户应该针对具体的数据归档环境做出详细的计划,与此同时,针对归档数据的管理也需要有与之相关的计划。许多公司都认为他们有了归档策略就相当于有了数据删除策略;到最后他们会发现即便数据进行了归档处理,当要做删除操作的时候还是要指出是哪些数据需要进行删除操作。

法规遵从方面的因素同样需要被考虑进来。并不是所有的企业都有比如数据删除等相关的联邦法规遵从要求,但是如果没有按照要求对数据进行必要的长期保存将会面临严厉的责罚。跨国企业同样需要考虑各方面的企业内部规范制度。

由于一旦管理员没有按照要求对数据进行归档就可能面临民事和刑事方面的诉讼,因此一些管理员会选择归档更多的数据并存放的更久一些。

这样做的问题其实会更大,美国联邦法规中要求对特定数据归档保留的目的是为了一旦有问题发生就可以追查问题是哪个环节发生的。一些专家指出,存放超过指定时间段的数据可能会带来麻烦。对于起步者来说,这就意味着成本更大,更多的数据将会暴露出来。

为过期数据创建归档策略

一旦有明确的目标以确定哪些数据需要被归档,下一步的操作就是制定一个综合的归档策略。归档流程其实也是一个程序化的操作,通常需要涵盖如下几个方面:

  • 归档数据的标准。也许企业对不同类型数据的归档标准的不太一致的。
  • 帮助制定归档流程的相关机制
  • 存放归档数据的介质类型
  • 归档数据保留时间,针对不同类型数据制定不同策略。
  • 制定允许访问对象及访问场景的规则。

在一个调查中我们发现了这样一件有意思的事情,一个企业决定仅有企业的IT总监和HR总监才能有权限访问这些归档数据。但他们为终端用户安装的信息搜索软件却可以访问归档的信息。软件能实现对归档信息加密的功能并不允许查看用户删除这些数据。但是这款软件却允许用户继续访问那些过期的数据,从这个角度来看就放松了对归档数据访问控制的要求,让员工们能够访问属于他们自己的归档信息。

另外一方面的考虑来自对归档数据完整性的保护考虑。这个概念本身就包含两个方面。首先,归档数据本身就不应该被用户干涉,这些数据应该足够安全以至于终端用户不能随意对这些归档文件进行修改。

其次,应该防止归档数据的丢失。假想企业决定将其从2005年前的数据全部归档到磁带上去,然后突然发现磁带消磁了。在这种场景下,所有的归档数据都会丢失。企业应该极力避免这类事情的发生。

为了避免归档数据的丢失,应该考虑创建多个归档数据的拷贝。一些企业创建了多份基于磁带的归档因此一旦一份磁带出现问题,他们还有另外一份存放在异地。云存储网关可以提供类似的功能。网关设备可以存储一系列的归档文件,然后复制到云里。类似的是,现有的应用有些也能够查看磁带的可靠性,并对怀疑有问题的磁带进行数据拷贝。

当把讨论话题聚集到安全归档数据的时候,实践方法最后就取决于用户需要的访问安全级别上。至少,归档数据需要被加密存放在存储卷级别里,并且这些数据需要做只读权限限制。许多企业甚至将存放在存储服务器或者云存储上的归档数据与生产网隔离。这提供了另一级别的安全。

不管如何选择归档方式,但需要有相应的审计机制。审计将能帮助用户了任意时间点有人访问甚至尝试访问归档数据。一旦出现问题需要归档数据,审计日志就将帮助你证明归档数据的真实性,以确保这些数据没有被后来修改过。

相关推荐

  • 2016全球数据保护指数:中国有20%的企业居于领先

    2016年3月份,EMC委托Vanson Bourne公司对企业数据备份现状进行了一项题为“EMC 2016全球数据保护指数”的独立调查。从结果来看,全球有11%的企业作为领导者和采用者居于指数领先水平,而值得注意的是,中国处于该水平的企业达到20%。

  • 归档介质如何选?

    当前有很多归档介质是可用的,包括磁盘和云,但是他们的可用性和存储密度水平是多变的。

  • Unitrends备份趋于无限

    备份厂商Unitrends正在丰富其云战略,它为客户提供一种将归档副本无限期保存私有云上的服务。

  • HGST推出10TB HelioSeal HDD

    Western Digital的子公司,HGST Inc. 推出了首款10TB的HDD硬盘,该产品结合了HGST自身的氦气填充技术与基于主机管理的SMR技术(shingled magnetic recording,叠瓦式磁记录技术)。