归档:数据管理半边天

日期: 2007-12-24 作者:张峰 来源:TechTarget中国

  归档在数据管理中占据着与备份同等重要的地位,两者有机地结合在一起,能够大大提高用户数据保护工作的效率。数据库归档则能有效提升数据库的应用性能。

         各种规模的公司有一件事是共同的:它们无时不刻不在制造着数据,大量的数据,包括客户信息、产品说明以及会计文件。事实上,很多企业的内部数据量每年都会翻一番。伴随这种数据增长水平而来的是保护数据避免受到意外删除和灾难影响,以及遵守长期保留数据法规要求的挑战。

        备份与归档优势互补

         用户数据可能因人员错误、硬件故障或重大自然灾害而遭受损失,备份技术长期以来就是避免数据造成损失的行之有效的方法。备份最适合于迅速恢复大量的丢失信息,可以在短时间内将整个系统恢复到原有运行能力。

         文件归档与备份系统在企业中发挥着两种不同的、互补的功能:备份用于高速复制和恢复来减少故障、人员错误或灾难的影响;文件归档技术有效地管理数据,实现数据的保留和长期的访问与检索。这两种功能可以一起应用,来降低成本,改进存储基础设施的整体效率。备份在拥有有效的归档解决方案的环境下变得更加高效,而归档仍可利用备份基础设施满足自己的数据保护需要。

  归档提高效率

         通过引入文件归档技术,企业可以在改进备份和恢复服务水平的同时,减少备份成本。文件归档技术还可以满足数据保留的法规要求,利用对文件系统与文档元数据的全面了解,以及文件内容的知识管理文件。文件归档系统根据文件实际内容的价值移动或复制文件。它们还根据文件的内容(包括任意数量的参数,如作者、日期和为符合法规要求而特设的参数等)找到和恢复不同的文件。

         为了有效地管理数据,文件归档系统查询网络上的所有文件,提供非结构化数据的详细目录。在查询过程中,系统采集文件系统元数据并提取文件内容,从而为数据分类和信息治理策略的应用打下基础。

         文件归档系统必须提供以下功能:具有内容意识,例如,它不仅应当索引文件系统的元数据,还应当建立文档中内容的索引;通过从内容中提取信息,构造定制的元数据标签;利用策略在相应的分层存储级别上对信息进行存档,减少存储量;有选择地归档数据子集合(由归档策略定义)来满足法规遵从和企业信息治理规定;提供对归档数据的快速访问等。

         由于具有根据业务价值制定的策略分类、管理和检索文件的能力,文件归档应用可用于各种真实环境中。在这些环境中,需要对保存在不同存储平台上的信息进行智能管理及快速访问。

  数据库归档优化性能

         每个数据库管理员都会遇到这样的困惑:随着业务的不断进行,数据库文件大小逐渐增大。由此给数据库管理工作带来很大的困难,一方面要为在线业务提供越来越大的高性能磁盘容量,另一方面数据库的工作性能却越来越差。新兴的数据库归档技术能很好地解决这个问题。

         简单地讲,数据库归档技术就是一种保持在线数据库规模大体不变、为用户应用提供稳定的数据库性能的方法。具体做法是,将数据库中不经常使用的数据迁移至近线设备,将长期不使用的数据迁移至文件形式归档。随着应用需要,数据在在线、近线和文件文档之间移动。比如应用需要访问许久以前的数据,它的物理位置在近线设备则自动移动到在线设备。而对用户的应用而言,这些都是透明的,就像所有数据都存放在在线设备一样,不会对数据库应用产生任何影响(详见原理图)。

         数据库归档的概念本身十分简单,把一条记录从生产数据库插入到历史数据库中,然后把该条记录在生产数据库中删除就实现了数据库归档的功能。

         数据库归档把信息生命周期管理的概念引入到应用程序数据管理中,可以监控、分析和预测数据量的增加,利用在线的数据库随时识别并定位不活动的数据或已经完成的业务交易。把长期不用的数据封装归档,这样就大幅降低了活动数据的规模,数据库等应用程序运行时的效率可以大幅提升。经过归档,即使在应用程序本身已经废弃的时候还能够重新利用其数据,同时保持实时访问已归档数据的能力。

         与文件归档显著不同

         按照SNIA(存储网络行业协会)的定义,归档是数据集合的一致性拷贝,通常用以长期持久地保存事务或者应用状态记录。一般情况下,归档通常用以审计和分析的目的,而不是用于应用恢复。归档之后,文件的原件一般会被删除,需要通过前台的操作来恢复文件。普通的文件归档只能够对文件进行操作,而且归档后的文件一般不再产生变化。而数据库归档则不同,数据在归档之后仍然存在改变的可能,也随时会变成在线的活动数据。

         事实上,所有的数据库厂商都提供了类似的数据库归档功能,但目前没有形成商用产品,用户可以使用命令或者编程进行相关操作。
但是在线数据库需要高可靠性、错误处理、审计以及异常处理(如断电、数据库崩溃)等高级功能,这些都只能由专业的数据库归档产品提供。

         对备份/恢复的影响

         备份是存储管理员最重要的工作之一,如果没有进行数据库归档,那么不仅需要备份整个大型的数据库,而且备份窗口要求很长。在进行数据归档之后,由于已归档的数据库部分可以随时进行备份而不会影响在线数据库的应用,这部分数据库一般为长时间不活跃的数据,因此备份工作很容易完成。而在线的数据库部分也因为进行数据库归档后而瘦身,备份数据量减少,备份窗口减小,从而整体减少了需要备份的数据总量。

         而对数据进行恢复的时候,可以在短时间内首先完成在线数据库恢复,之后在在线数据库工作的同时进行其他数据的恢复工作。

         数据库归档市场目前还处于起步阶段,但有数字表明,目前这一市场的年复合增长率已达到50%,呈现出高速增长的态势。据Enterprise Storage Group今年1月发布的报告显示,2006年全球总体数据归档容量将达到4000PB以上,而到2010年,这一数字将上升到27000PB,其中,亚太区将成为增长最快速的地区。

 

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

张峰
张峰

相关推荐