第一诫:了解你的数据

日期: 2009-11-26 作者:Rich Castagna翻译:Shirley Xie 来源:TechTarget中国 英文

几年之后再回首2009年,你将看到什么?是困惑的一年,只看到不断削减的预算和对新容量的迫切需求?这令你不解:存储部门如何在这样的混沌中得以生存?还是具有转折意义的一年,让你的存储部门开始朝着更高的存储效能发展?

  你如何看待这些难熬的日子将取决于你将不幸转换为机会的能力。

  显而易见,今年的主题是“效能”(efficiency)。几个月前我曾说过,2009年将是一个重新思考如何管理存储的年度。你不断地被告知,必须用更少的钱做更多的事。事实上,你不得不用同样的资源做更多的事情——而且只能比以往干得更加出色。

  的确,你可以在存储系统中使用很多工具,实现更高的效能。重复数据删除是近两年来存储界的明星产品。它可以在保护不断增长的数据同时,避免在备份操作中增加更多的磁盘。同时,越来越多的存储经理开始在主存储系统采用重复数据删除。归档则能够清理不是太有用的数据,从主磁盘转移到更加便宜的存储系统。如果你今年购买了或者计划购买新的存储阵列,那么很可能你是寻找低成本、高容量的系统,这样可以减轻对昂贵主存储造成的压力。

  这些都是非常行之有效的方法,可以更好地对已有的存储系统加以利用。不过,从本质而言,它们分别是单个的解决方案,放在一起,却未必能够发挥好作用。为了让每一项技术都发挥很好,你就需要了解你的数据性质,能够对数据进行分类。这样,就能够决定数据是否应该进行保存;如果是的话,应该存储到哪里。

  我说的是数据分类(data classification),在不景气时期和任何时候都应该列入日程的工作。在某些情况下,分类功能相当复杂,具有策略产生的场景以及与目录服务的集成,如微软的AD和LDAP。但是分类通常限于基本之处,如文件后缀或者时间/日期戳。不同产品具有不同的分类性能。在跨多种服务(如数据归档和数据迁移)的场景下,这样的差异可能很难(甚至不太可能)生成一致的数据分类策略。

  那么,这到底缺少什么?一种统一或者联邦的数据分类方式。通过这样的方式,你可以对公司、法规和维护策略进行一次性定义,然后将它们应用到存储环境中移动数据的所有产品中。

  几年前,有几家公司生产了数据分类产品,他们曾和其他厂商形成了一些联盟。但是,用一个单独的盒子或者应用软件去处理其他应用软件的数据分类,这种想法没有得到认同。不过,那个时候所处时期不一样。当时预算宽松,提升容量需求通常通过在数据中心购买更多的设备来解决。

  如果主题真的是高效的话,那么生成一套数据配置策略,并且运用到所有应用中,是否能够实现高效呢?对于你目前存储的90%或以上的数据而言,诸如这样的统一方法可能会行之有效。如果保存在某一个系统很重要,那么保存到另一个系统也可能同样地重要。

  那么为了达到这样的数据分类境界,需要什么样的先决条件?首先,那些在产品中只提供最基本分类标准的厂商需要提升产品的性能。其次,厂商需要生成一套标准的API,让系统能够共享彼此的分类信息,或者生成一套完全透明、通用的分类系统,加载到应用中。

  批评者可能会说这样的事情不可能发生,因为在存储业界虽然看似做标准化,但实际上从来没有怎么标准化过。但是,唯一可以改变的方法就是你对厂商施压。目前存储分类很重要;随着存储系统更加智能化,将来会更加重要。所以,让你的供应商现在就了解数据分类对你有多么的重要。

  与此同时,你也可以生成自己的内部标准分类系统。需要保证的是,你为某一个应用生成的分类和数据配置策略能够保持一致地运用到其他应用中。有的产品无法提供你的环境要求的分类复杂程度,不要加以考虑。

    本文选自《存储经理人》杂志2009年9月刊

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

Rich Castagna
Rich Castagna

TechTarget存储媒体集团总编。

相关推荐