购买数据分类工具的注意事项

日期: 2008-10-23 作者:Stephen J. Bigelow翻译:周姝嫣 来源:TechTarget中国 英文

数据分类工作需要双管齐下。公司必须先了解其应用程序和数据的价值,才能以合适的服务级别存储和保护数据。事实上,数据分类就是根据存储结构调整企业程序。听起来很容易,其实很难,原因在于公司无法准确定位所有数据,也就无法正确分类或明确数据的商业价值。

数据分类工具可以克服这些障碍:帮助企业找出数据,然后根据用户定义的规则重新定位数据。数据分类以后,许多工具可以将数据移动或者迁移到合适的存储子系统中。   数据分类工作不能仅由IT人员完成。只有了解数据的商业价值,才能准确无误地将数据分类,这需要法律、生产、人力资源、金融等业务部门的积极参与。

首先,应在纸上列出数据分类过程,然后由分类工具高效、自动地完成分……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

数据分类工作需要双管齐下。公司必须先了解其应用程序和数据的价值,才能以合适的服务级别存储和保护数据。事实上,数据分类就是根据存储结构调整企业程序。听起来很容易,其实很难,原因在于公司无法准确定位所有数据,也就无法正确分类或明确数据的商业价值。数据分类工具可以克服这些障碍:帮助企业找出数据,然后根据用户定义的规则重新定位数据。数据分类以后,许多工具可以将数据移动或者迁移到合适的存储子系统中。

  数据分类工作不能仅由IT人员完成。只有了解数据的商业价值,才能准确无误地将数据分类,这需要法律、生产、人力资源、金融等业务部门的积极参与。首先,应在纸上列出数据分类过程,然后由分类工具高效、自动地完成分类任务。

  市场上可供选择的数据分类工具多种多样,每种都具备索引、查找、策略管理和迁移等功能。在阅读下文列举的数据分类工具购买标准之前,你应该回想一下在购买分层存储时需要考虑哪些问题。列举了应考虑的事项以后,你就会发现许多说明书都能帮助你比较Abrevity、EMC Corp、Index Engines、StoredIQ等供应商的数据分类工具。

  分类工具支持哪些文件类型?一旦你清楚地了解需要支持多少种文件类型,就选择的数据分类工具就应该能处理这么多种文件类型。同理,选择的工具应该完全支持结构化和非结构化数据。有些工具只能处理结构化数据或非结构化数据,或者只是针对某种特定的应用程序(如数据库),就无法满足你的长远需求。大多数工具能同时处理结构化和非结构化文件阵列。例如,Abrevity公司的FileData Classifier软件能处理上百种文件类型,其中包括微软的Office文件、PDF文件、电子邮件、SQL或Access等数据库,以及各种图像文件。否则,有些文件就得不到分类,也就无法正确存储。

  分类工具如何支持规则集和自动化?所有的数据分类工具都会依赖一组规则来驱动分类引擎。早期的数据分类工具依靠公司内置的规则集,不过目前大多数工具能够输入既定的规则集(例如,支持医疗或法律行业)。你应该判断修改或者使用既定规则集,能否满足你的具体需求。例如,Arkivio公司的自动存储(auto-stor)产品包含标准分类目录,但是当需求变化时,可以改变类别或者增加类别。并非所有情况下都能实现手动分类。Kazeon Systems公司的信息服务器(Information Server)允许用户和管理员对某种文件(由搜索引擎或报告决定)实行手动分类,而EMC公司的Infoscape则不支持手动分类功能。

  分类工具支持分层存储和数据迁移吗?高达20%的企业数据没有受到足够保护。企业在服务级别上无法获取这些数据,因此需要很长时间才能恢复这些数据。相反,高达60%的数据受到过度保护——这些数据保存在价格不菲的存储中,复制次数远远大于其商业价值。这就会导致存储成本过高。寻找能够在存储层之间迁移数据的分类工具,这样各种类型的数据在分类以后都能获得合适的服务级别。这么做技能维持存储性能,又能降低成本。如果分类工具不具有数据迁移功能,就应该确保该工具支持第三方数据迁移器。请注意:由于迁移中的数据会与其它存储竞争网络流量,因此迁移过程在一定程度上会影响网络性能。

  分类工具的性能和扩展性如何?大企业可能需要分类和迁移几百万甚至几十亿的文件。数据分类工具支持的文件数量通常有一定的限度,因此应选择数据量符合要求、而性能水平又不逊色的工具。接下来就应了解分类工具如何从文件数量和规模方面处理数据。一些工具可能善于处理大量的小型文件,另一些则可能适合处理少量的大型文件。数据量会快速增长,因此分类工具应能满足未来数据卷的需求。

  分类工具的异构水平如何?数据分类工具必须与存储环境中的其它平台相互作用。例如,如果数据分类工具没有迁移功能,就需要与其它策略管理器或数据迁移器一起工作。同时,分类工具应支持现有的存储平台。如果你的数据分布在三个不同的存储系统中,那么分类工具就需要同时与三个系统兼容,才能进入系统完成工作;否则,分类工具就无法完全实现价值。建议在实验室进行测试,验证性能和互操作性。

作者

Stephen J. Bigelow
Stephen J. Bigelow

数据中心和虚拟化网站的高级技术编辑,拥有20年的PC和技术写作经验。

相关推荐