过多的文件

日期: 2010-07-18 作者:Tony Asaro翻译:付晓飞 来源:TechTarget中国 英文

文件内容和NAS存储的世界是脱节的且漏洞百出;我们需要在海量文件存储的问题变得更严重前把它解决。   让我们面对事实吧:文件内容的最大问题是用户。人们整天都在创建、复制、转换、编辑和下载文件。那是没有什么控制和限制的存储的“西部荒野”。

我记得一个客户发现在他们的层一存储上有一个扫描的中餐馆菜单的125个拷贝。太狂野了……   看看任何公司的内部,考虑到成百上千的用户在创建——并且再创建——内容,不难看出简单的文件蔓延如何变得无孔不入,并成为一个很大的问题。越来越多的公司有上百TB甚至PB的文件存储。很多时候,存储经理不知道有多少文件内容,那些内容的价值,为它们花费了多少,它被存在哪里,以及它是……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

文件内容和NAS存储的世界是脱节的且漏洞百出;我们需要在海量文件存储的问题变得更严重前把它解决。

  让我们面对事实吧:文件内容的最大问题是用户。人们整天都在创建、复制、转换、编辑和下载文件。那是没有什么控制和限制的存储的“西部荒野”。我记得一个客户发现在他们的层一存储上有一个扫描的中餐馆菜单的125个拷贝。太狂野了……

  看看任何公司的内部,考虑到成百上千的用户在创建——并且再创建——内容,不难看出简单的文件蔓延如何变得无孔不入,并成为一个很大的问题。越来越多的公司有上百TB甚至PB的文件存储。很多时候,存储经理不知道有多少文件内容,那些内容的价值,为它们花费了多少,它被存在哪里,以及它是如何保护的。

  我们不只创建了大量的文件,我们还在以图像、视频和音频的形式创建巨大的文件。所以,很多很多的文件,包括一些非常大的文件,集合起来形成了对昂贵并难于管理的IT架构的未经检查的占用。

  NAS-ty(NAS是讨厌的

  这就给我们带来下一个大问题:如何存储它。很多的文件内容停留在NAS存储系统里,而尽管这些系统里有巨大的价值,它们还是给存储和IT经理带来问题。一个就是,只有少数几个厂家可以提供企业级的NAS产品,所以用户只有有限的几个可选方案。显然市场上有更多的合格产品会带来更多的竞争,投资效率和创新。

  我最近和几个大的NAS厂家有些沟通,而他们最大的挑战是数据迁移。有数百TB甚至PB的NAS文件内容的公司感觉到他们基本上是被栓到了特定的NAS设备上,因为迁移文件的复杂性通常被看作一个无法征服的挑战,或者说至少是得不偿失的。一个用户告诉我他感觉他被他的NAS系统永久性地劫持了。

  非结构化是否是“无用”的另一个说法?

  我们总说文件是非结构化数据。这类内容天生就没有结构定义,所以对IT人士来说要明确分类文件的有用程度可能会很困难。不过,我们还是不敢删除他们,因为总是会有某天还会用到它的风险;对多数的公司而言,冒那个风险的成本被认为低于购买设备来存储所有那些数据的投资。

  有趣的是,业界的研究发现60%到80%的非结构化数据在创建90天之后就不会再被使用了,光靠这一个统计数据就使得非结构化内容很像"无用"内容的同义词。存储和保护文件内容花费不小,为什么就不用了呢?是因为内容没有可持续的价值,还是由于我们没有工具来方便有效地使用它?

  备份变得更难了,我认为PB世界的最大挑战是备份。试想我们的新存储系统,数百TB甚至上PB的文件内容保存在多套系统上。现在扪心自问:你怎么保护所有那些文件内容?然后考虑一下那些保护要花费多少,不只是金钱,还有时间和资源。过去的和现在的办法都不足以满足今天的需求。这意味着我们需要一个新的文件保护方法,不然你在需要恢复数据的时候就只能碰运气了。要选择后者是很难的,特别是当你考虑到恢复数据失败可能对你的业务产生永久性的伤害的时候。这是你的数据中心在这个十年会遇到的最大问题之一。

  长久以来我们都能通过增加IT架构和人员来解决--或者说预防--问题并使业务正常运转。但是现在我们正在一个转折点,我们不能再满足于现状了,管理海量的文件存储是数据中心这个十年的“大”问题之一,IT人员必须拉响警报,并使其成为工作重点。

相关推荐

  • 开源技术有望改变企业存储

    开源存储软件可以通过降低成本并在现有存储基础架构上提供更大的灵活性来改变行业的面貌。

  • 什么是文件存储?

    文件存储,也叫作文件级或者基于文件的存储,它是以一种分层的结构存储数据。数据保存于文件和文件夹中,同样的格式用于存储和检索。

  • Ceph是什么?

    Ceph开源项目起源于2004年,这个软件在2006年的时候在开源认证下得到广泛应用。那么你是否对它有所关注呢?

  • 如何区分块存储和文件存储?

    对于专业人员,这个问题呈现为“入门者的存储101”。但是存储技术文献总是在谈论块数据和文件数据,却并没有明确的解释二者的关键区别和关联。