优化主存储的六大需求

日期: 2009-01-14 作者:George Crump翻译:周姝嫣 来源:TechTarget中国 英文

当前并不缺乏提高数据存储效率的新技术,但是这些存储技术大多关注备份和归档,而不是关注主存储。但是,如果公司开始精简主存储的数据,就必须了解主存储优化具有哪些需求。   主存储通常称为Tier 1存储,其特征为用于存储活动数据——经常需要访问的数据,以及要求高性能、低延迟、高可用性的数据。主存储通常用于托管关键任务程序,如数据库、电子邮件和事务处理。

大多数重要程序采用随机数据访问模式,具有不同的访问要求,但是都能产生大量数据,公司可以利用这些数据完成业务。因此,公司会创建大量的数据副本,复制数据供分布式用途,建立数据仓库,然后将数据备份和归档,实现安全保存。   最初,大部分数据都是主数据。随着……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

当前并不缺乏提高数据存储效率的新技术,但是这些存储技术大多关注备份和归档,而不是关注主存储。但是,如果公司开始精简主存储的数据,就必须了解主存储优化具有哪些需求。

  主存储通常称为Tier 1存储,其特征为用于存储活动数据——经常需要访问的数据,以及要求高性能、低延迟、高可用性的数据。主存储通常用于托管关键任务程序,如数据库、电子邮件和事务处理。大多数重要程序采用随机数据访问模式,具有不同的访问要求,但是都能产生大量数据,公司可以利用这些数据完成业务。因此,公司会创建大量的数据副本,复制数据供分布式用途,建立数据仓库,然后将数据备份和归档,实现安全保存。

  最初,大部分数据都是主数据。随着数据的存在时间增长,通常移动到次级和三级存储。因此,如果公司能够减少主存储的足迹,就能充分利用容量,降低整个数据生命周期的成本。换句话说,一部分主存储足迹转化为更少的数据,从而实现复制、存入仓库、归档和备份。

  压缩和重复数据删除技术

  主存储管理员试图减少主存储的足迹,可能会考虑两种数据精简方法:实时压缩和重复数据删除。

  直至最近,数据压缩技术才在主存储中得到广泛应用,而且是出于对性能的关注。但是,Storwize等供应商提供的解决方案采用实时、随机访问的压缩/解压缩技术,能实现15:1的足迹精简比。由于压缩比例和实时性能很高,压缩方案成为主存储数据精简的考虑方案。

  重复数据删除技术在备份程序中非常流行,同样也可在主存储中应用。这样,在成千上万的文件中识别数据冗余块非常费时,而且使存储处理器变得非常敏感,活动数据的性能也会受到影响。这就意味着只有活动数据陈旧到一定程度,才会被处理。这方面的供应商包括NetApp、Data Domain和Ocarina Networks等公司。

  部署主存储优化方案具有六大需求

  需求1:性能零影响

  与备份或归档存储不同的是,相比通过某种形式的数据精简才得以节省的容量,活动数据组的性能更为重要。因此,选择的数据精简技术必须对性能毫无影响。技术只需简单地发挥作用;相当于“打开某个开关,消耗的存储就相应减少了”。

  换句话说,这就意味着只对这类文件执行重复删除功能:今后不再访问,但仍位于活动存储池——不太活跃的存储层。

  重复数据删除技术能够避免性能瓶颈,因为其建议只删除简单并重复的I/O工作负荷。因此,IT基础架构的关键组件通常不能在存储中得到优化。位于关键组件清单之首的是数据库。数据库Tier 1存储中非常活跃的组件,不仅仅是一种简单的工作负荷,因此重复删除过程从来不分析数据库。这样,数据库占据的主存储空间并没有得到优化。

  另外,实时压缩系统能即时压缩流过产品的所有数据。这就具有很大的好处,除了节省容量,还能提高存储性能。压缩以后,每次I/O请求交付的数据量会大大增加,磁盘缓存空间扩大,每次读写操作的效率提高。

  网络效应也能精简磁盘容量,提高存储的总体性能。

  主存储重复删除的第二个好处是:所有的数据都得以精简,由所有数据(包括数据库)分担空间节省要求。Oracle环境下的实时数据压缩功能会产生性能问题,可以利用测试过程提高性能。

  问题的另一方面在于对存储控制器本身的性能影响。今天的存储控制器需要完成许多工作,而不仅仅是满足磁盘需求,还要管理各种协议、执行复制、管理快照。增加一项功能可能会超过控制器的承受范围,即使控制器能够处理附加的工作负载,存储管理员也必须认识到:多一项功能,可能带来I/O瓶颈。将压缩功能卸载到外部产品中,就移除了一个性能变量,完全不会影响存储控制器。

  需求2:高可用性

  许多关注次级存储的数据精简方案尚未完全可用。这是因为这些方案需要立即恢复备份或归档数据,而这些数据已不像Tier 1存储中那样精确。如果备份系统受损,主存储可能依然存在。但是,次级存储的概念可能就衰减,许多次级存储系统正在添加高可用性。

  但是对主存储而言,高可用性绝非可有可无。主存储必须能够读取精简(重复删除或压缩)后的数据格式。采用重复删除技术时(重复删除集成到存储阵列中),冗余遵循存储阵列,通常都具有高可用性。

  在重复删除系统的零件市场中,删除方案的组件能将未被删除的重复数据以原始格式发送给客户端。这种组件称为读取器。读取器同样需要很高的可用性以及很强的无缝集成能力。一些方案能在断电的时候,将读取器的负荷加载到标准服务器中。这种方案通常用于处理不太活跃或更加合适的归档数据;并不完全适合非常活跃的数据。

  大多数在线压缩系统在线插入网络中,放置(逻辑可行)在交换机和存储器之间。网络基础架构在设计时具有高可用性,因此压缩系统能够实现冗余。沿着每条路径插入在线产品,就能实现无缝故障转移,无需IT管理员付出更多努力;可以平衡网络中已经完成的工作。

  需求3:节约空间

  实施其中的任何一种解决方案,都应该节约一定的容量。如果由于主存储容量减少而导致用户性能不符合标准,那就没有意义了。

  主数据没有备份数据那样的高冗余存储模式。这对总体的容量精简产生直接影响。同样,精简主存储的数据也有两种方法:重复数据删除和压缩。

  重复数据删除技术能够查找活动文件间的冗余,以及根据环境能够实现多大程度的数据精简。如果环境中冗余级别很高,那么ROI就很大;而在其它情况下只能精简10%至20%。

  压缩功能对所有的可用数据都起到作用,对冗余很高的数据而言,通过压缩节省的容量可能较少。主存储程序通常采用随机数据模式,压缩功能可以使其持续节省容量。

  实际上,数据模式的冗余程度越高,重复删除技术能节省的空间越大。数据模式的随机性越强,压缩技术能节省的空间越大。

  需求4:不受程序影响

  不管应用程序产生什么样的数据或者数据是否活跃,只有对各种数据执行精简功能,才能真正得到好处。实际压缩比根据重复删除水平或数据的可压缩性而确定,所有数据都必须符合要求。

  至于归档和备份,针对应用程序的数据精简功能具有明确价值,而且有时间为数据组定制精简过程。但是,对于活动数据组而言,程序的专属性可能会引起性能瓶颈,无法切实压缩容量。

  需求5:不受存储影响

  如果是混合的供应商IT基础架构,那么在所有平台中应用相同的数据精简工具,不仅可以增加ROI,还可以简化实施过程和管理过程。如果对每个存储平台应用不同的数据精简方法,那就需要事先培训,否则可能会引起存储层的混乱。
  
  需求6:补充备份优化方案

  这些工作都是为了优化Tier 1存储,如果要备份Tier 1存储,最好是以优化后的(压缩的或重复删除的)格式备份。如果在备份之前,将数据扩展回原来的格式,纯属资源浪费。

  扩展数据组、供备份使用时需要满足:

  存储处理器和外部读取器的资源用于增长数据;
  扩展网络资源,将数据发送到备份目标中;
  为备份存储设备分配额外的资源,用于存储数据。
  即使备份存储设备能执行重复数据删除等数据压缩功能,也要以优化后的格式将数据发送到存储设备,从而使得重复删除系统更加有效。

  利用备份优化方案补充主存储优化方案,这一点至关重要。

相关推荐