如何规划分层存储

日期: 2008-12-10 作者:Wikibon.org翻译:清水 来源:TechTarget中国

  分层存储(Tiered Storage)是指为不同类型的存储介质分配不同类别的数据,借此提高存储效率,减少总体拥有成本。存储类别的选择通常取决于应用对服务级别的需求,具体包括可用性、性能、数据保留的需求、使用频率及其他因素。分层存储最多可以把存储成本节省50%,因而相对于不断增加存储介质,这是一种诱人的选择。

  可以在存储阵列创建不同的存储层(使用不同容量或者性能的磁盘驱动器),创建方式包括: 为不同数据分配高速缓存,使用有不同特性、物理独立的存储阵列。存储分层可能很复杂。因为存储的数据越来越多,最佳实践建议设置策略和软件来自动管理日常分配以及特定数据与设备特性相对应的工作。

  选择分层存储的原因

  分层存储的关键业务驱动因素和最终用户考虑因素包括如下一些:

  1.“SAN蔓延”形成了彼此不兼容的存储孤岛,没有简单的办法来共享服务器和磁盘阵列之间的数据;

  2.并购活动带来了异构的SAN基础设施,进一步增添了复杂性;

  3.第一层(Tier-1)存储的基础设施有时成本过高,促使许多公司制订“避免第一层”的策略;

  4.存储阵列迁移时,复杂的迁移和配置费用往往超过5万美元,还需要停止运行应用以便迁移数据或者配置新容量。

  Wikibon.org对最终用户进行的研究表明,软硬件每花1美元,在阵列的整个使用期间,阵列迁移及配置另外要花50美分。但如果实施分层存储,这个数字可以减少到10美分。

  在大型机领域,自动化分层存储早已存在了几十年,为什么在其他领域却不十分普及呢?答案在于大型机以外的领域存储具有异构性,存储硬件、应用、技术和架构的多样化带来了挑战,因而到目前为此,尽管有几家厂商付出了努力,仍很难实现自动化。因而,分层存储只有10%到15%的采用率。不过,有人认为现在每家公司都在采用某种分层方案,这要看分层存储如何定义了。

  制定分层存储的策略

  分层存储的一种策略是把磁盘存储迁移到单一架构(比如全部采用第一层存储),但这种方案成本高昂。数据格式只是挑战之一,甚至不是最难的问题。真正的困难是,由于每个应用和每组用户都需要访问数据,如何在整个IT环境建立一种有效、自动化的基于策略的分类体系。

  为此,有些公司选择对存储资源进行虚拟化处理,这样做的好处是应用与存储可以随时映射,而且是动态映射。这样就可以无缝迁移数据。不过,虚拟化技术带来了自己的一系列挑战,包括实施复杂性和性能问题。

  有些用户特别关注异构数据(如电子邮件系统和软件开发数据)组成的庞大数据池,围绕这些迅速扩大的数据池建立分层存储岛,设法实现分层存储。这可以大幅节省成本,实施起来也比虚拟化技术简单得多。不过,日常管理成本过高,因为这些数据池需要人工连接,而且应用也需要进行相应调整。虚拟化技术开始使用自动方式进行这种连接,不过用户有时不采用这种方案,特别是需要为比较昂贵的第一层存储平台增加容量时更是如此。

  重要的是,虽然关于分层存储的讨论主要是围绕昂贵、高性能的第一层和更具成本效益的第二层中档解决方案,但一半以上的数据放在第三层系统上,即成本非常低的磁盘或者磁带上。这对用户来说是实在问题。

  专家建议在制订分层存储策略时可以采取下列措施:

  1.明确定义恢复点目标(RPO)和恢复时间目标(RTO),让它们成为决定放置数据的因素(而不是由业务部门主管在没有明确理由的情况下要求使用第一层服务)。

  2.向业务部门传达这些要求,让IT部门可以使用这些策略分配存储。

  3.简化存储层,要求最高的应用放在第一层存储(基于服务级别),其他各种应用默认情况下放在第二层存储,根据法律和法规遵从规定的记录管理和保留策略,迁移到第三层存储。

  4.对前端和后端资源同时进行虚拟化处理,充分利用成本较低的阵列,以降低硬件成本以及尽量少用昂贵的存储软件许可证。

  5.简化存储管理软件和程序,并减少现有的存储管理套件, 可能的话,只用一个套件。

  6.认真测试每一组应用进行虚拟化处理时对可靠性和性能带来的影响,在合理的时间段内推广部署。

  这样会尽量接近这个目标: 创建实施了分层存储策略的单一SAN环境。

  当然,上述策略存在某些风险,即虚拟化复杂性、性能问题和可用性问题(如把第一层阵列放在中档虚拟化设备后面)。另外,这种方案尽管能大大简化IT环境,并有望降低硬件、软件和迁移成本,但会导致用户受制于提供虚拟化技术的一家或者多家厂商。尽管如此,考虑到成本有望节省50%的优点还是使分层存储成了诱人的目标。

  技术上需要考虑的问题

  有效实施分层存储涉及几项关键技术: 确保有效分类的软件和流程、对数据集传送没有破坏的软件以及确保完整性的硬件。

  最难的技术问题是确保数据完整性,特别是在出了问题的时候。应用性能也是个关键因素。许多公司求助于对服务器和存储都采用虚拟化处理,以应对数据增长及成本方面的挑战,目的就在于创建一种灵活性、响应能力和成本效益大大提高的基础设施。

  对小网络而言,基于网络的虚拟化设备效果很好,但最终用户需要进行集成。许多公司选择对存储阵列进行虚拟化处理。这里的关键问题是,公司针对所有存储域(storage domain)采用这种策略能取得多大的成功。比方说,如果虚拟化设备的可用性低于其后面连接的设备,会有什么影响?另外,如果设备因阵列虚拟化带来额外开销而无法支持应用的响应时间要求,它就根本不适合虚拟化策略。此外,这种设备上支持的逻辑设备号(LUN)数量往往有限制,这就需要安装多个设备,从而增加了复杂性和费用。特别是,各设备上的存储资源无法在单一逻辑池中进行虚拟化处理。

  在大型网络上,由于架构方面的原因,让存储控制器处理数据完整性和数据迁移方面的所有问题可能具有优势,因为控制器能够支持经过虚拟化处理的阵列,这样就可以连接现有资产和成本较低的阵列。

  自动精简配置(thin provisioning)能够为应用配置需要的存储设备,这项技术日益得到采用。不过,这种方案同样存在集成问题,包括建立这种架构以及把现有数据和基础设施迁移到新系统,然而这并不容易。

  除了基于虚拟化技术的分层存储方案外,还有越来越多的厂商提供设备内部分层存储解决方案,比如使用较低成本的SATA设备以及性能较高的光纤通道驱动器。这是一种简单方案,但它无法集成异构存储阵列。至于技术集成方面,用户还不能指望找到灵丹妙药(如跨多个数据中心的单一解决方案)。基于数据块和文件的存储仍然基本上各自独立,这进一步分化了存储策略。用户更应当关注数据分类、策略、自动化以及集成缓解迁移和配置难题的技术。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

清水
清水

相关推荐