数据存储的未来:解决传统架构的问题

日期: 2013-11-03 翻译:李志明 来源:TechTarget中国 英文

  即使在虚拟领域中出现越来越多的新的数据存储技术,传统的存储系统仍然普遍。在存储决策(Storage Decisions)芝加哥研讨会上,(TechTarget存储媒体)主编Rich Castagna与Cognizant公司IT基础设施服务事业部资深经理和首席架构师Phil Goodwin座谈,深入了解数据存储的未来。在这个视频中,他们讨论了传统的存储技术的问题、如何处理这些问题以及数据存储的未来前景。 一直有很多关于主存储器重复数据删除的讨论。

这方面的状况如何?为什么进展一直如此缓慢? Phil Goodwin:有必要澄清的一件事情是:当我们讨论重复数据删除的时候,Data Do……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

 

即使在虚拟领域中出现越来越多的新的数据存储技术,传统的存储系统仍然普遍。在存储决策(Storage Decisions)芝加哥研讨会上,(TechTarget存储媒体)主编Rich Castagna与Cognizant公司IT基础设施服务事业部资深经理和首席架构师Phil Goodwin座谈,深入了解数据存储的未来。在这个视频中,他们讨论了传统的存储技术的问题、如何处理这些问题以及数据存储的未来前景。

一直有很多关于主存储器重复数据删除的讨论。这方面的状况如何?为什么进展一直如此缓慢?

Phil Goodwin:有必要澄清的一件事情是:当我们讨论重复数据删除的时候,Data Domain之类的公司设定了一个标准,当时他们说:“我们可以做到20:1、32:1、50:1的压缩类型”。

你不会在传统存储或者在线系统做到那种压缩类型。如果你留意NetApp所做的,我想他们保证的是2:1,你可能做得比那更好,但是我想他们不会保证多于2:1。

它的客观局限性其实在于将存储还原所需要的IOPS的再水合化。比方说,一个高度规范化的数据库。高度规范化的数据库的好处在于你确实压缩了大小。坏消息是:要还原一条记录,而不是去到这条记录并用单个I/O进行还原,现在可能需要2个、3个、4个、10个不同的I/O才能还原那一条记录。当你讨论重复数据删除的时候,也是同样的问题,因此,你把更多的IOPS和性能的压力施加在阵列上,以更好地利用重复数据删除。

当我们考虑存储的取舍的时候,它们大部分似乎针对的是容量。难道性能不也是一个问题吗?

Goodwin:是的,当你讨论性能的时候,其实有两件事情:IOPS,即后端的I/O能力,以及前端的吞吐量性能。我们真正看到问题清单的地方更多的是在于IOPS后端。传统上,你从一台阵列上获得更多的性能的方法是在它里面放置更多的设备,因为你的磁盘越多,你获得的IOPS就越多。但这导致在容量方面的总体效率低下,因为很多大型公司的容量利用率只有20%、30、40%,这意味着他们的每GB的成本是实际成本的两倍或者三倍。当你讨论PB级的信息时,你是在讨论那种环境中被浪费在管理成本上的几百万美元。

因此,IT公司已经开始利用1TB、2TB、3TB的驱动器这些高容量的设备,它们真正缩小了阵列的密度。坏消息是:如果你从每GB的IOPS的角度考虑,为了方便计算,比方说,你用一个400GB的SAS驱动器,你可以从这个驱动器获得大约200 IOPS。因此,如果你有1TB,你将可以从这5个驱动器获得1000 IOPS。如果你用一个1TB的SATA驱动器,你其实只能从中获得大约75 IOPS。

这样,你在设备的容量与其性能之间得到一个反比关系,而我们也开始看到一些曲解。所以,我对我的客户的建议是:考虑自动分层存储------在顶层部署固态驱动器,部署能够将热数据从便宜的、高容量的磁盘移至高性能磁盘并在数据热度降低时移回的自动化软件。我认为,你这样做可以两全其美。

数据在系统中被保护和被存储的方式现在也被重新审视。容错编码之类的有可能取代RAID吗?

Goodwin:确实非常有趣,RAID完了吗?可能还没有,或者至少在可预见的未来没有。但是,当你现在讨论RAID,尤其是那些具有相当大型设备的RAID,你确实需要使用双奇偶校验设备,或者有时候需要使用三重奇偶校验,或者有不同的等级,你可以使用你需要的尽可能多的奇偶校验。

这引出两个问题。一个是与性能相关的奇偶校验开销,但是现在你正把越来越多的容量放在我称之为非生产性的环境中,在这个环境中,奇偶校验驱动器唯一工作就是安静地等待故障的出现。故障总会出现,这也是你这么做的原因,但是你可能有20%、30%、40%的非生产性容量的开销。

因此,我们看到的是更多的基于对象的改变。你提到的容错方式取决于更多的跨系统的复制和实证,而不是一个奇偶校验的环境。

那么,你认为我们在数据存储系统的未来将看到什么其它新的进展?

Goodwin:其中一个驱动因素是虚拟化的服务器环境,我认为我看到越来越多的是转向全固态阵列。不久以前,我写过一篇关于固态阵列的文章,我想我已经对外面的厂商社区做了很好的调研。后来我来到存储决策研讨会,走在会场中,有5家我从未听说过的厂商。因此,我们突然有了一个充满活力、生机勃勃的固态阵列市场。

我认为,他们将要解决的问题其实是数据移动的问题。因为,如果你考虑虚拟化的环境,你可以把系统和应用从一个数据中心vMotion到另外一个数据中心,而那些数据必须在某处可用,这非常精彩。因此,我看到市场出现了分叉,在数据中心我们将使用全固态阵列,以获得在这里有大量数据访问的那些应用所需要的性能。但是,之后它变成了一个更加混合的云环境,在这里我们将使用高容量的设备并把它们移到云。接下来,我们将会有可以访问数据中心和云环境之间的那些设备的混合设备。我认为,这个架构在未来将变得更加普遍。

相关推荐

  • 云中数据存储需谨慎

    基于云计算的数据存储、云计算以及各种aaS形式的服务开始刷存在感,为本地基础架构蒙上了一层阴影。云服务既经济又容易使用——如果你知道诀窍的话。需慎重处理云计算问题,你可能会遇到熟悉的本地存储问题。

  • 利用多云存储降低云锁定风险

    多云存储的战略允许数据在不同公共云之间移动,从而避免被单个云提供商锁定,同时降低成本并提高工作负载运行效率。

  • 在灾难发生之前 控制数据存储的增长!

    数据已经有了自己的生命,并且一直在增长。是时候采取控制措施了。有大量的数据管理应用程序以及系统可以帮助限制和管理在企业周围浮动的数据量。例如复制数据管理(CDM)产品能很好地防止数据的激增,从而减少不必要的、不受管理的数据存储增长。

  • 在购置拷贝管理系统前明确你的业务所需

    拷贝管理技术用以收集管理包括备份、归档、测试以及部署环境在内的二级数据,同时降低存储成本。那么在评估拷贝管理系统之前,企业应该考虑哪些方面的因素呢?