存储“动车组”——集群存储(诞生篇)

日期: 2010-05-23 来源:TechTarget中国 英文

  集群存储不同于传统的SAN和NAS 架构,它就像一列高速驰骋的“动车组”,车厢增加了,速度也丝毫不受影响。这就是集群存储,容量扩展的同时,性能同步提高。

  为非结构化数据而生

  信息高速增长势不可挡。据IDC的报告显示,现在全球数据量每18个月就要翻一番,每年全球产生的数据量已经高达40EB(1EB=1000PB)。而这些疯狂增长的数据主要来自非结构化数据。结构化数据主要是指那些数字的或能用统一的结构来表示的数据,如存储在数据库中的数据,这些数据基本上是以块(Block)的形式呈现;不言而喻,非结构化数据是指那些无法用数字或统一的结构来表示的数据,像文本、图像、视频、音频、报表、网页等都是非结构化数据,它们大多以文件(File)的形式保存;另外,还有一种介于结构化和非结构化之间的半结构化数据,电子邮件就是半结构化数据。正是网络的发展和数字化程度的提高,使我们的生活发生了变革,更重要的是,企业的业务数据类型正在发生着巨大的变化,非结构化数据所占的比例越来越高,而且增长速度远超过结构化数据。

  根据Gartner的统计,2008年,基于文件的存储系统容量出货量以微弱的优势首次超过了基于块的存储系统容量的出货量。根据以上趋势,到2012年,基于文件的存储系统容量将占到总容量的70%。而IDC也同时预测,鉴于基于文件类型的非结构化数据的增速极快,到2012年,全球存储市场的总出货量中将有80%的容量被文件级数据所覆盖。

  如此看来,非结构数据快速增长且占据总数据量的多数已毋庸置疑。而摆在企业用户面前的难题是如何去应对这些无法预计的数据存储需求,同时,过去传统的存储架构基本上是为块级存储而设计的,很难适应当前存储的变化和新的需求。因此,集群存储应运而生,并迅速发展起来。

  捷华润公司技术经理陈爽认为,数据规模的爆炸性增长和由此产生的对存储I/O性能的更高要求使集群存储有了更广阔的发展空间。无疑,高性能、高容量以及可扩展性是集群存储得以发展的最得人心的特征。

  NetApp公司大中华区总经理陈文俊则从另一个角度阐述了集群存储发展的驱动力,他认为,运行于Linux和Unix上的计算集群具有极高的存储要求,性能要求通常在每秒GB级范围内,而容量可以增加到PB级。为避免热点并且最经济,人们非常希望能够在不中断应用的情况下,在存储系统之间或不同类别存储之间移动数据,并可以方便而有效地管理存储环境。

  惠普相关人士则认为,随着文件级存储市场的发展,集群NAS在很多文件级的应用中,比如数据文件检索,拥有着极大的优势,这也将成为驱动集群NAS系统发展的重要原因。

  对于集群存储,专注于集群存储领域的Isilon公司中国区技术部总监杨峰认为,一般来说,集群存储有两种实现方式。一种是在现有硬件基础架构上加上软件,典型的代表是SAN架构+并行文件系统。这种架构是折衷的解决办法,面向的是已经采用了大量SAN、NAS架构的存储用户。在现有硬件架构之上+并行化文件系统,并不能跨越原有硬件架构的局限性,只不过是局部的改良而已。另一种是专用集群存储,采用独特的开放式架构,通过分布式操作系统实现集群存储,这是完全并行化的解决方案,从硬件到软件都实现了并行化。
  

  就像开上了“动车组”

  集群存储是有别于传统的SAN和NAS的一种新的存储架构。传统的SAN与NAS分别提供的是数据块与文件两个不同级别的存储架构,而集群存储是主要面向文件级别的存储系统。因此,也常常被称为集群NAS。

  杨峰认为,SAN系统具有很高的性能,但是构建和维护起来很复杂。由于数据块和网络需求的原因,SAN系统也很难扩容。NAS系统的构建和维护虽然比较简单,但由于其聚合设备(又称为NAS头)是其架构上的瓶颈,造成其性能很有限。集群存储集中了SAN和NAS的优点,且具备它们不具有的优点。在大多数使用集群存储的案例中,随着存储系统的扩容,性能也随之提升,理论上,一个大的集群存储的性能往往胜过一个SAN系统,但是价格却比SAN更加具有优势。集群存储和NAS的概念是在文件系统层面上的,而SAN是在LUN层面上的,集群存储可以利用SAN环境实现。因此,集群存储与SAN解决的问题不同。如果一定要比较这两者的优缺点的话,可以说,SAN做到的是多个服务器节点可以同时看到SAN环境中的同一个LUN,还不能做到多服务器节点间的文件级共享。集群存储在性能、可靠性及扩展性等多个方面都远远优于传统的NAS。

  华为赛门铁克公司全球存储行销部部长姜天露认为,尽管NAS技术是存储文件等非结构化数据的首选方案,但传统的NAS设备会形成新的“信息孤岛”。在企业数据中心,NAS通过IP网络帮助用户实现了多服务器数据共享的功能,但由于业务以及数据的大量激增,尽管单台NAS目前的最高容量也已经达到了PB级,但仍然难以满足要求。面对越来越多的数据,用户只好不断地购买NAS存储,而越来越多的NAS存储就像以前的DAS和SAN那样形成了新的“信息孤岛”,多文件系统、多命名空间、多个挂载点给企业的IT维护人员带来了不小的麻烦。因此,姜天露认为,集群NAS是存储向集群化发展的必然方向。其实不管是NAS还是SAN,这种不断向上发展的方法几乎都已走到了尽头。看看CPU技术,不也从不断地提高频率而变为不断地增多内核了吗?关于集群存储的优势,他认为不外乎两点。一是灵活性,这是集群存储最明显的优势。用户可以根据当前的需要来购买存储,需要多高的性能、多大的容量,都可以自由选择,也就是按需购买,即买即用,而不是一下子就买一台非常庞大的设备,支付非常高的成本。二是可管理性,因为不管用户购买了多少个控制器,也不论购买了多少磁盘,它看起来还是一套系统。

  陈爽认为,相比SAN和NAS,集群NAS具有更好的横向扩展能力以及简便的管理和低维护成本。说到横向扩展(Scale-out),这是近两年在业界出现频率较高的词汇,在存储中,横向扩展是指存储具有模块化的结构,其扩展容量的同时,性能也呈线性增长,用户最初只需部署能满足眼下需要的容量和性能,也就是按需配置,之后可根据应用的需要逐渐增加容量,当然性能也随之增加。与之相反的是一般传统存储的纵向扩展(Scale-up),也称向上扩展,这种存储设备扩展时往往增加了容量,降低了性能,并且可扩展的空间也很有限。集群NAS则是横向扩展的存储,Isilon就称其集群存储产品为横向扩展NAS。

  集群存储与传统的SAN、NAS的区别在业界有一个很形象的比喻,即SAN和NAS就像传统的火车,一列火车能承载的乘客数量(即存储容量)完全取决于火车头的功率(即机头的性能),当火车的车厢增加后(即在允许范围内扩容),火车的速度自然也就降低了。而集群NAS(或横向扩展NAS)就像最新的动车组,每节车厢都有自己的引擎,当需要增加车厢时,整列火车的动力也相应增加了,只要条件允许(如站台长短,相当于机房),车厢数就没有限制。

下一篇文章 存储“动车组”——集群存储(市场篇) http://www.searchstorage.com.cn/showcontent_35295.htm

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 云计算NAS提供跨本地和云端的文件访问

    非结构化内容正在快速增长,并在新数据中处于领先地位。 通常来说,以非结构化格式创建的信息会作为对象储存在对象存 […]

  • 对象级存储正准备替代企业中的NAS

    文件服务接口已经成为许多供应商的可大规模扩展对象存储产品的标准功能,这就让对象储技术的使用变得更简单,也让对象存储越来越容易替代传统NAS存储。

  • 企业存储系统新旧大比拼

    传统的外部存储系统主要有两种类型:网络连接存储(NAS)和存储区域网络(SAN)。而云计算和对象存储的兴起促成了软件定义存储的出现。

  • 什么是文件存储?

    文件存储,也叫作文件级或者基于文件的存储,它是以一种分层的结构存储数据。数据保存于文件和文件夹中,同样的格式用于存储和检索。