固态硬盘解决高性能计算中吞吐量问题

日期: 2008-08-21 作者:John Brandon翻译:51CTO 来源:TechTarget中国 英文

  数据中心在采用固态盘驱动器的过程中最大的两个障碍是价格和容量。硬盘驱动器价格便宜很多,同时可存储更大量的信息。比如,据IDC的消息,一个基于服务器的硬盘驱动器价格大约是每gigabyte一美元或者两美元,而固态盘驱动器的价格大约在每gigabyte 15美元到90美元。


  容量也不可同日而语。三星的SSD驱动器的存储量仅为64GB,尽管公司计划明年发布一款新的128GB产品。同时,日立公司美国分部将1TB节能型硬盘驱动器价格定为399美元,目的是扩大产品在服务器上的配置。


  企业战略集团有限公司的分析师Mark D. Peters解释说这一固态技术已经研制了很多年,但是直到现在,对企业经理来说,在价格和性能方面仍不是最佳选择。他说,这一局面即将改变,因为对于固态盘驱动器,每秒输入/输出操作方面的益处是不容忽视的。这些益处包括固态盘没有移动的组成部分,因此寿命更长,运行速度更快,并且比硬盘驱动器更节能。


  同时当前固态盘驱动器价格下降也很快。根据三星公司提供的信息,当前电子产品制造业的趋势是此类产品价格每年下降40%到50%。


  现在已经出现了硬盘驱动器和固态盘驱动器两种产品相结合的驱动产品,例如三星公司的ReadyDrives——这一产品同时采用了固态驱动器和硬件驱动器技术。Peters引用了IBM最近关于BladeCenter服务器(采用了固态盘驱动器)的公告,“现在是采用固态驱动器的时机了,这一产品将是您的最佳选择。”


  IDC公司的分析师Jeff Janukowicz赞同上述论调,“价格的迅速下降,伴随着容量的提高,这都将使固态盘驱动器逐渐成为数据中心中硬盘驱动器的替代品。”


  两个例子说明了固态盘驱动器如何处理高性能计算中长期存在的吞吐量问题,一些业内观察者相信,这两个实例显示出固态盘驱动技术可能会在2008年发起新的攻势。


  一、固态硬盘在斯坦福线性加速器中心的应用


  在这一研究中心,固态盘驱动器被用于当今一些数据最密集的工作。斯坦福线性加速器中心采用了粒子加速器来进行研究,包括早期的宇宙反物质和自闭症的神经元细胞问题。


  数据量非常大,以petabyte计,同时实验室采用了五千个处理器核的集束。尽管是这样,这一离散数据集(通常是仅仅100个到3000比特的信息)也被几百个研究者进行了分析。同时,科学家也逐渐开始进行每秒数以千计的数据查询,存取速度为每秒几百万数据块。


  SLAC的计算主管Richard Mount解释说,对于这些研究数据,响应时间不是受处理器数目或网络带宽的限制,而主要是受磁盘存取时间的限制。“闪存是硬盘存储器存储速度的几千倍。硬盘的随机存取速度被限制在每秒大约2000次。当存取上千字节的数据块时,这意味着一个磁盘仅可采用每秒1/50 gigabit的网络连接,以及比一个普通计算机中心网络交换机容量的1/100,000还小的容量。


  这一限制被转化成被实验室所称的“被撇出的数据集”,换句话说,就是预先安装至少一个研究者所需的相关数据集。Mount说,“这样对于现有数据集,就不需要再等待,但是如果有人需要数据集中不存在的数据,则需要等待整个产品周期,这大概是每四到六个月一次。”


  为了帮助研究者以更特别的方式接收数据,闪存或许仅是一个设备。“我们并不迷信flash,但是我们可以构建价格合理、响应时间大约为25ms的基于flash的存储器,我们现在已经开始进行这项工作。”


  Mount解释说,SLAC开发了自身的基于SSD的系统,现在这一产品已经进入最终调试阶段。


  “这一产品的第一个版本将提供大约2TB的存储量,但是仅通过购买flash芯片,我们可以轻松地将这一存储量提高到5TB或者10TB。”尽管他估计将花费更多。这一2TB的版本仅是作为测试和研发阶段的产品。


  最终,目标是将SSD技术作为所有粒子加速器研究项目的一个缓存,这就使得科学家可以在任何时间获得任意数据库的数据。IDC公司的Janukowicz补充说,“通过确保输入/输出性能与其他应用软件系统的平衡,SSD协助实现了整个系统的高效。”基于闪存的SSD特点使得其成为高IOPS读取密集型应用软件的替代品。SSD没有机械延时,同时其随机读入性能很高。因此,有了SSD,读取数据的时间是同步的,并且在不考虑储存数据的设备的情况下,所需时间非常短。


  二、考虑在西北太平洋国家实验室采用SSD产品


  在西北太平洋国家实验室,固态硬盘技术可以缓解超级计算机的瓶颈效应。在实验室中,专家们进行保持写入速度为每秒80Gbit以及读取速度为每秒136Gbit的测试。然而,一个或两个速度慢的硬盘驱动器将会使整个系统的性能减退。


  西北太平洋国家实验室的一个高级研究人员Robert Farber说,“固态设备(比如flash驱动器)可以采用一个RAID条带化技术以达到高流动带宽,就像硬盘驱动器一样,而同时保持随机存取的低响应时间。这是一项令人振奋的技术结合。”


  实验室尚未转而采用固态技术。但是Farber说真正的争论在于:对于有限范围搜索的应用软件来说,低响应时间的存取是否可以缓解计算带宽的压力。这不仅仅是一个价格容量比的问题。他说,“这也是一个消费者需要承受多少额外费用的问题,因为动力供给、存储容量以及物理空间都与之前的磁性媒介环境有着很大区别。”


  在西北太平洋实验室,他们最新超级计算机响应时间的目标是每秒25Mbit。这几乎可以管理NWChem科学软件运算此类的数据密集环境。实验室新环境的微科学设备包括一个新的超级计算机——理论上浮点性能的峰值是163 teraflop。同时,在斯坦福实验室,磁盘速度是一个关键的因素,因此固态技术是解决实验室瓶颈的关键。


  Farber所期望的一项突破是在不远的将来,操作系统将改变其分级存储体系以进行SSD直接存取,将这一技术转化为大存储量硬盘驱动器的替换。


  SSD对很多用户来说是一个补充技术而非技术更新


  问题仍然存在:什么时候SSD才能真正对企业造成影响?有些人说数据中心的SSD采用才刚刚起步,尽管笔记本电脑,如戴尔XPS M1330已经配置三星64GB SSD产品。Alienware也在其桌面电脑的配置中提供了64GB的选择。同时SSD也有着广阔的市场前景,尽管科研人员需要的是高速度以进行蛋白质的研究,而零售商可能需要的是更快的电子收款机系统。


  Violin Memory有限公司是业内一家被关注的公司。这一公司的以Terabyte计的存储设备给序列存取和随机存取提供了每秒超过1Gbit的存取速度。SLAC公司的Mount说,他测试了Violin公司基于DRAM样本设备,而Violin公司即将发布的基于flash的存储系统貌似和SLAC公司的应用软件很相配。


  Violin公司的一个发言人解释说公司计算的两大瓶颈是网速和存储系统的IOPS。他说,当前,序列操作的磁盘运行速度大约为每秒100Mbit,但是对于随机存取量为4k的数据块来说,速度每秒仅为1Mbit。


  Janukowicz补充说,“在某些情况下,最小的存储容量需求很适合SSD。同时,高性能的应用软件,IOPS metric可以通过硬盘驱动器来支持SSD。”然而,即使有着这些好处,他说“IDC公司的调查显示SSD仍未完全取代服务器中的硬盘驱动器。SSD的确有着性能优势,并且是一个“绿色”解决方案。然而,有很多应用软件需要由硬件驱动器提供的存储容量。


  企业战略集团公司的Peters说这一吞吐量需求将引发硬盘驱动器逐渐转向固态技术,但是仍需要时间。他说,“从一项技术完全转到另一项技术对数据中心来说是很少见的。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • Infinidat InfiniBox为Windows提供SMB协议节点

    为满足Windows Server数据中心客户的需求,磁盘存储专家Infinidat现在让其InfiniBox […]

  • 销毁SSD和保护数据的关键步骤

    SSD技术正在迅速发展。随着价格下降,速度和容量继续增长,SSD在存储市场获得更强的立足点。尽管它们有着较长的 […]

  • 存储经理人2017年8月刊:分解技术大揭秘

    《存储经理人》2017年8月刊重点关注分解技术,分解的理念在于用大量计算机来创建出独立的资源池,然后根据需要分配适当的资源组合,从而为各个应用程序提供相应服务。另外,混合云存储将工作负载可选择的部署范围扩展到多个云,并实现令人信服的使用场景,例如异地备份、灾难恢复和云负载爆发。本期电子杂志还将讨论数据中心的硬盘和SSD共存问题。

  • 为全闪存数据中心做好准备

    公司应该抛弃硬盘,将数据中心完全装上闪存,供应商已经解决了旧的SSD问题,比如磨损时间和成本。