部署SSD需要思考的性能与成本问题

日期: 2009-12-21 来源:TechTarget中国

基于闪存的固态硬盘(SSD)今年以来成为大多数企业级存储系统中的常见客,其高性能、低功耗和价格昂贵的特点使其被惜用于缓存或“0”层存储中。那么,什么样的应用值得使用SSD?如何在高性能和高成本中找到一个平衡点,使SSD在数据中心应用中体现出它的最大价值?

  固态硬盘(Solid State Disk,SSD)存储技术从出现到现在已经有几十年了,但最近才开始广泛应用于笔记本电脑和桌面计算机,特别是一些对性能要求苛刻的高端应用。从去年开始,SSD开始进入企业级存储系统中,或作为缓存应用,提高系统的性能,或作为分层存储中的“0”层存储,加快关键应用的读写速度,消除系统中的“热点”。自从最为积极倡导SSD的EMC公司去年率先在其高端存储系统中应用了SSD后,大部分企业级存储厂商都开始在自己的存储系统中支持SSD。同时,很多企业目前也意识到了在数据中心中部署固态硬盘支持关键应用软件带来的好处。不过,即使是已经推出支持SSD存储系统的厂商,也有相当一部分并没有将其作为重点产品来推广,究其原因,最重要的一点就是SSD目前相比传统磁盘的昂贵的价格,使它还不能成为“想用就用”的存储设备,距离广泛普及恐怕还有相当的时日。

  想清楚四个基本问题

  相比传统硬盘,固态硬盘具有更高的性能,但是只有在高性能和高成本中找到一个平衡点,才能让固态硬盘在数据中心中体现最大的价值。

  有一点需要特别说明的是,固态硬盘也分不同的种类,性能和成本也不尽相同。固态硬盘的高速性能的成本很高,平均每GB容量的成本是传统硬盘的10倍。在选择固态硬盘之前,需要做的事情包括:找到需要提高硬盘性能的理由,以及哪种固态硬盘最适合目前的应用软件。

  1.对存储速度的需求:SSD是你需要的解决方案吗?

  IDC在一项调查中预测,2007年到2012年,固态硬盘市场将增长70%,但这种新型存储硬件不会在一夜之间普及开来。

  对于大多数应用程序来说,固态硬盘能够显著提高IPOS(每秒读写次数)。使用固态硬盘代替部分传统硬盘,能够发挥分层存储的最大优势,因为分层存储经常会在高性能、低容量存储器与低性能、高容量存储器之间传输数据。不过,如果在分层存储中集成固态硬盘却不做任何优化处理,就好像在正方形中画一个圆形一样,并不能将性能发挥到极致。

  考虑到速度和成本的平衡,首先不要购买太多的固态硬盘,同时确保能够发挥固态硬盘的最大性能,比如用固态硬盘来支持关键的虚拟化软件。要确定能否在现有磁盘阵列中集成固态硬盘,否则还需要购买新的磁盘阵列卡或磁盘阵列来使用固态硬盘。如果系统的架构不合理,那么,使用固态硬盘的成本将会过高,并且难于管理,使用效率也将不及传统磁碟型硬盘。如果你正在几款固态硬盘之间犹豫的话,那么,你可以与供应商们沟通,从而在购买之前确定固态硬盘在系统中集成的方式以及发挥其最大性能优势的方法。

  2.硬盘还是缓存:SSD的两种使用方式

  一般情况下,决定部署SSD之后,下一步的工作就是具体方案的设计,而对其影响最大的问题在于选择将固态硬盘用做存储系统缓存还是固定存储器。

  如果将SSD作为缓存使用,可以提高服务器或控制器的性能,因为此时的固态硬盘就好像一块额外的DRAM(Dynamic Random Access Memory,动态随机存储器)内存。由于目前许多控制器本质上来讲都是一个封闭的系统,无法增加缓存卡,而惟一补充缓存的办法就是将固态硬盘当做缓存来使用,但这样做的成本很高。虽然有些控制器可以在PCI插槽上增加存储器缓存,可更重要的问题在于,如果将固态硬盘当做缓存使用,那么系统将与分层存储结构不兼容。而目前业内普遍认为,分层存储是充分利用固态硬盘高速性能的最佳途径。

  将固态硬盘作为固定硬盘使用与作为缓存使用有所不同。这种方式直接将固态硬盘与传统硬盘放在一起,组成分层存储结构。在分层存储体系中,固态硬盘只为那些对性能要求较高的应用软件提供支持,于是需要的固态硬盘数量就较少。对于那些不太重要而却需要快速访问的数据来说,通常将其放在相对低廉且容量更高的光纤通道或SATA硬盘上,而不是放在离线存储器或磁带中。固态硬盘与传统硬盘之间的数据交换取决于策略,比如说访问频率策略。好的策略可以显著地降低存储和管理数据的成本。

  总之,选择将固态硬盘当做缓存还是固定硬盘取决于一个最基本的问题:存储需求,也就是你需要存储一些什么样的数据。固态硬盘作为缓存使用可以极大地提高整个存储架构的性能,并且不需要增加额外的软件和员工培训,但这种设计与分层存储不兼容。如果把固态硬盘作为固定硬盘使用,也可以起到提高系统性能的作用,这样的设计只需要将分层系统中最活跃的部分换成固态硬盘即可,而不需要把所有存储器都换成固态硬盘。

  3.SLC还是MLC:SSD的“芯”也需要选择

  目前的固态硬盘主要分两大类:基于闪存结构的和基于DRAM结构的。自从固态硬盘出现以来,闪存一直比DRAM更受到数据中心的青睐。虽然DRAM性能更好,但其部署成本更高,而且从目前来看,闪存的速度已经比传统磁碟型硬盘阵列的速度快多了。更重要的是,目前闪存的兼容性要更好,并且支持大多数存储阵列厂商的不同格式。

  闪存式固态硬盘发展至今,也出现了两种结构形式,即SLC(Single Layer Cell 单层单元)闪存和MLC(Multi-Level Cell多层单元)闪存。SLC最初主要应用于企业级存储,其特点是每个数据字节存储在一个单元内。这种类型的存储格式可靠性高、寿命长、循环读取/写入性能更好。相比之下,MLC的制造成本低,但传输速度慢、耗电量高、可靠性有所降低。MLC通常作为消费级存储卡使用。在MLC结构中,由于每个存储单元中存放的资料较多,结构相对复杂,出错的几率也会增加—如果某个单元出现了故障,会丢失很多连带数据。

  4.选择能使SSD效率最大化的软件

  人们使用固态硬盘的原因在于其能够提高关键性应用软件的运行和访问速度。因此,软件也是固态硬盘的一个重要问题。目前使固态硬盘性能最大化的存储虚拟化软件有两种,一种是存储资源精简配置(Thin Provision,也称瘦供给)软件,另一种是自动分层存储软件。不过,首先,在安装这些软件之前,为了自动跟踪和报告存储层间的固态硬盘剩余容量,你还需要安装存储资源管理软件(Storage Resource Mnagment,SRM)。SRM能够提供足够的详细资料,这样就不再需要为了制订固态硬盘的空间使用策略而拍脑门了。

  在这里,存储资源精简配置是指当有数据写入时,只利用高速硬盘的空间,而使其他硬盘尽量空闲,这样可以保持最高的性能。不过,虽然存储资源精简配置软件已经比较成熟,但其能支持固态硬盘的厂商目前还寥寥无几。

  另一种优化软件叫自动分层存储软件。部署固态硬盘虽然能够提高性能,但如果不进行合理的安排,如不及时将大量数据从固态硬盘向低速硬盘转移,则将会造成大量数据滞留在固态硬盘的状态,降低系统效率。据行业调查分析显示,在存储系统中,无论何时都有70%~80%的数据是静止不动的。自动分层技术能够提高业务数据的流动性,而不再需要管理员进行干涉或者任何其他的数据分类软件,节省了时间和资金。

  如果能够将存储资源精简配置与自动分层存储结合起来,用户就能最大程度地发挥固态硬盘的优势,为关键性业务软件提供最好的硬件支持。

  让SSD创造价值

  固态硬盘的高效率在于其提高输入输出速度的能力,虽然每GB成本比磁盘存储器要高,但单位输入输出成本却低很多,这是根据固态硬盘的实际使用情况统计得到的结果。有些厂商甚至认为固态硬盘的存储速度相当于30个光纤通道。

  虽然大部分数据中心基本上每天处理的IPOS不会数以万计,但从目前来看,部署固态硬盘可以为将来做准备,让企业与未来的增长无缝接轨。

  值得一提的是,固态硬盘的价值还可以在桌面电脑上得到体现,因为有些高端用户是将性能、访问速度放在第一位的。固态硬盘带来的更短的数据传输延迟可以提高数据库的访问速度和销售报告的处理速度,也就是说,固态硬盘的价值不仅可以体现在企业运营上,同时还可以提高员工的工作效率。

  SSD的自动化工具

  目前,存储厂商们正在开发一种自动化软件,使用它可以将频繁使用的数据自动地存放在高速闪存设备中。

  IT管理员们都知道,在存储系统中,频繁读写的数据往往要求更高的访问速度。闪存式存储器是一种良好的解决办法,但要完全发挥固态硬盘的优势还需要某种自动化软件的辅助才行。目前世界上的主要存储厂商才刚刚开始涉足这个领域。

  闪存式存储设备由于不需要旋转磁碟,所以可以得到更高的单位数据读取速度。但闪存式存储器的写入速度不及读取速度,单位比特成本也比磁碟式硬盘高出许多。所以,目前来看,固态硬盘仍然不能取代磁碟式硬盘,两者结合起来使用才是最好的选择。

  根据企业不同的需求,使用闪存的方法主要有两种。相比不使用闪存的传统快速存储方法来说,这两种使用闪存的快速存储方法都具有空间占用少、电能消耗低的特点。

  第一种方法是直接将闪存插入服务器中,这样可以令闪存工作在DRAM的下一层。通常将读写频率最高的数据自动地保存在闪存这一存储层上,直到其读写频率降低为止,而此时闪存中的数据则将被转移到磁碟存储器中。作为组成固态硬盘的存储介质,闪存实际上位于永久性存储系统中的最顶层。

  在固态硬盘中存储那些读写频繁的数据最能体现固态硬盘的价值,比如数据库信息或流媒体数据等。但是,由于读写频繁的数据并不固定,因为所有数据的使用频率都在不断变化中,其所在的存储单元也不尽相同。因此,存储厂商目前都在试图寻找能够自动发现活跃数据的方法,从而能够自动地将这些数据转移至数据中心的闪存层,以此提高系统的性能。

  日前,IBM公司官方透露了一些在这个领域所做的工作细节。IBM目前在开发一个被称为数据自动再存储 (Automatic Data Relocation)的系统。该系统能够在某一个存储单元中识别最活跃的数据,然后将其转移至闪存中,将不活跃的数据保存在磁碟存储器中。据IBM存储虚拟市场经理Chris Saul称,IBM计划明年上半年在其DS8000存储阵列中首先应用这一系统,而从明年下半年开始在其存储虚拟中心(Storage Virtualization Center)平台上应用。

  EMC公司也在开发自动分层系统——FAST(全自动存储分层)系统,该产品将在今年晚些时候投放市场。EMC计划明年年中在这个系统中增加子存储单元分析功能。目前,Compellent Technologies在自动数据转移方面走在了行业的前面,并且已经开发出了具备子存储单元分析能力的产品。

  据Forrester 咨询公司的分析师Andrew Reichman介绍,将闪存作为缓存使用则比较适合那些对速度性能要求极高的企业,比如说股票交易所。在这种情况下,基本的数据排序是自动的,并且大部分厂商会提供将特定类型数据“钉”进闪存的工具,这样可以保证缓存中的数据不会丢失。

  固态硬盘的另一个用法是作为存储阵列使用,但Andrew Reichman说,这需要企业寻找出或自己开发出一种专门的分析工具,用来识别哪些文件才最适合放在固态硬盘中,但并不是所有企业都具有自己开发的人力和资金。

  不过还是有一些企业拥有这样的实力,例如MySpace。MySpace的技术运营副总裁Richard Buckingham说,MySpace目前仍然将闪存当做缓存来使用,因为多媒体社交网络服务对速度的要求很高,但预计公司未来很可能会增加固态硬盘的数量。他表示,MySpace拥有自己的技术专家,能够开发出自己的自动分层软件。而这样的优势很少有企业能够拥有。

  对于大多数企业来说,使用FAST或者Automatic Data Relocation软件,可以解决上述大部分工作。Forrester咨询公司的Andrew Reichman说,目前存储厂商们都在开发自动化数据移动工具,因为这些工具可以使大部分企业在拥有闪存以后得到效率的提高和成本的降低。他认为,自动化软件是隐藏在闪存背后的需求。

  451集团的分析师Henry Baltazar说:“自动分层是未来的趋势,因为一点一点地分析不同的数据实在是太痛苦了。” 他认为,虽然软件可以代替人来指定哪些数据应该存储在什么地方,但是在此之前整个行业需要统一出一个标准来,只有这样才能让分层软件适用于不同的存储结构。据说,美国存储网络工业协会(SNIA)目前正在制定这个标准,Henry Baltazar说,希望这个标准能够得到厂商们的支持。

  这位分析师还说,在任意的自动化系统中,子存储单元的性能是至关重要的。但如果只是因为某数据库中的一部分数据访问频率较高就将所有存储介质都换成闪存显然是不合适的,因为固态硬盘比磁碟型硬盘的每比特价格高得多。

  Andrew Reichman也表示:“在整个存储单元中全部使用固态硬盘意味着浪费。这可是10倍成本的区别。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 销毁SSD和保护数据的关键步骤

    SSD技术正在迅速发展。随着价格下降,速度和容量继续增长,SSD在存储市场获得更强的立足点。尽管它们有着较长的 […]

  • 评估读取密集型与写入密集型应用场景中的SSD用例

    IT购买者必须在读取密集型、混合使用型和写入密集型SSD之间进行选择时做出正确判断。 当首次投放市场时,第一批 […]

  • Optane:开启英特尔最新技术的窗口

    现在Optane产品已经出现在市面上了,能为存储和处理提供最快的存储器的特性看上去很不错,但是Optane真的像英特尔在市场宣传上说的那样吗?

  • 存储经理人2017年8月刊:分解技术大揭秘

    《存储经理人》2017年8月刊重点关注分解技术,分解的理念在于用大量计算机来创建出独立的资源池,然后根据需要分配适当的资源组合,从而为各个应用程序提供相应服务。另外,混合云存储将工作负载可选择的部署范围扩展到多个云,并实现令人信服的使用场景,例如异地备份、灾难恢复和云负载爆发。本期电子杂志还将讨论数据中心的硬盘和SSD共存问题。