预计磁盘失效率的好办法

日期: 2008-01-01 作者:Alex Barrett 来源:TechTarget中国 英文

磁盘驱动器制造商们都喜欢使用“平均无故障时间”(简称MTBF)来作为衡量产品可靠性的指标,比如说,台式机硬盘的MTBF值为50万小时,SCSI硬盘和Fibre Channel硬盘的MTBF值为100万小时。但是,许多用户却认为MTBF值并不能体现磁盘驱动器在实际存储环境内的时间质量。   站在用户的角度来考虑,MTBF“只是一个纸面上的数字而已,”富士通计算机产品美国公司的高级产品工程部副总裁Mike Chenery认为,“其实,用户们就想知道自己的磁盘阵列存储系统内将会出现多少个故障硬盘。”   用户们之所以无法接受MT……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

磁盘驱动器制造商们都喜欢使用“平均无故障时间”(简称MTBF)来作为衡量产品可靠性的指标,比如说,台式机硬盘的MTBF值为50万小时,SCSI硬盘和Fibre Channel硬盘的MTBF值为100万小时。但是,许多用户却认为MTBF值并不能体现磁盘驱动器在实际存储环境内的时间质量。

  站在用户的角度来考虑,MTBF“只是一个纸面上的数字而已,”富士通计算机产品美国公司的高级产品工程部副总裁Mike Chenery认为,“其实,用户们就想知道自己的磁盘阵列存储系统内将会出现多少个故障硬盘。”

  用户们之所以无法接受MTBF值,一部分原因是因为不明白MTBF的计算方法。比如说,假设某款磁盘驱动器的MTBF值为100万小时,是不是让它连续工作100万小时后检测出来的呢?有些用户也许会这样认为。答案是否定的,如果是那样的话,单单一个产品,就要用114年(24*365*114)的时间来检测,岂不是太恐怖啦。让我们一起来听听来自当今MAID(大规模非活动磁盘阵列)技术的主要提供商Copan Systems公司的技术总监Aloke Guha的解释吧:正确的计算方法是将一大批同样型号同样规格的磁盘驱动器连接在一起,让它们连续工作一段时间(比如说几天),得到一个值,然后再除以磁盘的数量,最后得出的就是单个器件的平均失效率。

Guha认为,有些磁盘驱动器制造商们之所以坚持使用MTBF值来表示产品的可靠性,主要是因为它们喜欢玩“数字游戏”。MTBF主要考虑的是产品中每个器件的失效率。当器件处于不同的环境、不同的使用条件下时,其失效率会有很大的区别,测试得出的可靠性值肯定是不同的。比如说,两款MTBF值均为50万小时的磁盘驱动器,一个失效率是在“一年365天、一天24小时不间断”循环工作条件下测出的,另一个是在“每天8小时不间断”循环工作条件下测出的,两款产品的性能高低一下子就比较出来啦。所以,Guha提醒消费者,购买时一定要看清楚产品标签上印刷的文字。

  另一项测量指标为“按年计算的失效率”(AFR),与MTBF不同的是,AFR能够更合理地反映磁盘驱动器的失效率。AFR值是根据制造商每年回收的不合格产品占年度总产量的比例计算出来的,企业级磁盘驱动器产品的AFR值一般都会控制在1%以下,也就是说,以一个由1000个磁盘驱动器组成的磁盘阵列存储系统为例,每年平均会有10个硬盘出故障。

  Glasshouse Technologies公司的高级顾问,Dick Benton认为,随着时代的发展,新推出的磁盘驱动器产品,存储容量一个比一个大,最好让用户知道如何估计磁盘失效率。因为,在RAID磁盘阵列存储系统中,出故障的磁盘容量越大,所需的修复时间就越长,在重新构建磁盘阵列的过程当中,其它的磁盘也可能会出现错误,造成数据丢失。

  现在最大的问题是,厂商们大多都不愿意公布产品的AFR值。Guha认为,也许用户应该主动向磁盘驱动器供应商们索要产品的AFR值。

作者

Alex Barrett
Alex Barrett

TechTarget特约作者

相关推荐