原地失败(Fail-in-place)系统:避免硬盘故障

日期: 2009-11-04 作者:Marc Staimer翻译:曹同举 来源:TechTarget中国 英文

“原地失败”是一个全新的概念,主要是用来解决存储系统中更换热插拔或者热交换硬盘驱动器时引起的问题。通常包括:误拔硬盘导致数据丢失;故障硬盘过久没有更换,推迟了重建的时间并且增加了数据丢失的风险;使用了未经测试的热备盘,导致第二块硬盘出现故障等等。 “原地失败”这个概念被重新定义,并且从单独的硬盘扩展到整个的存储系统。存储系统是一些硬盘的集合体,并且指定一些空间供所有硬盘共享使用。

如果有硬盘出现故障,硬盘会从这些指定的空间开始自动重建。现在有两个厂家提供原地失败存储系统:Atrato Inc(产品是Velocity1000或者V1000)和Xiotech公司(Emprise 5000或者ISE)……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

“原地失败”是一个全新的概念,主要是用来解决存储系统中更换热插拔或者热交换硬盘驱动器时引起的问题。通常包括:误拔硬盘导致数据丢失;故障硬盘过久没有更换,推迟了重建的时间并且增加了数据丢失的风险;使用了未经测试的热备盘,导致第二块硬盘出现故障等等。

“原地失败”这个概念被重新定义,并且从单独的硬盘扩展到整个的存储系统。存储系统是一些硬盘的集合体,并且指定一些空间供所有硬盘共享使用。如果有硬盘出现故障,硬盘会从这些指定的空间开始自动重建。现在有两个厂家提供原地失败存储系统:Atrato Inc(产品是Velocity1000或者V1000)和Xiotech公司(Emprise 5000或者ISE)。这两家的产品都支持端到端错误检测和纠正,以及自动修复功能。

这两家产品的架构是以用户性能的可获得性为基础的,跟存储的FRU生命周期紧密结合。存储的生命周期是指存储设备空间可被应用程序识别的这段时间。整个存储的空间生命周期也包括共享的空间可以被访问的时间(Atrato是三年,Xiotech是五年)。

Atrato V1000 与 Xiotech Emprise 5000(ISE)

两款产品的差别反应了两个厂家的设计理念。Atrato使用企业级2.5英寸硬盘、端到端错误纠正和检测技术,具有自动修复功能、高密度、高智能防抖动和散热功能。3U的机箱内可以使用160个硬盘,容量高达80TB,单个控制器可以达到12500 IOPS、1.5GBps的带宽。

Xiotech使用的是稳定性更高的光纤或者SAS的3.5英寸及2.5英寸硬盘。单个3U的FRU可以容纳10个3.5英寸或者20个2.5英寸的光纤或者SAS硬盘,容量可以达到16TB,每个ISE都有两个可以移动的DataPacs、散热电源、长达96小时的备用电源以及active-active RAID控制器。

跟传统的存储系统不同,ISE DataPacs在减少震动和加速散热方面都采用了创新的方法,Xiotech优化了内部组件的结构使硬盘和整个系统更容易测控。 DataPac硬盘具有特殊的firmware,可以存储其他各个组件的压力信息。这个部件是DataPac的“超级盘”,可靠性是普通存储系统的100多倍。(Xiotech 208 ISE运行15个月的测试数据,包括5900个硬盘)

Atrato和Xiotech证明了原地失败的可行性。它们的产品测试表明这些技术可以减少硬盘替换的服务次数,这样可以降低成本,而且数据丢失和程序中断的概率也会大幅降低。

相关推荐

  • 维护手册:SATA磁盘故障分步检测法

    本文会介绍一套检测SATA磁盘故障的最佳流程。性能方面SATA磁盘驱动器与高速的并行ATA磁盘驱动器相差不了多少,建议用户在安装或检测SATA磁盘时,不妨参照以下步骤进行……

  • 阵列双保险—RAID 6技术简介

    RAID 6随着大容量ATA硬盘的广泛采用引起了业界的重视,RAID 5是在存储系统中广泛采用的数据保护技术。RAID技术是为了防止存储系统因为磁盘故障而丢失数据而研发出来的。