RAID6与RAID5数据安全性对比(一)

日期: 2007-12-09 来源:TechTarget中国

  磁盘阵列(disk array)可以有效的提高存储系统的可靠性和性能,同时也存在显著的缺点,那就是由于多个设备(磁盘)同时使用,导致了可靠性降低(从概率的角度来讲:N个设备的可靠性是一个设备的1/N)。

  RAID(Redundant array of inexpensive disk)就是为了解决这个问题而产生的,RAID通过给磁盘阵列增加冗余磁盘提高了磁盘阵列的可靠性。所谓冗余磁盘,即该磁盘不用于存放实际数据,而用来存放一些冗余信息,而这些冗余信息可用来在必要的时候进行有效数据恢复,从而增加磁盘阵列的可靠性,翻译成中文应该叫廉价磁盘冗余阵列。

  在RAID6出现之前,RAID已经有了从RAID0~RAID5六个版本。那么我们已经有了这么多的RAID方式,提供了相当级别的可靠性保护,为什么我们还需要RAID6?在这里,我们这里先比较研究一下几种比较有代表性的RAID方式:

  磁盘冗余家族概览

  目前应用最广泛,支持设备最多的RAID方式主要是RAID0,RAID1和RAID5

  (1)无冗余(RAID0):RAID0实际上不能算做真正的RAID技术,它只是实现了磁盘阵列存放数据的带状分布。虽然提高了大规模数据访问的性能,但是RAID0并没有冗余容错的功能,因为它本身并无冗余,所以可以说这里的RAID0是个误称

  (2)镜像(RAID1):RAID1同样实现了数据的带状分布,与RAID0所不同的是,在数据写入一个磁盘的时候,同时在另一个磁盘做相应的镜象。因此,RAID1虽然有数据容错功能,但是其对磁盘的利用率实在比较底,仅为50%。
数据分布示意图(以4块磁盘组成的阵列为例):

镜像(RAID1)

  注释:其中d1,d2等表示存放的数据,d1’, d2’分别表示了数据d1和d2的备份。

  (3)奇偶校验(RAID5):相对于RAID1比较,RAID5也是仅仅实现了单个磁盘的冗余纠错功能,但是却大大提高了磁盘的有效利用率。以RAID5(4D+P)为例子来讲,使用4块磁盘存放数据位,使用1块磁盘存放校验位。其基本原理是这样的:根据条带化的数据4D(使用四位数据)生成一位的校验信息,存放在第五块磁盘中。

  生成P校验位的公式一般是这样的:
  P = D1 ⊕ D2 ⊕ D3 ⊕ D4
  P为校验位,D1~D4分别代表四个数据位,⊕表示异或操作。
  可以看到,当D1,D2,D3,D4中其余的一个数据丢失的时候,可以利用其余的三个数据位和校验位P进行恢复,具体的恢复公式如下:
  例如,当D1丢失的时候,D1 = D2 ⊕ D3 ⊕ D4 ⊕ P
  同时可以看到,当两快磁盘出现故障的时候,RAID5无法恢复。
  数据分示意布图(以4D+1P为例):

数据分示意布图

  其中,P1为数据位d0,d1,d2,d3的校验信息,P2为数据位d4,d5,d6,d7的校验信息等等。可以看到,校验信息并非存放在一块固定的磁盘上的,而是存放在不同的磁盘的,这样可以平衡各个磁盘的读写次数,从而平衡各个磁盘的使用频率(因为校验位的读写要相对频繁一点)。

  RAID6:突破磁盘冗余局限

  RAID5已经提供了一定程度的可靠性,然而也牺牲了一定的读取速度。特别是在RAID重构作业中,大量的数据读写操作增加硬盘的负担,旧的硬盘更容易发生故障。RAID5的局限性还表现在RAID5仅能在一块硬盘发生故障的情况下修复数据,如果2块硬盘同时发生故障,RAID5则无能为力。

  以前,两块盘同时坏的情况是小概率事件,几乎不可能发生。但是近来随着光纤(FC)盘和SATA盘的容量和密度不断增加,使得RAID 5的重建时间也不断增加。两块硬盘同时损坏的概率也大幅增加,在企业级存储上,这种风险必须得到重视。所以RAID6应需诞生了。

  RAID6同RAID5最大的区别就是在RAID5的基础上除了具有P校验位以外,还加入了第2个校验位Q位。以RAID6(6D+1P+1Q)为例子,这个系统需要8块硬盘,其中6块用于存放数据,1块用于存放P校验位,1块用于存放Q校验位。当然,我得又一次强调,并非某个具体的独立的盘全部用来存放P校验信息,另外一个Q校验信息。而是对于某个位组(6个数据位+P位+Q位)来说,采用某种原则,6块盘上存放数据位,1块盘存放P位,1块盘用来存放Q位。

  其数学原理如下:
  校验位的生成:
  P = D1 ⊕ D2 ⊕ D3 ⊕ D4 ⊕ D5 ⊕ D6
  Q = GF(D1) ⊕ GF(D2) ⊕ GF(D3) ⊕ GF(D4) ⊕ GF(D5) ⊕ GF(D6)
  D1~D6:条带化的数据
  P:P校验位
  Q:Q校验位
  ⊕:异或操作
  GF(D1):对D1位进行Galois Field变换。

  当一块磁盘出现数据错误或者丢失的时候,恢复方法同RAID5,无须使用Q校验位。当两块磁盘上的数据出现错误或者丢失的时候,恢复方法为:利用上边给出的P,Q的生成公式,联立方程组,无论受损的数据是否包括P或者Q,总是能够解出损失的两位的数据。数据分布示意图(以6D+P+Q位例):

数据分布示意图(以6D+P+Q位例)

  同样可以看到,每个位组(6D+1P+1Q)的P,Q位是位于不同的磁盘上的。

相关文章:RAID6与RAID5数据安全性对比(一)     RAID6与RAID5数据安全性对比(二)

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 存储经理人2017年11月刊:如何选择正确的DRaaS供应商

    《存储经理人》2017年11月刊重点介绍如何选择正确的DRaaS提供商:DRaaS供应商应当具备四项关键技能,以能够全方位应对所有潜在灾害。本期杂志还介绍了下一代线性磁带开放标准LTO-8,云中数据存储的注意事项以及驱动企业采用云存储的主要因素,同时阐述了冷存储需求不断高涨以及二级存储的现代化转型等现状,提醒大家在文件同步和共享时应确保数据安全,以及如何为未来的闪存做好准备。

  • 存储经理人2017年4月刊:闪存、云位列Top数据存储选项

    《存储经理人》2017年4月刊重点关注主存储选项:在数据存储可选项中,云和闪存逐渐成为主数据存储。另外,由于内嵌了越来越多面向数据密集型商业应用的业务分析功能,存储系统正在变得越来越聪明。本期《存储经理人》还关注更多存储趋势,包括超融合架构,横向扩展SDS等等。

  • 执行自助恢复服务之前

    数据文件的自动恢复服务今天正逐步走进一些备份应用程序中。这会是一个很有用的功能,因为它允许最终用户恢复数据而不必等待服务台的帮助。同时,服务台也不再被恢复文件的请求所淹没。为了使自助恢复服务更加有效,在允许用户恢复自己的数据之前考虑一些最佳实践是非常重要的。

  • 磁带是安全归档的最佳选择吗?

    什么能够提供最佳的归档安全:磁带,磁盘或者是云?从安全的角度出发,不存在任何一种归档技术会大大优于其他的技术。