检查RAID卷的未来

最后更新日期:2014年3月

基本指南

浏览部分

编者按

自1987以来,数据存储行业利用了由加利福尼亚大学的科学家伯克利首先开发的一套策略。廉价磁盘冗余阵列,或突袭。它们用于构建大量从多个谨慎的磁盘驱动器和保护在硬件故障情况下保护存储在鹅卵石上的数据。如果您今天参与了数据存储,那么您很可能在至少部分基础架构中使用RAID卷。

有五个RAID类型(六,如果您在原始RAID白皮书中指定的所有突袭)。多年来,各种存储阵列供应商已添加一些其他方案。这些,raid 1(将一个磁盘上的数据镜像到另一个磁盘)和RAID 5(条纹使用分布式奇偶校验位)是最流行的。前者提供了数据的完整拷贝和简单的恢复机制(故障切换),而后者RAID 5提供了更经济的保护,同时加快了数据库和其他应用程序的读取访问。

RAID服务通过提供基本的最流行的操作系统(ISS)的软件提供软件RAID能力可选或嵌入在数组的控制器上。后一种方法通常是储存规划者优先(因为服务器正忙于执行其他应用程序级别的家务)和存储供应商(因为当RAID和其他增值功能嵌入在控制器上时,它们可以为一箱商品驱动器收取更多费用)。

尽管有两十年的成功,但两次发展已经开始称之为raid的效果。对于一件事,磁盘驱动器就容量变大。在RAID 5和其他的情况下raid水平使用分布式奇偶校验进行数据保护的大容量驱动器是一个挑战。RAID 5使驱动器集上的数据能够从中“重建”平价多磁盘卷中的单个驱动器丢失时的信息(使用RAID 6,供应商创建的扩展,两个驱动器可能会发生故障,奇偶校验数据可用于重建卷的原始内容)。重建所需的时间量RAID集与卷的容量成比例,因此包含卷的磁盘的聚合容量越大,重建将采用较长的时间。虽然发生这种恢复,但卷性能通常会显著减少。

RAID的另一个问题是它与驱动失败的频率相关联。2009年,两名工程师发表了一个报告在里面电气电子工程师学会计算机期刊(第58卷第3期,2009年3月)这表明磁盘故障率是这些供应商建议的5到1500倍。RAID 5卷中的第二个驱动器发生故障的可能性高于预期,即使正在采取措施更换第一个发生故障的驱动器并重建RAID卷。这一风险的增加引发了问题RAID 5和RAID 6的值,可以说是使用最广泛的两种RAID方案。

RAID漏洞的增加部分归因于一种被称为“无声腐败”的鲜为人知的现象位错误根据2008年的一份报告,由许多原因造成的结果是Usenix报告负责该研究中包含的39,000个存储阵列故障的5%至10%。位错误可能会影响单个文件,损坏它,以便无法使用它,或者它可能会影响随后渲染整个磁盘或卷的扇区无法读取的扇区。

RAID控制器提供了一些通过奇偶校验扫描检测位错误的能力,但大多数存储管理员没有使用此功能,因为它倾向于慢速度阵列的性能。出于同样的原因,文件系统验证循环和操作系统纠错码/循环冗余码校验也被关闭了。

拇指规则是每67个TB磁盘中至少存在一点错误。与部署Petabytes甚至储存的公司,数学是令人不安的。

那么,RAID死了吗?如果死了,用什么来取代它?这些是许多存储规划人员今天面临的问题,没有简单的答案。本RAID提示集旨在回答有关RAID及其替代技术的关键问题。

1.克服常见的RAID问题

RAID类型可以以多种不同的方式保护数据,但在阵列故障的情况下,所有这些都是void。不幸的是,RAID容易受到可能威胁整个阵列的多个驱动器故障。

2.使用新技术来支持突袭

根据Toigo,通过使用存储管理程序或其他软件虚拟化存储,可以立即通过多个数据保护技术遍布一系列数据。这有助于减少冗长的RAID重建时间,以及其他好处。

搜寻灾难恢复
搜寻数据备份
搜寻汇聚基础设施
接近
Baidu