业务连续性的五项数据保护准则
存储专家Jon Toigo提供数据保护指南,以帮助存储管理员在保健中保护数据时达到最佳结果。
在他对效益最大化的最佳秘诀五部分组成的系列的第三部分,乔恩·威廉·托戈涵盖数据保护准则,包括镜像,磁带备份和基于WAN的复制技术。
在管理存储性能和容量的同时,数据存储管理员通常需要设计保护他们负责的数据的方法。在过去,这只是将输出数据复制到一个或多个存储媒体目标- 到凸起地板上的另一个阵列(防止局部设备故障)和/或可移动介质随后在广域网(WAN)连接的另一端运输或者在磁盘的另一端运输(以更广泛的地理占地面积防范中断事件)。
然而,随着业务生成的数据量随着时间的推移而生长,并且用于存储数据的数量增加,建立和遵循一套数据保护指南的简单问题变得更加复杂,具有挑战性和昂贵。
数据保护效率是衡量管理人员如何处理迅速增长的数据保护的指标:分配适当的数据保护方法要位,测试和验证的数据保护技术的偿付能力,并在预算精明的方式提供“深度防御”。这里有五个实现更高数据保护的指南效率结果。
数据保护指南1:丢失“磁带吸”的保险杠贴纸。
你必须生活在岩石下,没有听到“磁带已经死了”阵列供应商的音高。自20世纪90年代末以来,磁盘阵列制造商已经发动了巨大的营销活动,以促进以磁盘为中心的胶带替代品重复数据删除虚拟磁带设备似乎已经成功地塑造买方的看法和策略。
见证行业分析师的最新报告:到2011年部署的外部磁盘存储超过20个艾字节的,正在使用将近一半的容量,使另一半的副本。在许多公司中,局域网(LAN)为基础的镜像已经被基于WAN的数据复制增强,完全基于磁盘的数据保护方法吹捧由阵列厂商的米姆在21数据保护圣世纪。
阅读整个Toigo Tip系列上的存储效率
提示高效磁盘容量分配
删除这些无用的数据产能利用率的技术
数据存储技术绿色数据中心
如何解决存储性能问题
而阵列到阵列镜像和复制可以是适合作为数据保护方法对于某些数据,这绝不是适用于所有数据的明智策略。这个观点来源于一个基本观点:数据从它所支持的应用程序和最终用户的业务流程继承了它的关键性。并非所有业务流程都需要基于故障转移的“始终启动”恢复策略,这往往是最昂贵的恢复方法。基于wan的镜像“可能”可以很好地服务于那些这样做的人,但即使这样也不能完全解决数据保护问题(见下文)。
相比之下,磁带备份提供保护的,不需要应用程序数据“永远在线”服务的有效手段。从磁带恢复的数据可能需要比应用到替代的基于磁盘的存储简单的重新指向更多的时间,但它基本上不太昂贵并且在许多情况下,更可靠。智能数据存储管理员在简单认识到年度磁盘故障率估计为每年7%和14%之间进行镜像阵列的磁带备份。数据保护通常需要的技术组合。
数据保护指南2:获得基于WAN的复制的真实。
基于广域网的磁盘到磁盘复制只有当它不创建数据的增量的有效策略,避免恢复时间目标(RTO)和恢复点目标(RPO)。的Δ - 或差 - 中的数据的状态在生产数据中心和其在每当数据横梁共享网络管比18公里大的恢复数据中心的结果镜。
这部分与距离引起的延迟有关——跨WAN连接推送数据的速度有多快。据估计,在SONET链路上每100公里(62英里)的数据移动,远程阵列落后于主阵列大约12个SCSI操作。这只是一个光速的问题,我们不能和爱因斯坦争论。
添加到由距离产生的时延的增量是的影响“抖动”,延迟该结果从使用共享网络服务。根据你的主,备份设施的位置,抖动的影响可以说是微乎其微或深刻。尽管WAN管道的名义或额定速度,一个位于加利福尼亚州萨克拉门托,该公司正在寻求将数据复制到在硅谷地区另一个网站报道,传输速度和进给从几秒钟到几个小时的不可预测性 - 功能通过网络与9个不同运营商的路由。
底线:广域网服务标称额定速度是没有意义的。从处理延迟和路由协议有关的一切变量,来缓冲膨胀和包重发可能会影响运输效率。即使有硬币买得起OC-192管材需求的公司明白,最少两小时将需要移动10 TB。这就是为什么在距离移动数据最快的方式继续使用信鸽(谷歌“IP对禽流运营商”以获取更多信息)的。
重复数据删除数据可以在减少需要移动WAN链路的数据量时有效使用,但它不会在信息高速公路的Gridlocked动脉上更快地移动流量。
数据保护指南3:镜子难以测试。
无论您是在广域网上复制数据还是在局域网上镜像数据,这些数据保护方案所固有的另一个挑战是它们对特别测试的阻碍。测试是长尾成本灾难恢复计划,因此管理员应该通过在全年中启用数据保护方案的特别测试来减少年度测试事件中的工作负载。
如果你正在寻找验证故障转移是可能的镜像配置,你需要“破坏”镜像进程并检查主要和备份数据存储的内容。在一个LAN中,这通常是一个痛苦的过程,需要(1)生产应用程序停止或暂时重定向;(2)将所有缓存数据写入连续性卷(被复制的磁盘);(3)此数据完全复制到远程磁盘;(4)镜像过程本身被停止。然后在主站点的内容和恢复站点卷之间执行(5)比较以确定它们之间的差异。所有虽然(6a)来自应用程序的新数据(如果尚未停止)必须缓冲,并且(6b)重新建立镜像连接时,必须重新同步(7)数据存储。
与此进程相关联的困难有助于解释为什么它很少进行。而未经检验的镜子是一种职业限制的恢复问题等待发生。
数据保护指南4:没有钱,就没有巴克罗杰斯。
作为实际问题,镜像和WAN复制很昂贵。阵列供应商似乎通过将可能的镜像关系限制为仅两(或三个)相同的数组,所有阵列供应商似乎都在围绕其齿轮创建锁定件。在异构存储基础架构中,这引入了从解决和布线“匹配对”的钻机的“匹配对”的复杂性,以监视和管理基础架构和数据放置随时间的变化。
它还提高了数据保护的成本。例如,在一个流行的虚拟磁带设备上嵌入专有的重复数据删除和复制软件已经产生了32 TB的3110,000美元的采集价格,价值约为4,000美元。要复制此设备,需要第二个相同系统的副本。增加了WAN链接的成本,需要永久和固定恢复设施托管目标系统,并释放已故的参议员。埃弗里特德克伦,“很快,你就是谈论真钱。”
这说明了镜像和基于wan的复制并不是数据保护的全部原因的另一个实际原因:高成本。为了实现数据保护效率,成本需要与提供的保护措施和数据本身的关键程度成可接受的比例。掌握着钱袋子的高级管理层需要看到这个比例,并清楚地平衡它,否则资金可能会被拒绝。
数据保护指导原则5:想想“深度防御”。
说实话,当代的数据保护指南需要深入防御。必须保护数据,防止由于应用程序/用户错误和恶意软件/病毒攻击而导致的损坏或丢失。然后,就像同心圆一样,需要防御机器故障(谷歌“2011年弗吉尼亚联邦存储阵列故障”)和设施中断或中断。
这三层数据防御可能由三种截然不同的技术提供,所有这些技术都必须是可管理的,并在理想情况下利用全年的特别测试。只有将数据保护服务从硬件转移到公共存储虚拟化层才能合理地实现这个目标。
虚拟化存储基础设施允许您创建数据复制和镜像层,而不受硬件供应商锁定的阻碍,从而降低成本并提高可管理性。一个好的存储虚拟化引擎还可以根据应用程序数据及其服务的业务流程的需求和关键度,选择性地将数据保护服务分配给应用程序数据。
最后的想法:无论您选择哪种“存储管理程序”,都应该确保它也能使您将磁带集成到整个解决方案中。还记得索尼的旧广告吗:“有两种磁盘:已经失效的和即将失效的。”集成和管理多种保护技术是提高数据保护效率的关键。
关于作者:
Jon William Toigo.是一个30年代的资深,首席执行官和Toigo Partners International的校长,以及数据管理学院主席。