- 与您的网络分享此项目:
- 下载
存储
Pavel Losevsky - Fotolia
制定企业数据归档策略的四条规则
遵循这四条规则重新设计数据归档系统,使其逐步提高,保持数据从主存储流到归档,并使每个人都满意。
现实不容忽视。在大多数数据中心,80%或更多的存储数据已经超过一年没有被访问。如果缩短时间,我们会发现95%的数据在过去90天内没有被访问过。这意味着,绝大多数数据都存储在你购买的用于传输活动数据的昂贵而快速的闪存阵列上。
问题是大多数IT专业人员对于采取激进的步骤犹豫不决,比如将他们95%的数据转移到二级存储层.但事实是,通过适当的设计,IT可以在很少抱怨的情况下达到这个目标。这里有四条基本规则可以帮助你走上成功之路:
规则1:归档响应几乎可以和主响应一样快
您的企业数据归档策略应该依赖使用高容量hdd的存储,并借助重复数据删除和压缩,以尽可能降低归档存储层的成本。虽然所有这些技术都可能影响数据召回性能,但在大多数情况下,从一个设计合理的活动档案几乎和主存储器一样快。
这是因为主存储每秒响应数百(如果不是数十万)的召回请求,而归档通常每小时响应一到两个请求。与访问旧数据相比,归档文件在处理入站写入流量时通常更忙。响应的I/ o更少,基于磁盘的文件存储可以响应单个请求几乎与主存储一样快。但是请注意,归档不必响应得像主存储那样快,它们只需响应得足够快,用户就不会注意到差异。
规则二:不要在第一天就把所有东西存档
她有充分的理由对一切都产生了不信任。归档软件供应商,特别是硬件供应商吹嘘roi显示企业数据归档策略投资在安装后30秒就能收回成本。问题是,要获得如此快速的ROI,客户必须购买100 TB的归档或辅助存储,并在归档平台建立后立即移动80%到95%的数据。任何值得获得认证的IT专业人士都不会这么做。这是没有必要的。存储所有这些旧数据的主存储都是花钱买来的,大多数供应商都不会让你为了退款而退回存储阵列的一半。
更合乎逻辑的企业数据归档策略是根据需要对数据进行归档——通常情况下,当那些主要系统不再进行维护时,它们的寿命已经结束,或者已经满到必须购买更多容量或另一个主要存储系统的地步。您想知道该数组中有多少数据可以被归档。有了这些信息,你就应该买这么多从您的存档供应商存储,可以推迟购买主用存储系统或运行规模小得多的高性能存储系统。有了存档策略,购买更多主存储的唯一原因是获得性能,而不是容量。
规则3:透明的召回可能是关键,也可能不是
如果采用积极的企业数据归档策略(例如归档80%的主存储),那么就要为用户更频繁的数据召回做好准备。考虑到逐步移动到存档存储然而,根据规则2的描述,召回可能不会像你预期的那样频繁。
首先,确保大多数召回都能在没有IT中断的情况下发生。这意味着您需要选择能够在文件过去所在位置和存档位置之间设置透明链接的软件。同样重要的是要记住归档可能是多步骤的、本地磁盘到磁带或本地磁盘盘到云,这意味着每次文件移动到另一个存储设备时,这些链接必须用文件位置更新。
透明召回的另一方面是在体系结构中设置一个具有存根文件或中央元数据控制层的设备。与任何设备一样,这个控制层也有一定的刚性,包括存根文件的潜在管理问题和对数据管理供应商的一定程度的锁定。你必须决定,透明召回带来的负面影响是否值得带来正面影响。
规则4:期待更频繁的召回
如果您的组织全力采用95%的数据归档策略,或发展到这一点,那么请做好更多召回的准备。由于缺少透明的召回组件,无论召回是透明的还是手动的,您现在都可以每小时测量几十次。回忆率越高,你就越想要基于磁盘的文件,或独家或作为前端磁带。
如果大多数归档文件是基于磁盘的,那么高的召回率不应该影响性能。至少,归档的前端应该是基于磁盘或云的。如果要使用磁带,则应该作为深层归档文件或仅作为归档文件的备份。虽然磁带是一种健壮可靠的技术,但随着数据归档系统变得更加活跃,磁带在数据归档系统中的作用需要更多的规划。
不要遵循数据归档策略
毫无疑问,您的95%的数据可能符合归档条件。归档不应该被看作是一种经常做的储存饮食。相反,它是一种逐渐发生的组织变革,一旦完全实施,就不会停止。数据应该不断地在企业中从主存储流到归档存储,偶尔也会流回主存储。
下一个步骤
利用闪光灯更好的辅助数据存储
如何使用磁带高效的数据归档系统
五个方法将数据移动到云归档
相关资源
- 为不断增长的数据集创建数据归档过程-SearchDataBackup.com