元数据在非结构化数据管理中的作用是什么?
了解如何扩展组织对元数据的使用,以改进非结构化数据的管理和存储,使其更具组织性和可访问性。
在某种程度上,大多数存储系统使用元数据——所有关于数据的数据。对于基于文件的存储系统,如基于NFS和SMB的存储系统,与文件关联的文件名、创建日期、修改日期和用户ID被视为元数据。此信息用于帮助用户定位文件,并了解文件是何时创建和更新的。
对象存储系统将元数据的角色提升到一个新的水平,改进非结构化数据管理。基于文件的存储系统具有以文件夹为中心的层次结构中存在的明确命名的文件,而对象存储系统是平面实体,其中可能存在数千万到数千万个对象。这些对象可以是图像、物联网设备事件日志和组织中存在的所有非结构化数据。
如果没有元数据,对象系统中关于底层对象的任何描述符都将丢失。从这个角度来看,元数据的作用是关键的。
但它远不止于此。在现代的对象存储系统中,组织可以使用元数据改进非结构化数据管理和存储。事实上,元数据被用于改进存储虚拟化、服务、治理策略实施和最终用户分析工作。
元数据和Microsoft Word文档的角色
虽然元数据驱动对象存储,但这并不意味着没有办法改进元数据用于非结构化数据管理的方式。考虑元数据的作用和简单的Microsoft Word文档.每个文档都有几十个可以完成的元数据字段,包括用户名、编辑器名、配置和文档ID。
您还可以创建自定义字段.这些是关于Word文档的元数据字段。在许多组织中,很少使用这些字段,但它们对于以后定位信息可能很有用,特别是因为您可以添加自定义字段。
这同样适用于所有类型的非结构化对象在存储环境中保存。确定您所存储、查找的常见数据类型元数据的机会并利用它来帮助提供更好的整体非结构化数据管理在存储环境中。