Sergey Nivens - Fotolia

日立内容智能搜索,分析数据

Hitachi Content Intelligence内置在Hitachi Content Portfolio对象存储中,从存储库中提取数据和元数据,对非结构化数据进行数据分析。

日立数据系统公司(Hitachi Data Systems Corp.)为其基于对象的日立内容组合(Hitachi content Portfolio)设计了一种高级内容搜索和分析功能。

Hitachi Content Intelligence从存储库中提取数据和元数据,对非结构化数据进行数据分析。该软件内置在日立内容组合(HCP),并构建为集群架构上码头工人容器技术.IT管理员可以将其部署在裸金属系统、虚拟环境或公共云中。Content Intelligence需要64位的Linux版本Docker 1.10,并且是在开源集群管理器上设计的Apache便。

总部位于加州圣克拉拉的HDS内容智能产品营销高级总监斯科特·贝克(Scott Baker)表示:“日立在市场上拥有强大的对象存储解决方案已经很长时间了。”“我们真正需要的是一个能够理解数据的解决方案。这个想法是为了打破数据竖井,连接到选定的数据源,比如Amazon S3 [Simple Storage Service]或Microsoft Azure或文件系统内部。”

贝克说智能引擎的运作内容提取对象存储文件系统元数据或元数据通过特定的连接器,然后加载信息通过提取、转换和加载管道了解各种数据的特点,所以它可以放置在一个索引或搬到HCP库数据迁移。

贝克说:“对数据进行分析有很多步骤。”“内容智能能够理解文件,然后对其进行分类,比如zip文件、PDF文件或视频文件。我们应用不同类型的自定义数据,比如社会安全号码的模式匹配或寻找不同的数据格式。”

其思想是将组织数据集中起来,并将其转换为有价值的相关业务信息。该工具自动提取、分类和组织中不同部门或级别的数据分类。

史蒂文·希尔451 Research的存储技术高级分析师表示,这种类型的内容智能技术是对象存储和更复杂和粒度数据分析的元数据的进化。

“我相信元数据的使用是长期数据管理的关键,”Hill说。元数据或多或少是包含作为存储环境一部分的数据本身的详细信息的数据库条目。这些条目可用于建立处理该数据的策略,而传统文件和块系统无法做到这一点。

“元数据可以被用作挖掘、管理和移动数据的工具,无论数据位于何处。而日立内容智能平台就是建立良好的元数据,帮助客户弄清楚元数据如何帮助实现他们的业务和IT目标。”

日立内容智能有多达36种方法来分析数据,并为模式匹配创建定制的元数据子集。客户可以为特定数据集编写自己的自定义阶段,或者从特定数据源提取信息,用于合规或医疗记录等领域。HCP搜索引擎允许用户根据查询提取信息,选择转换和加载过程中要排序的文件。

“一旦定义了连接器,工作流就被设计为拖放式。您还可以测试流程管道如何影响将最终出现在索引中的内容或将与HCP迁移的文档相关联的内容,”Baker说。“这让你可以看到定义为用户将从中受益的一般结果的过程。”

贝克表示,该软件工具还可以让管理员进行测试,以确保根据特定的查询提取和加载正确类型的内容。

下一个步骤

对象存储的用例是什么?

比较对象存储vs.文件存储云应用程序

如何使用SSD flash与对象存储

深入了解云存储管理和标准

搜索灾难复苏
搜索数据备份
搜索聚合基础设施
关闭
Baidu