定义

Hadoop即服务(HaaS)

Hadoop即服务(HaaS),也称为云中的Hadoop大数据分析框架存储和分析数据的使用Hadoop。用户不需要投资或安装额外的基础设施在使用该技术的前提下,由于HaaS由a第三方供应商。

Hadoop是否有一个软件框架用于管理数据和存储大数据集群系统中的应用。Hadoop为用户提供了收集、处理和分析数据的能力。HaaS努力为云用户提供同样的体验。HaaS对于没有基础设施或没有能力在前提上托管Hadoop的中型和大型组织非常有用。

开源的Hadoop大数据分析框架允许非组织性数据要分析的集合。Hadoop的存储机制Hadoop分布式文件系统,将这些工作负载分布到多个节点所以它们可以并行处理.Hadoop作为服务提供商的集成专有的程序与Hadoop框架,使组织更容易使用,通常包括管理和支持功能。大多数HaaS产品都是基于云计算的,定价通常是基于per-集群,每小时的基础。

特性

HaaS供应商提供了各种特性和支持,包括:

  • Hadoop框架部署支持。
  • Hadoop集群管理。
  • 选择编程语言。
  • 集群之间的数据传输。
  • 可定制和用户友好的仪表板和数据操作。
  • 安全特性。

这是VMware的Andrew Nelson的视频
以及Adobe公司的克里斯·穆切勒
2014 Hadoop峰会讨论了一些
的操作和技术效益
Hadoop作为一种服务。

优点和缺点

运行HaaS可以实现优势和劣势的平衡。HaaS的优点包括:

  • 无需部署额外的物理硬件基础设施。
  • 广泛的数据来源可以使用-包括点击流数据或电子邮件。
  • 支持功能包括欺诈检测,数据仓库或自动复制数据以防数据丢失。
  • 种子,在这样的情况下,处理数据的工具被使用在数据所在的相同服务器上,从而提高数据处理速度。

然而,缺点包括:

  • Hadoop开源编程语言需要一套特殊的技能,许多组织内部没有或者负担不起。
  • 精通Hadoop的熟练工程师是很难找到的。
  • Hadoop安全措施默认禁用。
  • 只有中型到大型组织才能有效地利用HaaS

HaaS的一个优点和缺点是HaaS提供商在其平台上提供的服务。HaaS提供商可以提供各种各样的特性,其中可能只包括Hadoop软件或其他特性,例如虚拟机.对于那些想要精确地根据自己的需要和提供者提供的内容来选择提供者的组织来说,这种真实性可能很有用,但对于刚刚开始考虑HaaS的组织来说,这可能一开始就令人困惑。

HaaS提供商和提供的特性

亚马逊是Hadoop作为服务的第一个主要供应商。目前市场上的其他供应商包括:

  • Amazon Elastic MapReduce。
  • 微软HDInsight。
  • IBM InfoSphere BigInsights还。
  • Oracle大数据发现工具。
  • OpenStack稀树大草原。
  • 谷歌云Dataproc。

在HaaS提供商中查找的特性包括:

  • 数据应该永久存储在HDFS。这避免了将存储在其他格式的数据转换到HDFS的问题。
  • 弹性以适应各种各样的工作负载
  • 恢复能力处理如果没有重新启动整个过程(称为不间断操作).
  • 一个自配置的环境,允许自动配置基于工作负载。
这是最近更新的2019年6月

关于Hadoop作为服务(HaaS)

深入挖掘大数据存储

搜索灾难复苏
搜索数据备份
搜索聚合基础设施
关闭
Baidu