2017年,请关注以下数据存储初创企业
羽翼未丰的软件供应商Alluxio Inc.正试图建立一个大数据存储的飞溅.
Alluxio是麻省理工学院和加州大学伯克利分校的研究人员开发的一个虚拟分布式存储层。该供应商(前身为Tachyon)声称其开源平台允许任何计算框架访问应用程序数据内存速度跨越不同的存储系统。
Alluxio将服务器空闲内存转换为存储容量处理Apache火花以及其他大数据工作负载。企业使用它从分布式计算框架上的高性能应用程序中提取更大的价值。
目标是另一种选择大数据架构到基于磁盘的批处理方法。Alluxio软件安装在计算层和底层存储之间,用于虚拟化文件和对象存储。在内存中生成柱状数据格式,以覆盖传统的批处理。
不同的存储系统在统一的命名空间下进行虚拟化。数据在内存中读写,热文件缓存在内存中,较不活跃的数据分层后端存储。
有两个版本可供选择:付费版Alluxio企业版和一个免费的Alluxio社区版。Enterprise Edition的定价基于节点数量,包括Kerberos身份验证和数据复制,以确保高可用性。
Alluxio不会跨集群复制文件存储。相反,对数据(和元数据)的更改将被记录并保留在内存中。这允许在主服务器停止工作时,未使用的处理器立即继承正在进行的计算。
Alluxio软件包括对象存储功能S3接口和迅速。除了Apache数据库,文件存储支持还包括Hadoop分布式文件系统/MapReduce和Red Hat GFS扩展NAS。
为了获得最佳性能,供应商建议将其软件安装在处理大数据作业的相同计算节点上。当额外的硬件节点加入计算集群时,系统可以向外扩展。