3 dmentat - Fotolia

新闻 了解最新的企业技术新闻和产品更新。

对COVID-19的研究促使IHME在Qumulo存储中升级到18 TB hdd

西雅图健康指标和评估研究所选择在Qumulo混合存储设备中安装18 TB hdp,以处理通过COVID-19研究产生的大量数据集。

美国卫生指标和评估研究所(Institute for Health Metrics and Evaluation)的COVID-19研究面临着挑战,这在使用大量数据集的非营利组织中并不罕见。

总部位于西雅图的IHME知道,它需要增加存储容量——在它的情况下,通过Qumulo电器——处理更多拍字节的数据。但该研究所还必须确保性能足够,成本得到控制,并将其对华盛顿大学(University of Washington)数据中心足迹的影响降至最低。

IHME的IT、基础设施和DevOps主管Serkan Yalcin说:“我们的空间有限,所以我们必须最大限度地增加机架的容量。”

总部设在大学医学院,由拨款资助,健康指标分析世界范围内的健康数据,并提供免费的预测和工具,以帮助政府、医院系统和决策者就资源分配作出决定。IHME对300多种疾病和风险因素进行研究,2020年,COVID-19大流行自然成为重点领域,而其其他项目仍在继续。

COVID-19研究增加了数据负荷

雅尔辛估计,COVID-19研究为该研究所本已繁重的工作量增加了10%至15%的数据。IHME从外部来源获取原始数据,并生成更多数据,因为它根据最好和最坏的情况创建模型和可视化。一个在世界范围内得到广泛应用的例子是,卫生评估和评估所预测的COVID-19死亡人数取决于佩戴口罩的人口比例。

Serkan Yalcin,卫生指标和评估研究所IT、基础设施和DevOps主任Serkan Yalcin

当Yalcin在2010年加入IHME时,该研究所的存储系统有大约5tb的数据。Yalcin表示,自去年夏天以来,IHME至少生成了500 TB严格与covid -19相关的数据,随着时间的过去,它通常会生成比前一个月更多的数据。

IHME从2014年开始使用Qumulo的扩展文件存储,当时它从量子的StorNext当时的存储容量几乎每六个月就翻一番。Yalcin表示,Qumulo在监控和管理数十亿文件方面具有优势。他可以点击一个文件夹,在几秒钟内就能看到源代码、文件数量、容量和过去72小时或30天的使用趋势。

“在这一点上,我从来没有见过任何文件系统能像Qumulo那样给你这么多的洞察力,”Yalcin说。他于2015年8月离开IHME,在Qumulo担任了8个月的客户成功经理。雅尔钦在计算机软件公司Maana担任客户支持和IT主管后,于2017年回到hme。

去年,随着数据负载的不断增加,IHME联系了Qumulo,以了解一种新平台的最新选择,该平台可以在每个机架上装载最多的数据,并提供它所能提供的最佳性能。Qumulo卖两all-NVMe flash系统以及结合了固态硬盘(ssd)和更便宜的硬盘(hdd)的混合机型。

健康指标和评估研究所
COVID-19研究一直是卫生计量和评估研究所的一个关键重点领域。

全闪光对hme来说并不经济

尽管闪存SSD的价格已经随着最新的版本而下降四电平单元(QLC) 3D NANDYalcin表示,与混合动力模型相比,全闪光系统对IHME来说没有经济意义,因为研究所从这项工作中没有收入。

Qumulo的混合动力系统据该公司负责产品管理的副总裁吉滕斯坦(Ben Gitenstein)说,该系统的售价约为能效更高的全闪存系统的三分之一。

因此,IHME选择了具有432 TB原始存储容量的Qumulo C-432T混合平台,使用基于nvme的3.2 TB ssd在西部数据最大可用的18 TB hdd之前缓存数据。数据首先放在NVMe ssd上,而最热门的数据则保存在闪存驱动器上以加快访问速度。较冷的数据会转到较慢的hdd上。

混合动力系统性能

Gitenstein说,Qumulo的混合系统提供了与全闪存机型相当的性能,90%到95%的数据读取通常来自于闪存缓存.但他表示,客户需要考虑混合系统可能不会从闪存缓存读取数据,而是提供磁盘性能的风险。

雅尔辛表示,瞿慕罗的设备满足了学校的性能需求。他说,IHME通过四个较旧的Qumulo机架实现了100万IOPS,现在通过一个新的C-432T节点机架获得了相同的性能。这就节省了成本,因为IHME从学校租了架子。

该研究所的新12节点Qumulo集群配备了西部数据公司的Ultrastar DC HC55018结核病hdd和Ultrastar DC SN640 3.2 TB NVMe ssd提供了显著的密度提高,比其老系统。该研究所的24节点和14节点Qumulo集群使用8tb hdd和480gb ssd。IHME还拥有一个15节点集群(10tb hdd和480gb ssd),以及一个较小的8节点集群(2tb NVMe ssd),用于缓存容器映像、代码和临时文件。

IHME管理着大学数据中心的42个机架:80%用于高性能计算,20%用于存储。Yalcin说,三个新的Qumulo架的增加使IHME增加了5 PB的可用存储容量。

“很明显,我们对存储空间的需求永远不会消失。现在我们仅从库木罗就有近9pb的可用存储空间,我们利用了其中的80%。”“他们是我们在该领域增长和成功的重要组成部分。我们的合作是为了拥有一个统一的平台来管理数据并减轻痛苦。”

深入挖掘混合闪存阵列

搜索灾难复苏
搜索数据备份
搜索聚合基础设施
关闭
Baidu