帖子

Hyperscale的挑战:Hyperscalers关心什么

以下是一些关于在超规模部署时可能出现的问题的见解，以及超规模者认为有价值的东西。

通过

Ross Stenfort、Lee Prewitt和Paul Kaler客座撰稿人

发表:2021年2月04

下载这个演讲:Hyperscale的挑战:Hyperscalers关心什么

00:07罗斯Stenfort:好了，欢迎来到今天的讲座。今天是超尺度镜头闪光。我是脸书的罗斯·斯坦福德。我们还有微软的Lee Prewitt和惠普的Paul Kaler。那么，我们就从这里开始吧?

00时35分让我们谈谈Facebook和它的使命。Facebook的使命是赋予人们建立社区的力量，让世界更紧密地联系在一起。今天，我们有10亿人使用Instagram, 13亿人使用Messenger;目前共有31亿人在使用Facebook产品。

在这里，您可以看到来自一个数据中心的一个通道，在这里您可以看到许多经过优化的硬件，以便在用户使用我们的应用程序时为他们提供最佳体验。这里您可以看到我们的数据中心的图片。每一个都大约有四个足球场长，并拥有大量硬件，使我们能够满足用户的需求。说完，让我把它传给李。

01:30李·普雷维特：大家早上好。我是微软的Lee Prewitt。我想谈一谈微软的使命宣言:让这个星球上的每一个人和每一个组织都能取得更多的成就。所以下一张。

这篇文章是

闪存峰会2020年会议从第一天开始

所以，Ross谈到了Facebook及其数据中心的规模。微软Azure也有相当大的全球规模。你可以谈论我们铺设的光纤数量、背景、主干网和传输的数据量、Azure拥有集群的不同区域、数据中心集群（它们现在超过100个），当然还有数以百万计的服务器。下一张幻灯片。

02:23 LP:因此，微软正在做的一件事是，因为所有这些数据中心都有巨大的生态足迹，我们正在研究如何减轻这种影响，以及使服务更接近使用它们的人。有了这个，我们做了一个这个项目叫做Natick在那里，我们用大钢管，把里面装满服务器，然后把它沉到海里。数据中心在一个管子里…Oop。后一点。在那里。等一等。是的。

03:00 LP:所以，我们把数据中心沉入大海，我们可以使用这个数据中心大约两年，多一点。我们最近把它拉了回来，看看那里发生了什么。我们发现我们能够，在干燥的氮气环境下没有人干扰这些服务器，数据中心管道内组件的故障率只有陆地上的1/8。这应该会让你们知道我们接下来要讲的内容。所以,下一张。下一部分是大规模部署的挑战，罗斯，把它拿走。

03:48 RS:谢谢你,李。所以，让我们谈谈我们的一些形式因素的挑战和需求与趋势。在左边，你会看到超大规模的需求，每tb的IOPS首先需要线性增长。因此，随着容量的增长，性能也需要线性增长。低风量是保证数据中心风量充足的关键。可服务性对我们来说真的很重要，解决方案需要适应未来。在右边，如果你看一下市场趋势M.2无法将每tb的IOPS扩展到2tb以上，由于功率和性能的限制。nand正在变得更大，从而产生更大容量的驱动器。PCIe Gen 4.0和Gen 5.0即将到来，这将增加功率。

因此，正如您在右侧表格中看到的，随着容量的增加，设备所需的功率也会增加。然而，这并不都是坏消息。如果你看一下右边一栏中每TB的瓦特数，你会发现这个趋势实际上是下降的。

那么，这一切意味着什么？如果我们在这里得出结论，即每TB的IOPS规模，HyperScale将无法部署超过2 TB的M.2。随着容量的增加，设备功率预算将增加，每TB的瓦特数将减少，从而提高数据中心的效率。现在，李，如果你想谈谈闪光的形状因素。

05:27 LP:是的，如果M.2不能再切了，我们能做什么?大约在2年半或3年前，我们成立了EDSFF联盟，以探索转移到新形式的因素，这是专门为数据中心友好而设计的。这样，我们就可以为数据中心提出一些形式因素，包括E1。L，特别是e1, s。

有了这些，我们发现这些设备能够共享一个连接器，共享一个形状，共享设备的内部，然后在它们周围放置不同的封装以适应不同的电源外壳，这是非常强大的。这就是E1。S的形式允许多种功能，比如热插拔支持，在不同的IU中工作，特别是1U对于超大规模的人，而E3变体对企业的人工作得非常好。那里我们有一个路径到第4.0代和第5.0代，是完全标准化的SNIA。现在我们有，如图所示，所有不同的样品，你可以看到，我们有非常广泛的市场支持。下一个。

07:02 RS:那么，让我们来谈谈下一代E1。S flash平台．这里您将看到几个平台。如果我们从左边开始，你会看到E1的图像。S插销和10U刀片。你会看到机箱与1和20U刀片在他们。这些都提供了优良的密度，低气流和灵活的flash比率cpu，以及卓越的使用性能。对于那些对这些盒子更感兴趣的人，我鼓励你们访问OCP存储，Facebook正在那里工作，把这些平台捐赠给OCP。说到这里，Lee，你想谈谈调试的挑战吗?

07:50 LP:确定。正如我们在Natick项目中谈到的我们在海洋中建立了一个数据中心，我们可以看到在哪里调试数据中心发生的事情，以及如何服务它，以及如何让一切尽可能好地运行，都有一些挑战。你不能只是派一个技术人员去替换一个设备或者带着你的JTAG调试器去访问那些设备，看看发生了什么。所以远程调试的能力是至关重要的。所以，很明显，就像你在这里说的，没有JTAG，没有UART，没有远程访问…或者没有访问，物理访问，对吧?因此，我们需要有能力让驱动器告诉我们正在发生什么，通过遥测，通过日志，通过任何类型的智能数据，现在所有的东西都必须丰富，健壮，坦率地说，人类可读。下一个。

09:00卢比：说到这里，我们来谈谈OCP NVMe云SSD。所以，如果我从超大规模SSD市场的问题开始，问题是每个人都希望他们的SSD具有相似但不同的固件定制。当然，现在每个人都想要他们的ssd。这将导致客户与市场竞争，谁先得到他们的ssd，工程与挑战性的优先级斗争，工程缺乏无限的资源和努力构建ssd，质量由于资源，时间和不能集中在一个单一的解决方案而受到影响。最重要的是，把bug放到分支中、移植回主干并进行验证是非常痛苦的。最终的结果是工程人员不堪重负，他们因为缺乏资源而错过了日程安排，每个人都在挣扎。

09:55 LP:那么，答案是什么?因此，Facebook和微软提出了一个温和的提议，试图将所有人聚集在一起。我们想把所有的东西结合起来，至少从一开始，把我们数据中心的Facebook和微软对ssd的要求结合到一个统一的规范中，以调整行业，帮助每个人的时间推向市场。下一张。

28 RS:因此，这里您可以看到NVMe云SSD规范的图片，该规范已被贡献到OCP中。在底部有一个链接，你可以在那里找到它。现在版本1.0已经发布。

10:45 LP:那么，这个新规范包含哪些内容呢?目前，它大约有70页长，有430个独立的行项目id。实际上，我们对每个需求都进行了标识，这样它就可以被跟踪和测试。围绕这个，我们讨论的是NVM express，协议，特别是NVM express可以调用可选的东西但它们对我们的数据中心是必需的，然后它被调用。周围的事情串行总线我们之前讲过的测井，可靠性，热传导。特别是安全，这是一个重要的话题。因此，构建NVMe云SSD所需的一切。下一个。

拉尔夫-舒马赫:三十八分那么，系统制造者对此有何看法?联想的Jonathan Hinkle说:“这是一种新的云SSD规范，是微软和Facebook的出色开发。我们之前与他们、英特尔和其他关键行业推动者合作，开发EDSFF驱动标准，如E1。在数据中心系统中优化以创造新的价值。现在，他们的云SSD规格又向前迈进了一步，通过降低行业中驱动器供应商不必要的成本，进一步实现行业一致性。”保罗，你想在这里评论一下吗?

需要保罗甘蓝:当然，HPE认为将云计算和企业系统提供商的需求结合到一个开放规范中是很有价值的，从而通过减少多个开发流和测试工作来提高驱动的上市时间和质量。这些都增加了成本，分散了当今行业的资源。稍后我们还会与大家分享一些关于我们所瞄准的统一能力的信息。

12时56分谢谢你，保罗，我们期待在稍后的演讲中听到更多。那么，行业和生态系统是如何接受这一点的呢?因此，“UNH-IOL很高兴能够参与OCP NVMe云SSD规范的符合性测试。这将对我们现有的NVMe合规套件起到很好的补充作用。”这是新罕布什尔大学的大卫·沃尔夫说的。在幻灯片的底部，你会看到一个公布UNH的测试计划，所以我鼓励你去看看。

38 LP:因此，我们在Teledyne LeCroy和OakGate的合作伙伴：“Teledyne LeCroy是协议合规性的行业标准，它开发了一个全面的OCP云SSD测试解决方案，包括软件和服务产品。测试读数作为SVF Pro、Enduro的OakGate测试和验证软件的一部分提供，并通过奥斯汀实验室提供附加服务，用于测试规范的符合性和预符合性测试。”这是OakGate产品工程副总裁Aaron Masters提供的。

而且,Quarch。Quarch正在开发一系列用于OCP NVME云SSD合规测试的脚本。这些脚本可以有效地测试功率、性能和功率损耗要求。”这是Quarch公司首席执行官迈克·迪尔曼的回答。下一张。

下去LP:因此,关键的外卖。惠及系统制造商和SSD供应商;这是什么意思?所以，如果我们有一个规范，那么就不会有多个固件，希望只有一个固件，它会在我们所有的合作伙伴、供应商和我们自己的内部测试中得到更好的测试。所以，这确保了所有东西都尽可能地协同工作。并使行业内的超标量者之间能够进行额外的协作。再一次,你可以看到从上面的报价中,人们将这背后,如果每个人都想做同样的测试,同样的驱动要求,然后你可以看到,如果每个人都保持一致,那么许多人都可以进行肤浅的错误的思想,使整体更健壮的生态系统。下一张。

15:31 RS:如果有关于超大规模风险要求的问题，NVMe Cloud SSD规范是公开的，现在可以得到，这个文档使行业能够成功地与超大规模合作，我鼓励你们去看一下。那么，下一个问题是，OCP NVMe云SSD的下一步是什么?让我把事情交给保罗来讲。

16:03 PK:谢谢，罗斯。所以，我想谈一谈HPE如何看待OCP NVMe规范的价值和一些好处。而且，传统上，HPE有一些驱动器的自定义固件规范，我们专门开发了这些规范，因为我们在这些规范中看到了关键的价值和好处。其中一些价值观确保了我们在整个驱动产品组合中获得一致的行为。

正如Lee之前提到的，有许多可选功能和行业标准，我们需要能够指定哪些可选功能是我们的驱动器必须具备的。还有,我认为每个人都知道,有很多的行业规范和模糊语言可以解释这样或那样的方式,所以能够澄清模糊语言对我们很重要,所以这是一个关键原因我们有我们自己的固件规范。供应保证是另一个大问题。一旦你得到了一致的行为，就可以实现多源，因为现在你有多个供应商，他们都在提供行为相同的驱动器，你可以做多源，这对保证供应很有帮助。

十七10 PK:我认为李这个早些时候提到的,为了获得更好的问题解决和调试,所以我们有额外的遥测和元数据日志,以便我们能够得到非常具体的细节一个硬盘做什么,什么样的故障机制,有当然，这总是有助于更快地解决问题。

另一个大问题是，总体而言，我们的质量会得到提高。我们可以制定出最佳实践，随着时间的推移，我们已经从中吸取了经验教训，因此我们将在我们的规范中投入大量的价值。当我们第一次读到新的OCP NVMe规范时，我们看到，“嘿，这有很多共性，我们在固件规范中看到了许多相同类型的好处。“因此，这些功能和需求都非常好，然后与我们的重叠，因此我们开始思考，我们如何利用OCP规范，并通过在云和企业用例之间创建一个通用的统一规范来获得更大的利用率？当然，这不仅实现了我刚才提到的我们的原始价值优势，以及我们拥有自己的定制规格的所有原因，而且还提高了您推动规模经济的能力。

18:23主键：所以那些现在存在的开放需求也可以使第三方遵从性测试更全面地工作，对吧，他们有你的驱动支持的完整规范，所以他们知道如何测试。在过去，我们可能有一些他们可能不知道的特殊遥测或元数据日志。现在，如果一切都公开了，他们就更容易开发真正健壮和完整的第三方遵从性测试。当然,就像前面所提到的,利益驱动供应商和系统提供商HPE一样,因为你有更多的眼球看着相同的代码,同样的固件,和相同的测试遵循套房,所以所有的结果在更好的质量,更快的上市时间。

19:09 PK:因此，HPE正在与OCP云SSD规范的原始作者微软和Facebook合作，以获得企业和云用例的统一规范。我们实际上,创建这张幻灯片的时候,我们没有戴尔在船上,但是他们最近签约,所以可以宣布,他们也与我们合作,戴尔和HPE,想出更多的企业需求与微软和Facebook。

因此，我们都在计划在今年12月发布一个更新的规范。我们刚刚在10月8日向OCP存储工作组宣布了这个消息，就在不久前。如果你们想看当时的幻灯片，可以在OCP维基上找到;那里有一个链接，可以获取每月的会议记录和会议记录，你可以看到我们在那里向OCP存储工作小组展示了什么。所以，我想这就是我们的结束。非常感谢你的时间，我期待着未来的任何问题。

20:20卢比：是的，非常感谢。我很感谢你们今天能听我们的演讲。

20:25 LP:是的，谢谢大家。

Hyperscale的挑战:Hyperscalers关心什么

以下是一些关于在超规模部署时可能出现的问题的见解，以及超规模者认为有价值的东西。

闪存峰会2020年会议从第一天开始

深入挖掘闪存

监视NVMe ssd的运行状况

《2025年的超大规模存储》以及我们是如何做到的

云应用中的NVMe

现实世界中的NVMe技术