iStockphoto /盖蒂图片社

帖子

计算存储:超越计算卸载

计算存储的支持者包括学术界和存储网络行业协会。虽然还有幕后工作要做,但这项技术可能会带来好处。

计算存储有一个简单的原理:将计算任务移到数据所在的位置。通过这样做,我们提高了系统的性能和效率。由于存储数据是在数据中心的所有级别处理的——在服务器内部、在网络中,当然还有在存储环境中——这些效率是非常受欢迎的。

部分原因是存储不是一个整体。事实上,存储存在于许多层,并具有许多不同的组件。其中一些组件与数据本身有关——存储、保护和传输。其他组件必须处理存储控制系统、设置管理平面,甚至协调数据在不同系统内部和外部传输的方式、位置和时间。

这样想。每一种技术产品都有三个基本组件:计算、网络和存储。然而,在过去的五年中,每一个组件都在不断发展,提供了数量级的更好的性能、可靠性和实用性。因此,可以将这些组件移动到以前不存在的领域。事实上,这是我们能拥有的最根本的原因分类产品首先。

计算存储的好处

当我们想到处理时,我们现在能够超越“取”数据回主机处理器的概念——当然是通过网络——以便被处理。毕竟,不是所有的数据都需要在网络上来回发送。相反,我们可以更加明智和高效地在数据位置提供处理能力。

计算存储与传统存储的比较

这在实际意义上意味着什么?在某种程度上,它的意思是:

  • 更少的I/O传输(最好的I/O是从未发送的);
  • 降低了传输中出错的可能性,减少了跨网络的重传;
  • 更强的处理数据的能力,它驻留(也称为原位处理);
  • 降低主机的CPU利用率;
  • 由于某些工作负载的并行性而提高了性能;和
  • 更好的存储功能调度不仅是在需要的时候,而且是在需要的地方(例如压缩、解压、加密和包过滤)。

计算存储可以帮助解决这些需求,但比仅仅将计算和数据放在一起更重要的事情是:它有助于为这项工作提供额外的粒度。从体系结构的角度来看,这意味着不需要单片存储控制器来处理所有存储功能,它们可以放置在系统的多个位置。从存储的角度来看,这是巨大的。

在过去的几年中,学术界、存储架构和云提供商等领域对该技术的关注越来越多。例如,在计算机协会的一个特别版本中,有一整期关于计算存储的文章。

对于整个生态系统来说,拥抱支持计算存储的新基础设施将是一条进化之路。

学术界长期以来一直是计算存储的有力支持者,提出将其用于人工智能和机器学习、数据重组和抽象的高级应用:《计算机体系结构:定量方法》一书中写道:“通过存储I/O堆栈,明确地将应用级计算任务从主机cpu转移到存储驱动器。”为了通过I/O堆栈显式地将计算卸载到存储驱动器,必须找到并有效地提供方法来增强整个I/O层次结构的接口。

探索计算存储的潜力

不同的计算存储设备可以提供许多不同的计算功能和能力。存储网络工业协会(SNIA)和NVM Express社区正在进行的标准化工作无疑将在创建一致和统一的方法方面发挥关键作用实现计算存储

毕竟,对整个生态系统来说,拥抱支持计算存储的新基础设施将是一条进化之路,而在SNIA,超过250名志愿供应商成员一直在稳定和勤奋地共同努力,以加速这一进程。(当然,我们真诚欢迎更多的各方参与!)

这项工作开始有成果了。许多涉及的技术挑战已经被克服,强大的协作承诺确保开发人员和最终用户在市场上的一致性。计算存储广泛应用于工业的一个垫脚石是本地存储内计算,它独立于存储I/O堆栈或对存储I/O堆栈透明。这样就可以在不需要修改存储堆栈的情况下采用,这需要花费更多的时间来渗透到各种操作系统中。实现本机存储计算有几种不同的选项,在一篇文章中可以说明更多。

让我们来看看其中一个选项:存储内无损数据压缩,对驱动器内每个4kb数据块执行,对主机透明。无损数据涉及大量的随机数据访问,导致非常高的CPU/GPU缓存丢失率。因此,基于CPU/GPU的无损压缩的CPU/GPU硬件利用率非常低,因此速度性能较低。因此,原生存储压缩可以透明地利用运行时数据的可压缩性来降低存储成本,而不消耗任何主机CPU/GPU周期。

另一个明显的例子是数据管理系统的设计,如关系数据库、键值存储和文件系统。在这里,设计受到传统存储驱动器的固定大小I/O的限制。但是,使用计算存储可以通过在I/O块中启用可变性和灵活性来放松底层存储驱动器施加的约束。事实上,通过使用本地存储计算,这可以在不需要对现有I/O堆栈进行任何更改的情况下完成。

除了这些示例之外,本机计算存储还可以包括加密、重复数据删除、病毒检测、故障检测和容错以及许多其他功能。此外,还可以在内部运行一个完整的基于Linux操作系统的系统计算存储驱动器,仍然独立于主机中的存储I/O堆栈。

SNIA和NVM Express正在努力为市场开发许多不同的平台,通过更方便地使应用程序将计算任务从主机cpu转移到存储设备,来释放计算存储的全部潜力。

更多关于SNIA的计算存储工作

SNIA的计算存储工作由计算存储技术工作组(TWG)的自愿供应商成员领导。该TWG的最新活动是SNIA计算存储架构和编程模型,v0.8 rev 0,和SNIA计算存储API v0.5 rev 0,它们现在已经出来了公众评论

SNIA计算存储特殊利益集团加速对计算存储概念的认识和厂商中立的教育,并影响技术规范和编程模型的行业采用和实现。

关于作者

张彤是SNIA计算存储特别兴趣小组和技术工作组的成员。他是一位在数据存储系统和超大规模集成电路(VLSI)信号处理领域做出重大贡献的知名研究员。他目前是伦斯勒理工学院的教授。他目前和过去的研究跨越了广泛的领域,包括数据库、文件系统、固态和磁性数据存储设备和系统、数字信号处理和通信、纠错编码、超大规模集成电路架构和计算机架构。

存储网络行业协会是一个非营利性的全球性组织,由跨越全球存储市场的成员公司组成。SNIA的使命是在发展和促进标准、技术和教育服务方面领导全世界的存储行业,以授权组织在信息管理方面。为此,SNIA致力于提供标准、教育和服务,以推动开放存储网络解决方案进入更广泛的市场。

在主端存储设备上深入挖掘

搜索灾难复苏
搜索数据备份
搜索聚合基础设施
关闭
Baidu