用于虚拟化环境的数据缩减方法
压缩和重复数据删除是虚拟存储环境中常用的数据缩减方法,但它们适用于不同的存储级别。
条款压缩和重复数据删除通常可以互换使用,但它们是彼此非常相似的不同数据简化方法。
压缩已经以这样或那样的形式存在了几十年。自20世纪80年代以来,压缩的一种形式是zip文件,它将多个文件合并为一个文件,并删除文本字符串和二进制数据的冗余副本。当压缩文件的内容被提取时,数据将通过插入已删除数据的过程重新水化。
压缩还可以用于其他方式。像jpeg和mpeg这样的媒体文件是被设计为本机压缩的文件格式占用尽可能少的空间.
与压缩一样,重复数据删除也以许多不同的形式存在。目前使用的许多重复数据删除产品都在存储块级别删除冗余。
虚拟机和数据缩减方法
当涉及到虚拟服务器的数据缩减方法在美国,重复数据删除和压缩都有自己的位置。压缩通常在文件级工作,而重复数据删除往往在块级工作。
压缩可能最适合用于包含很少访问的数据(如归档数据)的文件服务器。由于压缩的工作方式,压缩所有内容通常不是一个选项。
虚拟化环境中压缩的另一个常见用途是NTFS文件系统压缩,一些管理员使用它来减少底层物理存储卷上的数据占用。但是NTFS压缩是一个传统的特性,由于它消耗CPU周期,现在已经开始不再流行了。因此,对于运行cpu密集型工作负载的虚拟机(vm)来说,压缩是一个糟糕的选择。更重要的是,一些Windows Server特性,如持续可用性不兼容的在NTFS压缩。
如果存储硬件支持本地重复数据删除,那么重复数据删除可以在存储级别实现,并且可以在虚拟机外部工作。这种类型的重复数据删除的好处是,它可以帮助消除虚拟机之间存在的冗余。例如,运行相同操作系统的虚拟机存在相同的系统文件。重复数据删除可以消除这种冗余,减少虚拟机对物理存储的需求。重复数据删除目前是虚拟化环境中选择的主要数据缩减方法之一,卷级压缩使用的频率较低。