内联重复数据删除技术如何改变VDI存储
2013-07-02 TechTarget中国 编辑:张冀川
VDI存储因内联重复数据删除而改头换面。和传统方法相比,内联重复数据删除有哪些不同之处呢?
VDI应用的第一大障碍就是图像,卸载卡以及虚拟GPU解决了图像问题。第二大障碍就是存储,为VDI存储带来新飞跃的主要技术称之为内联重复数据删除——或者块级单实例存储。
为了了解虚拟桌面环境中使用存储的新做法,有必要解释一下内联重复数据删除与传统重复数据删除技术的不同之处。
过程级重复数据删除
在存储领域,重复数据删除这一术语已经存在很多年了。按照传统的观念,重复数据删除是在数据提交到存储设备之后所执行的一个叫做过程级重复数据删除的过程。一般来讲,其工作方式如下:
数据块被写入存储设备后,存储控制器在块级别对数据进行逐一比对。通过该过程识别通用的数据块并创建通用数据块的唯一拷贝,需要该数据块的文件使用指针指向该数据块。当存储系统处于空闲状态时,将会在后台执行这一非常剧烈的删除重复数据过程。
VDI存储使用过程级重复数据删除所面临的挑战和虚拟桌面环境有关,在虚拟桌面环境中我们更加关注性能而非容量。所以我们采购了价格非常昂贵,性能很高的存储,为的是得到尽可能多的IOPS。而大多数SAN关注的却是容量,性能是放在第二位的,而且和基于桌面的工作负载相比,大多数SAN工作负载更趋于平稳。
当运行过程级重复数据删除时,需要额外使用价格昂贵,性能更高的存储将没有经过重复数据删除处理的数据写入到存储中。虽然被写入的数据今后会变为通用块,但是在重复数据被删除之前你必须要有足够的容量来存储这些数据。
内联重复数据删除
这正是内联重复数据删除引发很多议论的原因所在。内联重复数据删除与基于过程的重复数据删除一样都是删除重复的数据,但是它是在数据提交到存储之前而不是之后删除重复数据。
厂商Atlantis、Tegile、VeloBit、SimpliVity、GreenBytes、Nimble Storage、Nexenta、DataCore、Nutanix以及Pure Storage(肯定还有漏掉的厂商)所提供的工具都将某种内联重复数据删除技术作为性能优化的一部分。有的使用内存,有的使用固态硬盘,而且所有的厂商都使用了某些分层架构将优先级高的动态数据存放在速度更快的存储系统中,而将其他数据存放在速度更慢,价格更低的存储中。
关键在于,优化是在数据提交到存储系统之前完成的。这意味着你需要的存储容量更少,而且可以将经费用于采购速度更快,性能更好的存储。
对于桌面来说,很多信息都是一样的。有些人说在典型的桌面中多达80%甚至90%的信息可以被作为重复数据删除掉。即使是在持久VDI环境,每个用户都有自己专用的虚拟机,桌面中的重复信息也很多。使用基于过程的重复数据删除,意味着你需要为所有的桌面预留存储空间;然而执行完过程级重复数据删除后,需要的存储空间只占原来的一小部分。
使用内联重复数据删除,你所需要的仅仅是一小部分存储空间,这意味着你可以花更少的钱提供访问速度更快的用户体验。