如何利用固态硬盘进行存储分层(下)存储与灾备
尽管厂商硬件架构不同,但底层的驱动器和电路板往往是非常相似的。然而日立公司却不同,它设计了专用的 ASIC 芯片和处理器作为混合控制单元。 ASIC 芯片用于数据移动,而四核的 Intel 处理器用于跟踪源数据。其理念是将尽可能多的工作量交给硬件层来完成,从而获得最高的性能。
作为实用的分层解决方案,自动数据迁移软件有着显著的不同,并且它是进入“目前最先进技术”领域的“艺术”。例如,日立公司把他的硬件架构和一个基于对象的文件系统相结合,用于跟踪源数据,这被认为是最有效的过程。数据的移动是基于策略和使用特点。数据按照42MB 大小的页面进行迁移,这恰好适应了缓存的大小。日立公司使用“设置然后忘记”的理念以最大限度的减少人为的努力,而数据可以在其预期会被使用的情况下手工迁移到更高的层级。这方面的一个例子是在月末处理某些特定的数据集。
数据什么时候要被移动以及原因
存储管理员或许会假定热数据是无法预测的,并且可能会在任何时候发生,因此数据移动会很频繁。大部分数据的移动计划发生在几小时内,并且可能持续一天,这意味着数据在层之间的移动更多是基于趋势的,而不是对情况立刻做出反应。因为这个原因,惠普公司认为缓存是应对实时的、不可预知的突发 I/O 的最好技术。如果不可预测性很高,那么 IT 管理者应该补充加强缓存,而不是采用混合池。
什么时候移动数据是适当的调整系统的一个重要方面。EMC 公司的 VNX 系列产品缺省的数据移动周期是一天一次,不过用户可以通过设置策略实现数据更频繁的移动。惠普公司的 Ibrix 系统也是以天为周期进行数据移动的,但可以做到小时级的移动数据。数据的移动是基于对数据段变热的源数据的扫描。尽管可以并行的进行扫描查找,但厂商警告,太多的扫描作业会非生产性的消耗后端 IOPS 。3PAR 磁盘阵列具有“不中断”数据移动功能(这实际上是对主机和应用程序透明的自我调节功能),“热”数据可以做到每30分钟进行取样。即使这样,惠普公司仍然推荐、限制数据移动的频率到必要的程度。
另外的一种类型,EMC 公司的 VMAX 和 NetApp 公司的系统都设计成频繁的数据移动。VMAX 移动768KB 的数据段,而 NetApp 是4KB的数据块。因为需要移动的这么小的数据的 I/O 数量非常低,所以对于整个计划的破坏也是最小的。此外, EMC 允许数据被“订”到缓存里,手工移动或者在特定窗口按计划执行,例如在午夜到凌晨2点之间。
最适合分层的数据类型
什么情况适用于存储分层?几乎所有的厂商都认为是虚拟化桌面(VDI)和服务器虚拟化环境。在共享存储的虚拟化环境中,NetApp 推荐分配双倍的缓存。 EMC 公司的 VNX 系列的最佳使用情况是作为“倾斜的数据集”,作为在任意时刻热数据的子集。除了 VDI 之外,还可以用于在线交易处理(OLTP)的应用。基于 Web 的文件服务是另外一个好的用处,这是因为某些页或许比其其它的更更频繁被命中。
分层数据存储策略,通过利用 SSD 和闪存以获得最佳性价比,只会变得更加强大。尽管它现在已是大多数存储阵列的基本功能,分层目前已经是存储管理员考虑的最重要技术之一。因为固态技术与服务器内存从根本上讲是相同的,它遵循莫尔斯法则的性价比曲线;每 IOPS 的成本将会在来年显著降低。