复制之于闪存存储系统
2014-10-13 TechTarget中国 编辑:李志明
基于闪存的存储系统能够确保消除数据中心目前面临的很多性能挑战。这使更高密度的服务器和虚拟桌面基础架构以及更具伸缩性的数据库环境设计成为可能。这些更高密度、更具伸缩性的环境带来了更快、更持久的投资回报,但也需要存储效率技术来抵消基于闪存的系统额外成本。
闪存效率最少被谈及的一个部分就是复制。目前,复制一般理解为同步或者异步方式将数据复制到远程灾难恢复点的能力。它也可以用于本地复制到备用系统(正如它以往一直被用于应用程序的高可用性)。这也创建了一种可以防止存储系统故障以及站点故障的多层次恢复方法。
和其它任何存储系统一样,复制对基于闪存的存储系统也是必不可少的。根据定义,闪存系统中驻留了环境中的大部分活跃数据集。因此,必须优先确保数据得到主动的保护而且可用。每天一次的备份对于这些系统而言显得过时且毫无用处,而把数据拷贝到主系统的恢复又需要过长的停机时间。这两种方法对需要闪存存储的数据集都过于低效了。
有趣的是,复制成为创业厂商增加到他们闪存存储系统的最后一项特性。实际上,有很多厂商没有提供这项功能。因此,存储管理员被迫寻找第三方来提供这项关键特性的支持。而这些第三方产品创建的是一个没有利用重复数据删除和压缩的存储效能低下的复制过程。这些特性的缺失造成第三方复制软件并不适合全闪存系统。
本地复制,以摆脱备份
与纯硬盘驱动器系统不同,基于闪存的系统具有长时间保留快照的性能属性。基于闪存或者闪存辅助的快照可以取代很多我们依赖的过时的备份过程:恢复最近被删除或者被损坏的数据。这样利用快照就意味着备份过程中的一个转变。传统的备份拷贝的例行程序仅作用于出自保留目的的每月一次或者每个季度一次的数据归档。而快照将满足恢复的更迫切的需求。
该战略的一个弱点是存储系统本身。如果存储系统出现故障,那么存放于快照中的所有“备份”也将丢失。考虑到目前存储系统的可靠性,存储系统长时间故障的机率较低。然而,数据完全丢失的后果严重,IT专业人员打算采取额外措施来保护它们。
过去,这可能涉及分别拷贝到磁带或者备份磁盘。但是,假设你只是接近实时地把数据复制到数据中心的另外一台存储阵列之后再将其复制到DR站点,会怎么样?这种方法将使完全受到保护的快照在相当长的时间内被保留。这项战略几乎可以摆脱传统备份,磁带可以被用于数据的长期归档。
为灾难恢复而复制
目前,存储系统复制特性更为普遍的应用案例是灾难恢复。在大多数情况下,这意味着数据接近实时地、异步地拷贝到灾难恢复站点。
过去10多年,基于硬盘驱动器的存储系统一直都保有这种技术,但是闪存改变了游戏规则并且有了新的考虑。
恢复站点的性能
第一个考虑,而且也是经常被忽略的,放置在恢复站点的目标存储系统的性能和效率。尽管第三方软件复制工具支持把数据从任意阵列复制到另一阵列,但是仍存在涉及灵活性的某些风险。由于闪存系统成为了规范,基础设施也将走向更高密度和伸缩度。换言之,基础设施甚至应用程序本身都将寄希望于闪存的性能。回到硬盘驱动器的性能是不可接受的,应用程序如果没有了闪存也将无法有效运行。
如果DR站点在灾难期间被用于开展业务,那么DR存储系统需要有一些闪存的补充。也许不是一台全闪存阵列,但起码是一台混合(闪存)阵列;否则在DR站点运行的应用程序的性能将无法想象,用户会认为它们“死”了。
WAN带宽利用率
理解DR站点的目标存储系统需求,就必须要理解WAN带宽的效率。独立软件复制厂商与全闪存系统一同使用的问题在于他们无法在闪存存储系统上实现数据效率功能。他们不得不重新构建自己的数据效率技术,以优化WAN流量。这一般通过识别已发生变化的区块,压缩它们,然后利用线路进行传输的方式实现。有少数几款基于软件的复制工具具备进行重复数据删除的能力。
但是,与区块级拷贝共同使用的时候,重复数据删除扮演了重要角色。一旦新的数据区块被创建或者旧的区块被修改,没有重复数据删除功能的复制软件会马上传输那些数据。如果第三方复制软件产品具备重复数据删除功能,它首先从同一服务器或者从另外一台服务器检查数据是否已经被发送到DR站点。尽管检查存放在WAN连接另外一端的数据有额外延时,但如果这些额外的检查可以消除五倍的传输量,那么WAN复制将更具效率。
因为大多数闪存系统都具有运行在主存储系统上的效率技术,所以在通过WAN向DR站点(或者向上述原地的备用系统)传输数据时,闪存系统可以利用这些技术。执行压缩和重复数据删除的引擎也可以向远程站点发送数据。不需要对远程站点进行“重删复查”,因为只有特定的数据获得复制。结果是一个几乎没有额外延时就能把数据发送到DR站点的、完全集成的过程。
也可以开发第三方软件应用程序来执行重复数据删除和压缩以及复制。这意味着关闭厂商(有些厂商有常开状态的优化)提供的重复数据删除和压缩或者选择没有这些功能的闪存厂商也能够添加软件。这样做也为用户提供更大的硬件选择的灵活性。我们期望软件定义存储产品最终实现这项功能。
由于某种原因,复制是很多存储系统供应商本该首要考虑却放在最后的问题。如果它们不具备该功能,那么就是将客户推给第三方复制选项。而这些软件应用程序无法利用已经内置于阵列当中的重复数据删除和压缩之类的数据效率技术。把这项技术集成到存储系统当中,对闪存阵列厂商来说是接下来一个重要的步骤,也是客户需求的一个步骤。也许他们应该开始研究提供数据效率和复制的软件定义存储产品。