在虚拟化时代的备份和灾难恢复虚拟化
我们的那些原始的数据可能会被意外删除或更改;然而,这其中,系统故障的可能性将在许多因素中被列为最优先的级别。这其中的因素可能包括来自用户设备的任何一个磁盘的崩溃到数据中心的灾难性事故。
当这样的故障失败发生的情况下,不仅仅只是数据需要进行恢复,同时也需要恢复完整的工作环境;换句话说,即需要进行灾难恢复。
备份和灾难恢复并不是可以直接互换的术语;但如果没有首先进行备份,灾难恢复是不可能完成的。灾难恢复能够让系统恢复,并尽可能快的重新启动系统,包括相关的数据。
虚拟化的广泛使用已然改变了企业进行灾难恢复的方式。在一个虚拟化的世界,一个系统可以通过复制虚拟机(VM)的图像并在其他地方重新创建来进行恢复。
虚拟机复制,灾难恢复和市场适应虚拟化的方式是当前企业亟待考虑的关键性问题。
在过去,如果服务器崩溃之后,你可能要遵循以下步骤:
找一台新的服务器。寄希望于你企业会有一台空闲的服务器,其很可能是一台早已过时的模型,如果其没有被使用已经相当长一段时间了;
然后,安装所有的系统和应用软件,试图让所有的设置都恢复成与以前一样,当然,除非你提前这样做了,而如果你企业曾经只投资于一两台冗余服务器处于待机状态的话,这将是不可能的。更多的情况是,您根本不会提前预见到其会运行失败;
或者,对于您企业的一款真的非常关键的应用程序,你可能需要有一个“热”备用,并为之准备好。然而,这将会增加应用程序的所有权成本,使得所有的硬件和软件的费用支付都增加两倍;
对于最近的数据备份进行恢复,对于一个数据库而言,其可能能够恢复最近的新数据。但对于文件服务器,隔夜的备份可能是全部可用的,所以只能返回到最后一个工作日的结束。任何在故障发生时存在内存中的数据都很可能已经丢失。因此,您企业决定计划恢复到多久以前的数据的目标便是您的备份计划,即对于恢复点目标(RPO)的定义。
虚拟化改变了一切,并增加了企业的选项。首先,数据可以很容易地作为提交到给定的虚拟机(VM)图像的一部分进行备份,包括应用软件,本地的数据,设置和内存。第二,没有必要 重建物理服务器;虚拟机可以在任何其他兼容的虚拟环境创建。这可能是企业内部空闲的容量能力或获得来自第三方云服务提供商所提供的服务。这意味着大多数冗余系统的成本就消失了。
在一个虚拟化的世界,灾难恢复更便宜,更快,也更完整。这样的备份,更快的恢复时间目标(RTO)得以更容易的实现。至少,理论上是这样的,但由于需要协调不同的互相依赖的虚拟机,其可能变得更加复杂。例如一款应用虚拟机和一款数据库虚拟机,其测试恢复仍然是至关重要的,可以防止运行系统的问题。
目前市场上有许多不同的方法,从紧密整合的管理程序级虚拟机复制到灾难即服务(DRaaS)。
领先的虚拟化平台服务供应商,包括VMware,微软Hyper-V和Citrix Xen–提供不同水平的复制服务嵌入到他们的产品中。他们是紧密集成的管理程序并整合到其本身,所以会被限制在一个给定的虚拟环境。然而,这也给了他们潜在的实现连续数据保护所需的性能(CDP)的可能,使用阴影虚拟机进行热备用,同时减少RPO和RTO。
还有其他一些产品,在管理层紧密整合虚拟机复制,例如EMC的RecoverPoint,支持协调的复制和多台虚拟机的恢复,从而保证一台虚拟机中运行的应用程序能够于与之相关联的数据库虚拟机保持一致。目前这唯一只有VMware能够实现,但是Hyper-V和云管理堆栈如OpenStack也即将实现。
另一个是Zerto,其已经建立在比虚拟化平台供应商更好的自动化和业务流程上了,进一步减少了运行时对于环境的影响。Zerto目前只支持VMware,但是已经计划扩大到对于Hyper-V和亚马逊网络服务(AWS)的支持了,这意味着,在未来,它将从一款企业内部的VMware虚拟系统的故障转移,扩展到支持AWS或其他非基于VMware的系统了。其产品也可以用于预负荷的计划迁移。
许多其他的虚拟工具通过在给定的时间间隔进行虚拟机快照。这包括暂停虚拟机达到足够长的时间来复制数据,然后返回到其以前的状态设置和内存。快照可以用来一次又一次的创建虚拟机。RPO取决于快照拍摄的频率(这可能通常足以接近CDP,但会影响整体性能)。RTO取决于多块可以访问到另一台虚拟资源。
一些新的供应商,专注于虚拟环境的备份。例如瑞士的Veeam公司在2008年推出的产品支持VMware和微软的Hyper-V。成立于2012年的Nakivo公司只支持VMware。这些产品已经建立了一个虚拟的世界,他们从一开始就有很多需要适应内置需求,例如创建虚拟机快照和网络加速,使异地复制更有效。
传统的备份供应商已经适应了他们的产品。例如,赛门铁克更改发布了其Backup Exec 2014,被认为是匹配其新产品性能的。戴尔声称其AppAssure通过采用“智能化”模仿CDP,避免了虚拟机冻结和至少每五分钟抓拍一次。CommVault的Simplana和Arcserve也面临被赶超的挑战。
许多传统供应商的一个区别在于他们对于同时旧的物理环境和虚拟环境支持的能力,毕竟这两种环境仍然是当下许多企业的现实情况。这也意味着他们的产品通常会被用于迁移。即,备份一台物理服务器,并将其作为一台虚拟机进行恢复。
许多云计算基础设施服务提供商,例如Rackspace和亚马逊均提供虚拟机复制,使客户能够处理自己的故障失败,但这通常是局限于他们自己的平台。
灾难恢复即服务(DRaaS)提供商
虚拟化的广泛使用和云平台恢复工作负载的可用性的普及带来了DRaaS的广泛采用。这里的虚拟机复制是嵌入服务,所以客户除了需要进行尽职的调查工作之外,没有什么其他要做的了,当然还需要在合作合同上签名。
有些是由云/托管服务提供商提供的;例如NTT通信在欧洲有一款产品已经与美国的伙伴DRaaS提供商Geminare公司合作。更强大的灾难恢复专家如SunGard和IBM包括已经开始提供DRaaS的投资组合产品了。
DRaaS供应商为其客户提供独特的价值。一些供应商还将其服务提升到一个新的水平,例如英国的B计划灾难恢复(Plan B Disaster Recovery)表示,微软Windows服务器DRaaS产品可以保证恢复,因为其包含对客户服务器环境下的夜间图像恢复性测试。这不仅确保了恢复,同时对相关问题对客户已经进行了预先通知。B计划灾难恢复公司的工作在应用层,因此是hypervisor中性的,支持VMware、Hyper-V和Xen。该公司的服务能够针对物理服务器和虚拟机进行图像快照。
Quorum公司提供的一款服务被称为onQ,最初是针对美国的海军开发的,使得他们能够在发生战斗损失时从一艘船快速迁移到另一艘,所以其是非常快,且非常具有弹性的,支持物理或虚拟Linux和Windows服务器。在英国,其使用本地数据中心合作伙伴以恢复客户服务器的虚拟机图像,他们声称可以实时快速重新启动服务器。
有趣的是,B计划灾难恢复公司表示说,一旦其服务被用于在虚拟环境中恢复一个物理服务器,客户就回不去了。换句话说,灾难恢复服务可以用来迁移到虚拟环境,也可以作为在一开始迁移到虚拟环境的动机。这可能会让你觉得:如果云能够作为我们最关键的应用程序的二次备份做到足够的好,是否实际上也能够成为我们长期的首要备份平台呢?