虚拟服务器备份的前世今生存储与灾备
虚拟服务器的备份曾经一度是一个不成熟而且导致网络堵塞的过程,但备份管理软件已经专门为处理虚拟服务器的需求进行了设计改进。这就是你在备份应用软件中所要寻找的。
服务器虚拟化毫无疑问是数据中心在最近五年中最重要的技术之一。它几乎改变了基础架构设计的每个方面,包括网络、存储和服务器本身。数据保护是在迁移到虚拟化环境过程中受影响最大的关键操作之一。虚拟化基础架构在数据保护方面的差距,成为导致新厂商只专注于提供虚拟机专用的备份和恢复解决方案的起因。
虚拟化备份的影响
虚拟化之前,应用程序运行在专用的服务器中,可以访问服务器的全部资源(存储、内存、CPU、网络)。大多数情况下,应用程序在触发备份进程的时候,它可以使用所有的可用资源来完成这个任务,把数据从服务器复制到备份的目标设备。
虚拟化改变的事情而虚拟化使情况发生改变。资源现在可以在多个虚拟机(VM)之间共享,每个虚拟机运行它们自己的应用程序。如果备份过程不能调整已以适应这个新的现实,那么,所有的虚拟机会同时发送它们自己的数据——,且全部从一台服务器(发送)。当虚拟化引擎耗尽所有的内存资源的时候,潜在的会导致服务器崩溃,或者在它耗尽了CPU和网络资源的时候,至少会出现性能问题。
解决虚拟机备份的早期尝试
在虚拟机备份的“早期”,大部分数据中心把虚拟机作为单独的服务器进行数据保护,而管理员需要平衡备份的日程表,以便同一时刻只有一两个虚拟机在做备份。这意味着IT管理者能够继续使用它们老旧的备份管理软件。但是随着虚拟化的不断深入以及虚拟机密度的不断增加,时间表的平衡变得不能维持,必须寻找替代方案以解决这个问题了。
虚拟化备份的优势
尽管虚拟化对数据保护性能产生了负面的影响,但其仍然具有自己的一套优势。一台“服务器”现在被封装到了一个大文件中,而不是数千或潜在的数以百万计的小文件。该文件可以被多个服务器通过虚拟化集群进行访问,以适应实现像主机间的在线虚拟机迁移和自动资源平衡等功能。
这些优势可以相当方便地由另一台服务器访问从而备份这个“文件”(服务器)。此外,大部分虚拟化引擎在其集群文件系统中构建有快照功能,所以它们能够使用快照,在不影响主服务器资源和性能的情况下由另外一台服务器进行数据保护。从根本上讲,脱离主机的备份功能诞生了。
这导致了一批公司的崛起,像Nakivo公司、PHD Virtual Technologies公司、Veeam Software公司和Vizioncore公司(被Quest公司收购,后又被戴尔公司收购)。他们利用上述功能,并且把它们扩展到能够实现虚拟服务器系统的精细恢复。
在虚拟服务器备份的初期,备份软件能够与虚拟化引擎接口执行备份任务的途径非常有限。因此,在虚拟化引擎变更或者升级的时候,时常会产生兼容性的问题。这对于较小的备份厂商是能够接受的风险,而较大的企业级软件厂商在提供虚拟机备份功能的时候则更加保守。由于传统备份管理软件的迟缓,新秀厂商在VMware数据保护领域获得了领先地位。
当今,虚拟化引擎的厂商可以提供API程序集,备份软件公司能够利用这些程序作为其软件代码的一部分。至少在理论上,这意味着他们的备份应用程序可以正常运转,不用再理会虚拟化引擎的代码修改,因而备份应用程序代码重写的量也会最大限度的减少了备份应用程序代码重写的数量会大幅减少,这就意味着备份软件公司可以不用再理会虚拟化引擎的代码修改,而其备份应用程序依旧可以正常运转。
今天的虚拟机备份
随着API程序集的可以广泛使用,大部分厂商,无论是旧有的好事还是基于虚拟机的,都能够提供脱离主机的虚拟机备份,这些事情现在已经被认为是在考虑虚拟机数据保护的基本要求了。但还有除了脱离主机备份的特定功能之外,IT规划者应该考虑的其它功能但在脱离主机备份之外尚有许多特殊功能,值得IT规划者去一探究竟。
有代理备份与无代理备份的对比。代理是安装在虚拟机上的软件,可以为备份过程提供帮助。尽管上述API允许脱离主机的备份,一些厂商仍然依靠安装在虚拟机上的代理程序。这些代理可以用于帮助进行应用程序感知(允许对数据库或电子邮件进行精细的备份和恢复),而且,在某些情况下,可以提高备份的性能。
无代理备份不需要在虚拟机上安装软件代码,应用软件数据的精细恢复仍然可以实现;。然而,虚拟机文件的备份必须加载到独立的虚拟机,然后数据再复制出来再从中将数据复制出来。一些无代理备份产品已经开发出了“helper”应用,允许不加载到虚拟机的情况下,从众所周知的数据类型(如Microsoft Exchange、SQL Server和Oracle)中扫描、搜索和抽取更细粒度的数据组件。, 像从微软的Exchange、SQL Server和Oracle 中。
变化块备份。虚拟化引擎API已经逐渐增加了像VMware的Changed Block Tracking(CBT)那样的功能,允许备份软件感知到:从上次备份到现在,虚拟机映像文件的哪些部分发生了变化。这个核心功能可以允许备份更加频繁,因为数据传输的总量最小化了,而且可以减少在虚拟机崩溃的时候减少数据丢失的情况发生。
增强恢复。虚拟化环境的恢复也已经有了显著的提升改进。首先,不需要为了把整个虚拟机映像恢复而去深入了解虚拟化引擎的API了,现在大部分脱离主机的备份,在需要进行恢复的时候,能够恢复单个文件或文件集。一些厂商也利用了CBT来提供变化块恢复。例如,如果一个大型数据库崩溃了,变化块恢复只是恢复数据库中从上次备份以来变化的部分。
在一些产品中,恢复可以进一步增强,这些产品允许虚拟机直接从恢复设备运行,这叫做“就地恢复”。在就地恢复的场景中,数据不需要通过网络传输,虚拟机和其数据可以在数分钟内恢复运转。对于许多组织,这个功能,再结合上经常频繁的CBT备份,可以消除解决对于单独的业务连续性软件的需要。
一些厂商正把这种功能扩展到云。“就地”的恢复是实际上发生在远端的数据中心。在这样的基础架构下,数据通常做本地备份,然后再复制到云,部署就位,用于在站点级灾难的时候进行恢复。这不仅仅解决了本地保护和可用性的问题,而且提供的了灾难恢复的预案。
备份磁盘的角色转变
感谢像变化块追踪(CBT)、云恢复和就地恢复这些功能的出现,磁盘备份设备的设计需要向前发展。过去,数据传输到磁盘备份设备是以带宽为重点的(大文件,一次大量的全部数据大量数据同时涌现);而现在,它实质上是更加随机的其性质要随机的多(贯穿全天的小的变化数据块传输)。此外,由于虚拟机(VM)现在可以直接在备份设备上运行,磁盘备份设备的性能更加关键了。我们很快就能看到安装了固态硬盘且用于运行虚拟机的磁盘备份设备了。
就地恢复和变更数据块恢复之间有一个权衡。虚拟机需要移动回主存储的时候,就地恢复随之而来了。使用就地恢复,虚拟机移回主存储期间,会产生一个间隔期,此外,且备份设备不像主存储设备那样有高性能和冗余性能力,前面描述的云恢复模式更是如此。另一方面,CBT恢复产生了前面的停机时间会预先出现宕机,但消除了需要移动整个虚拟机所需要的更长的宕机时间。理想的情况下,IT规划者应该寻找一种结合二者所长的产品,同时提供这两种方法。
磁带支持。磁带支持看起来好像很奇怪,特别是对于原来运行在磁盘上的虚拟机应用,但磁带非常的廉价、便携而且便于长期保存虚拟机。相对于磁盘的快速备份和恢复,磁带是完美的补充,因为其可以使磁盘投资保持较小,并且这些磁盘大多数被用于立即恢复可用于大多数情况下的立即恢复。磁带支持应该得到更多的考虑,甚至是在只有磁盘的环境中。长期节省的存储容量,加上虚拟机在磁带上“休眠”的能力能够获得巨大的回报。
物理服务器支持。备份软件之间的一个主要差异是它们是否能够备份物理服务器。许多新的虚拟机专用备份软件只支持虚拟机。而许多数据中心正力求100%的服务器虚拟化,但他们大多数甚至还没有接近这个目标还不得要领。这意味着如果选择了虚拟机专用的应用软件,你必须准备好处理两个独立的备份和恢复过程你必须做好至少处理两个独立的备份和恢复过程的准备。
大多数传统的企业级解决方案同时支持物理和虚拟服务器数据保护,但在前面所述的一些虚拟机特定的功能方面往往处于较为落后。你需要在奢侈的单一数据保护产品和运行两种数据保护的产品中做出选择,以获得最佳的功能。一般情况下,这种选择归结为归根结底取决于有多少关键任务数据驻留在物理服务器系统中。
虚拟机备份的底线
在过去几年,虚拟服务器备份已经有了显著的发展,这在很大程度上要归功于厂商,如VMware建立了一个强大的具备了创新和融合的API集。这种功能不仅仅发展了备份功能,而且帮助消除了有助于解决单独的业务连续性和灾难恢复的应用软件的需求。