良好的VMware备份和恢复方案可以防止虚拟化灾难虚拟化
对于我们这些已经在IT领域中工作很长时间的人来说,虚拟化技术已经为保护虚拟机和保证应用程序正常运行提供了很大帮助。但是一套可靠的VMware备份和恢复计划可以保证在数据中心遭遇灾难袭击之后能够迅速恢复。
使用像VMware高可用性、DRS和vMotion这样的技术可以让我们在保持现有系统架构的情况下,同时提供几乎100%的可用性。而在十年之前,想要为用户提供这样的高可用性和正常运行服务等级几乎是不可想象的。此外,硬件可靠性和运行速度方面的提升也使得我们可以更好、更快地完成任务。
但是在其提供这些特性的同时,也存在一定风险。当基础设施处在系统的自动控制之下,而系统升级变成例行程序并且毫无危险性之后,这样很容易让人变得掉以轻心。然而,我们还是要保持警惕,因为对于处理重大问题能力的要求并不会降低。
据我所知,许多虚拟化特性的前提都是保证共享存储的可用性。存储的冗余技术可以进一步保证其可靠性。但是如果你的大部分存储突然发生故障将会怎样?硬件故障最终会导致虚拟机无法使用,毫无疑问,你的用户将会非常失望。不论你基础设施架构经过了怎样的精心架构,有时还是会发生一些糟糕的事情。我们可以从一些已经发生的、没有使用虚拟化技术的事件当中学习可能挽救整个环境的经验教训。
保存备份并且测试恢复计划
曾经——也就是上世纪90年代——备份和恢复还是IT部门日常工作的一个重要组成部分。制作备份、服务器崩溃、重新部署服务器、恢复文件,不断重复着这个循环。但是现在拥有了硬件冗余技术和实现可靠性之后,我们很容易忽视常规的备份任务。然而,备份任务应该成为你的虚拟环境中一个不可或缺的组成部分,以防止发生系统性的基础设施故障。除了将备份文件存储在和虚拟机同样的存储设备之外,管理员还应该在远离基础设施的地方保存备份文件的复本,以防止数据中心发生灾难。
备份系统利用了vCenter在连接和管理方面的优势,以及简化虚拟机磁盘备份等特性,在过去的几年中已经实现了很快的发展。如果想要创建一个可靠、支持VMware的备份平台,需要在前期花费足够的时间来确保构建一套完善、可靠和易于恢复的虚拟机备份方案。在发生重大灾难时,异地备份可能会成为你最后的希望,所以要确保其能够发挥作用。
还需要花费一些时间对虚拟机恢复流程进行周期性测试。而测试过程不应仅针对一个单独的文件,而是整个机器。要记住这个IT领域中的定律:“没有人会关心备份。他们只关心恢复!”确保你的恢复计划可以正常工作——并且熟悉最适合于自己环境的恢复流程——可以为你的环境尽快重新上线提供极大地帮助。
物理还是虚拟vCneter?
现在已经有很多种方式可以对vCenter进行虚拟化,但是我相信仍然保留一些物理服务器会更加有意义,这其中就包括vCenter服务器。拥有一台不依赖于共享存储和主机的服务器可以帮助提供更好的稳定性。
保证vCenter管理工具和操作环境的分离可以帮助在操作环境中进行快速和简单的故障分析。在发生灾难之后如果不需要首先考虑如何重新部署vCenter,而只需要关注如何恢复或者重新部署虚拟机,事情将会变得简单很多。当然,这也需要为vCenter制定一套良好的备份和恢复方案,还有硬件冗余特性。
全面检查基础设施
我建议所有管理员都从全局角度来分析自己的基础设施,寻找潜在的薄弱环节,特别是任何单点故障。避免只关注于那些技术细节,但是忽视了整体架构。要问自己:如果整个系统发生故障,我该怎样做?使用这个问题来引导自己改善现有环境,保证用户满意。