混合云灾备问题探讨云和虚拟化
风险无处不在,包括自然灾害以及突发事件等,有时候我们无法预测到一些风险,比如天津港爆炸事件。IT领域也一样,总是有意想不到的事情,近期Google、携程、阿里云等都发生了较大的宕机事件。IT风险具有不可预测性,万全之策就是做好灾难应对的准备。近几年云计算的发展如火如荼,在云环境下数据的灾备相比以前会有变化吗?针对灾备的一系列问题记者采访了上海爱数软件有限公司产品副总裁吴米香。
爱数吴米香
云时代IT架构和数据环境发生了巨变
灾备意义在于灾难事件发生时有效应对风险,进行数据与业务恢复,控制并减少损失。在云计算的趋势下,IT系统的灾备本质并没有发生变化,但IT环境的变化必然会带来未知的风险。
一方面,由于大量传统IT架构系统在短期内不可能废弃不用,混合IT会是当前的一个常态。传统的IT架构系统以及基于云,包括私有云,托管云,公有云形态的IT架构是并存的。云计算不仅对IT技术架构、IT组织架构与组织能力需要变革适应,而且对存储也会有新的需求,在云环境下数据的保护方式也会有所差异。
另一方面,在云时代数据环境会发生了巨大的变化。用户数与业务量激增会带来数据量的迅速增长,某些业务的增长可能是指数级的,并且面对业务可用性的要求更高了,使用者要求所有的云计算服务提供7x24小时的服务。IT环境的混合化对灾备体系建设提出了更多的环境适应性要求,这些变化对风险管理与运维管理来说是极大的挑战。
用户对灾备管理和认知存在偏差
整个灾备行业起源于20世纪70年代,多年来的灾备建设规划与实施中,用户对灾备管理的认识不尽相同,至今还有信息化主管还错把构架双机热备系统当成备份工具,对数据备份保护不重视,只有出过事故以后才开始重新思考和审视风险,并进行整改。
在云计算方面,大多数云计算服务商在进行IaaS服务销售时,容易误导客户,错把多副本认为是备份:三副本,五副本?这真的安全吗?无论是在公有云还是私有云,只要基于软件的操作肯定依附于BUG,如此一来风险必然存在。假如把核心业务放在公有云上,没有采取行之有效的数据保护以及灾备恢复措施,一旦事故发生会给企业带来毁灭性的打击。 数据的备份保护与灾难恢复面临三大挑战
数据的备份保护与灾难恢复要满足合规性,在欧美、东南亚等区域对此要求十分严格,近年来中国现逐渐要求严格起来,例如医院医疗服务和保存医疗数据方面已经有严格的病人医疗数据的合规性要求,包括保密、备份、长期保存等,并且在业务可用性中断时间方面也作出了新的要求,特别是针对三甲医院。每个行业合规性不一样,灾难恢复体系存在一定差异,例如证监会、银监会、保监会等都出台了相应的行业灾难恢复标准要求。
有效性对于灾备系统来说至关重要,无效灾备系统是一颗地雷。灾备管理与技术方案行之有效,用户的数据安全与业务连续才能得到真正的保障。如何构建有效的数据保护和灾难恢复体系,依然是企业面临的巨大挑战。
建设灾备系统成本投资必不可少,如何平衡成本与收益?要设计合理的RPO/RTO目标,其中包括技术能力、投资预算、管理水平等因素。到底选择怎样的RPO/RTO与ROI之间才能取得平衡,在做灾备系统规划与建设的时候需要进行充分的风险分析与业务影响分析,才能最大化的平衡成本与收益。
外部环境复杂 灾备技术上需要创新
随着外部环境不断变化,操作系统种类多、数据库数量庞大,每一套系统,每一个数据库都有不同版本,导致灾备工作变得异常复杂,灾备领域需要持续的研发和支撑。
在中国国产化趋势下,AnyBackup技术创新是虚拟化的备份保护能力创新非常具有前瞻性与技术成熟度的。在一个虚拟化集群里,有两百甚至五百个虚拟机,如果每个主机装一个代理区备份,数据的管理工作是相当繁重的。现有的重复数据删除备份技术、CBT与虚拟化平台SAN备份技术、虚拟化平台文件级的恢复、针对Oracle、SQL Server、MySQL等数据库与应用备份技术优化的问世,提升了备份效率、并降低了备份的空间,重删技术的运用在二次备份时重删率可达99%,重删备份技术在跨地域的异地容灾价值非常大。
同时4D(D2D2R、D2D2T、D2D2B和D2D2C)的异地/异质/离线/在线全方面的数据备份保护体系,以及纯国产化平台(国产主机平台、操作系统、数据库与应用等)技术的推出让我们看到了灾备领域的新希望。
六大备灾方案为数据资产保驾护航
云计算的愈演愈烈使得灾备系统需要及时对新环境进行适配,当然灾备系统本身也可以基于云的架构利用云计算技术,从而提供真正的云灾备服务平台。以下六大解决方案中前四个方案是针对新的IT环境进行备份容灾,后两个方案采用云计算技术提供基于云的灾备服务。以下是爱数的解决方案:
第一个解决方案是核心业务双活可用和异地容灾。用户不能一味地追求同城甚至更远的距离,一旦出现链路抖动,风险将不可预测。以医院为例,四川省肿瘤医院和天津市儿童医院在医院两栋楼之间进行双活,院内自行铺设光纤链路,链路的不确定性风险比较可控,这样双活的网络基础架构稳定对双活的可靠性提供更好的保障。当然用户可以在同城进行部署,但是以往的经验来看:距离远,构建双活的成本将增加,风险也会增加。用户在进行规划双活数据中心架构时,需要把数据备份保护规划在内,并且在条件允许的情况下,把备份数据进行更远距离的容灾。
第二个解决方案是面向混合IT架构的统一数据备份与容灾:采用4D的数据备份与容灾方案。此方案综合涉及到物理环境、虚拟化环境等,把每一个风险点、每一个容易被忽略的部分都要考虑到,并进行相应的备份保护。
第三个解决方案是混合架构的应用。一方面在不同公有云之间做相应的容灾,比如用户有一条业务系统架构在阿里云,依然可以把它容灾到青云或者华为云,微软云,云与云之间来解决云单一依赖的问题;另一方面无论是公有云还是私有云,假如用户的业务在本地,可以容灾到云端,业务在云端可以对数据进行本地备份或者在云与云之间进行保护。
第四个解决方案是私有云平台。针对私有云平台(包括VMware、微软、OpenStack等),爱数提供了软件定义存储、文档云存储、统一灾备平台等子方案,为私有云的数据灾备提供多层面的技术方案,并建立学习与灾难演练平台。
第五个解决方案是面向托管云的服务,基于云灾备的架构采用开放租户模式面向云服务商的解决方案。在此方案中用户可以有选择性的采用OpenStack、VMware、微软和阿里公有云做为计算资源;利用公有云存储,比如阿里云、青云、华为企业云甚至连亚马逊都作为公有云存储的一部份。整个灾备资源管理可以通过AnyBackup Cloud进行管理,其中包括管理平台和租户门户。云服务商可以采用这套平台架构在公有云或者是专属灾备平台,为广大客户提供灾备的服务,包括共享一些垂直体系单位做共享灾备或区域云计算中心做增值云灾备服务、文档云服务等。
第六个是针对云桌面系统的解决方案。当前桌面虚拟化或云桌面已经得到广泛应用,那么该解决方案到底想解决什么问题?帮助用户解决桌面文档备份以及文档管理问题。桌面端发生灾难事件是相当棘手,桌面可能散布大量的数据,采用文档云架构来把数据分离出来,并且做好灾备管理,管理桌面将变得十分简单。当然桌面数据同步备份只是一个功能,其强大的安全共享与文档管理对用户来说也是非常有价值的,用户可以通过手机端、Pad端、物理PC、虚拟桌面PC实现文件安全高效共享、检索等文档管理。
总之,在云计算趋势下,无论物理环境如何变化,数据永远是最核心的资产,数据保护跟灾难恢复的规划不可或缺。在灾备问题上,数据安全风控是第一位的,其次是成本,并且数据的所有权跟管理权要明确,最后灾备系统上线后,要重视管理与运维。
有云虽好,不要忘了灾备。