摆脱运维所累 规划数据中心路线图运营维护
企业级数据中心在经历了物理资源大集中、数据大集中、应用大集中之后,又迎来了新的应用融合时代,这对企业用户乃至全社会创新都具有重要意义。传统数据中心是由业务驱动的,而业务的驱动是随着市场、客户和产品变化的,所以信息中心建设采用了一种被动方式,业务要什么就建什么。建了一段时间之后会被杂乱的系统、低效的管理使用和越发复杂的运维所累。但无论改造还是新建,数据中心未来的发展路线图一直都在众人脑海中被勾勒,却一直未能有所定论,究竟达到怎样的标准才算是下一代数据中心?新一代数据中心的出现会从哪些角度颠覆传统,震惊世人?
争论不休的定义
过去几年中,国内很多企业,包括电信、金融和制造业的企业,都将精力集中在数据中心的整合工作,把过去分布在不同的业务条线甚至是地域的数据中心进行整合。如今在探讨新一代数据中心应该如何去定义的时候,业内普遍关心的热点问题,也是一个争议相当大的现实问题是:由于其复杂性要精确地定义新一代数据中心、简明概括其主要特征本来难度就不小,特别是要将新一代数据中心定义成具有针对性、先进性和可实施性难度就更大了;另一方面,IT组织、厂商、咨询机构与其企业的关注点不同,也造成了定义的多样性。
中国民航信息集团(以下简称“中航信”)公共信息服务部总经理沈强认为,抛开过于宏观的概况来讲,事实上每一个应用实体对于下一代数据中心的定义应该是完全不同的。他进一步解释,就中航信目前的情况及未来的发展而言,新的数据中心依然需要通过智能化的设备及管理手段实现其更为实际的意义。“2007年开始,中航信已经正式决定新建数据中心,这是由其自身发展所决定的,随着IT技术成为行业的重要支撑,国资委也要求我们承担起为中小企业服务的公共信息平台建设这一任务,在这样的大前提下,新一代数据中心的战略转变已经显而易见。”沈强表示。
与此同时,经验告诉我们,建设新一代数据中心不是简单的拼凑,而是应以用户需求与行业标准主导新一代数据中心的建设。也就是在新一代数据中心建设之前,首先必须真正弄清新一代数据中心的定义、特征、体系结构、核心支持技术以及新一代数据中心的组成方式。这样才能有目标、有标准、有计划地挑选最佳产品、解决方案与服务,开展数据中心的规划与建设,促进数据中心有序演进,而不会盲目跟从和造成投资浪费。
沈强也认为,尽管新一代的数据中心将颠覆传统数据中心的定义,但其高密度配电需求所产生的能耗问题及散热问题依然不可回避。近年来,不少传统大型企业转向管理要效益,这意味着新的解决方案的提出,依然是新一代数据中心不可缺少的组成部分。在此基础上,新一代数据中心应该是基于标准构建模块,通过模块化软件实现自动化无人值守计算与管理,并以供应链方式提供共享的基础设施、信息与应用的IT服务。
高可用性技术变革
在国内数据中心建设中,最早开始的是政府数据集中工作建设的一批数据中心,进而到金融、电信企业,发展到一些大型企业也在建数据中心。目前的数据中心,大概是七八年之前建成的。当时的规划到了今天来看,遇到的瓶颈已经非常明显。国内大型企业数据中心存在四种形态:存储、计算、处理及应用服务,四种形态在不断演化,当前数据中心作为运营服务中心,服务的需求越来越明显了。要向新一代数据中心去发展,其目标就是要把更多资源和成本投向创新,最终要让新一代数据中心具有灵活架构,能满足业务的快速发展。
随着IT网络所承载的价值越来越高,就必然要求IT网络的可用性越来越高。根据可用性的乘数法则:IT网络的可用性=网络平台的可用性×基础设施平台的可用性。我们可以清楚的看到,提高基础设施平台的可用性对提高整张网络系统的可用性有着关键的作用。因此,高可用性技术变革已经成为创新数据中心的总体趋势走向。养生堂有限公司信息总监胡健作为企业应用的代表者,面对新一代数据中心对技术的诉求也坦率地表示:新一代数据中心不是企业或行业中简单的解决方案的复制,而将是以云计算为代表的,基于应用层面的更高层级的技术变革。虽然从现阶段人们所掌握的技术能力来看,想要达到这样的目标并不容易,但从社会层面来讲,这一趋势将势在必行。
一直对于技术变革有着极大兴趣的沈强对此却显得较为冷静,在他看来,倘若短时间内新技术并不能完全取代现有资源,那么以企业服务为单位的数据中心想要不在等待中浪费时间,就不得不继续拿起智能化管理的武器以确保其前进的脚步不受影响。他强调,新一代数据中心对于智能化管理的要求将呈现出空前的热情,智能化将遍布管理的各个层级,甚至水冷技术也将通过自动化完成。其中,虚拟化技术在基础架构上的使用将从最初解决效率问题,产生新的革命。在发展过程中,灵活的架构分配将不再依赖于数据中心本身,转而由更加专业级规范化的解决方案取代。对此,中航信经过3年的技术储备,于2010年4月份利用虚拟化技术完成对现有的100套生产平台进行改造,使得虚拟技术的使用从开发系统延伸到生产系统。除此之外,在规模管理层面上,沈强介绍在事件管理中目前的监控自动化受限于其复杂性往往不能够直接反映出事件本身。因此,通过预警标准化模板,对所有已知事件进行整理编码,进而通过解决方案解决系统构建知识库,将事件解决率从60%提高到95%以上。虽然这些细枝末节在构建新一代数据中心这一话题中,显得有些过于细致,但在反复强调技术的实际应用意义的沈强来看,这些都是新一代数据中心的关键步骤。
在此基础上,我们不妨将下一代数据中心定义成一个整合的、标准化的、最优化的、虚拟化的、自动化的、包含云计算技术的适应性基础设施环境和高可用计算环境。这样的新一代数据中心须要利用最新的IT技术、解决方案与服务才能实现,如服务器和存储虚拟化、虚拟网络连接、智能热量技术、刀片技术、智能散热、数据中心自动化等。而当这一切技术成熟到得以在应用需求中实现价值的时候,新一代数据中心将能满足IT部门对未来数据中心的迫切需求,如标准化、模块化、虚拟化设计,动态IT 基础设施,自动化运营管理,支持业务连续性,提供共享IT服务,快速响应业务需求变化,绿色数据中心等。
社会资源大融合
就像我们在开篇当中说陈述的那样,数据中心在经过了历史上的三次大集中之后,又迎来了新的融合时代,不同于以往的是,新一代数据中心所涉及的融合对于资源的高可用性一样有着极高的要求——这将是一场社会资源的大融合。
今天,中国社会方方面面对IT的需求已经非常之高,除人们意识中的金融业、电信业等传统依赖IT的行业,工业化企业中IT也已成为影响其发展的核心要素。胡健认为,企业内部做信息化的关键就在于资源,集合社会资源,使其成为众多企业能够同时享用又互不干涉影响的共有体。这样一种类似社保系统的新型融合方式会大大提高资源的使用效率,并使更多企业从中实现发展瓶颈的突破。同时,新的融合也提示各大厂商一定要从应用做起,提供切实可行的融合方案。而在沈强看来,即使从人们目前所掌握的新技术而言还不能够全面满足下一代数据中心的要求,但在商务概念领域,云计算依然大有作为,例如在数据挖掘领域中不少厂商都已有所准备。当然,基于下一代数据中心对于资源融合的要求,也势必对有识之士或有成熟技术储备的企业领导形成新的机遇。
综合上述观点,新一代数据中心为我们的企业或机构带来的一系列好处:
降低IT运营成本。融合后的资源将非共享的专用IT孤岛转变为动态管理、集中、可共享的IT资产。新技术的使用可将社会资源集中管理,提高资源利用率,并对资源进行重新部署,企业可按需租用,满足不断变化的业务需求和降低IT成本。传统数据中心设计追求的是性能,而新一代数据中心在当今能源紧缺与能源成本迅猛增涨的情况下必然追求的是能源效率(PUE),提高数据中心空间利用率。在新一代数据中心中,将大量使用节能服务器和节能存储设备和刀片服务器,并通过先进的供电和散热技术(新型电源组件、热量智能、功率封顶、水冷却机柜、紧耦合散热、动态智能散热等),解决传统数据中心的过量制冷和空间不足的问题,并实现供电、散热和计算资源的无缝集成和管理。新一代数据中心将是一个能高效利用能源和空间的数据中心,和支持企业或机构获得可持续发展的计算环境。
自动化远程管理,提高服务质量,降低风险。高可用性的基础设施通过对制定的服务级别标准进行服务质量评估,提供最佳的使用体验,实现资源按需供应。同时,利用各种增强的安全特性,新能源的使用构建并维护IT 环境,使业务及维护风险大大降低。新一代数据中心应是无人值守的、可远程管理的,这种管理涉及到整个数据中心的自动化运营,它不仅仅是监测与修复设备的硬件故障,而是要实现从服务器和存储系统到应用的端到端的基础设施统一管理。先进的自动化功能可以动态地重新分配资源,确保IT与业务协调一致。通过将重复性的任务自动化,IT机构可以降低成本,减少人为错误。自动化,虚拟化和管理的有机结合能帮助IT机构按照预定的计划实现所需的服务等级。管理员只要有一个浏览器,就能通过Internet实现可视化远程管理,也能进行统一的系统漏洞与补丁管理、主动的性能管理与瓶颈分析、快速的服务器与操作系统部署、系统功率测量与调整。甚至,数据中心中的门禁、通风、温度、湿度、电力都能够远程调度与控制。
快速的可扩展能力。在新一代数据中心中,所有的服务器、存储设备、网络均可通过虚拟化技术形成虚拟共享资源池,而被数据中心中的各种应用系统共享。新的集成虚拟化方案通过资源所有权分离手段将硬件拥有者与应用拥有者进行逻辑分离,使系统管理员可通过软件工具快速进行虚拟资源的创建和重新部署,成为IT服务的共享资源。然后,根据已确定的业务应用需求和服务级别并通过监控服务质量来动态配置、定购、供应虚拟资源,实现虚拟资源供应的自动化,获得基础设施资源利用的快速扩展能力。而且,这种资源扩展能力是按不断变化的业务需求实时变化的,或扩展或收缩,形成高度灵活的系统扩展性。
高可用性冗余设计。新一代数据中心其服务不允许有任何的中断。企业或机构的数据中心由于重要信息和核心应用的集中,各种原因的故障或灾难导致的IT系统中断都可能引起业务中断,特别是关键业务系统中断将会对企业生产和机构运营产生重大影响。因此,新一代数据中心特别强调系统中各部分的冗余设计、容错以至容灾设计,使之能确保稳定持续的系统连接,既满足关键业务对系统性能的要求,又能保障企业或机构数据的安全。在新一代数据中心中,建立高度可信赖的计算平台(容错和容灾计算环境)是第一位的,然后是信息安全保障,包括网络安全威胁防范、数据复制与备份、容灾中心建设等措施,从而满足连续服务的高可用性要求。