为什么要建设新一代数据中心?
2010-01-11 比特网 编辑:朱伟雄,王德安,蔡
“数据中心”是人类上世纪在IT组织应用推广模式方面的一大发明,标志着IT应用的规范化和组织化。今天,几乎所有大中型机构(政府部门、企业、科教院校…)都建立了自己的数据中心,全面管理本机构的IT系统。覆盖全球的Internet和无数机构的业务实际上是在大量数据中心支持下运转的。各种数据中心已经成为交通、能源一样的经济基础设施。当前的形势是,人类社会在得益于数据中心的同时、也受到利用传统技术建立起来庞大数据中心资产的种种困扰,在成本、因变速度、安全、能源消耗等方面面临着一系列严峻挑战。人们普遍的共识是:传统的数据中心已经不适应全球化时代对IT技术的许多新要求,必须进行革新,否则就会走向反面,成为阻碍IT发展的因素。
因此,建设新一代数据中心。这成为人们普遍关心的热点问题。许多人都在问:为什么要革新现有的数据中心、建设新一代数据中心?什么是新一代数据中心?怎样建设新一代数据中心?人们从国内外许多媒体上都可以感受到对这三个问题的普遍关注。这三个问题融合在一起就成为一个关乎IT产业和应用全局的问题:“推动数据中心革命、建设新一代数据中心”。
令人欣慰的是,有关的理论和实践正在逐步成熟,惠普公司最近组织出版的《新一代数据中心建设理论和实践》一书[1]就是一个实例。我们的系列文章也将以此为范本,探讨新一代数据中心的起源、设计思想、建设规划和方法,并介绍多个帮助应对挑战的实施解决方案。
现有数据中心面临的困难和挑战
随着企业全球性竞争的加剧,传统数据中心设计理念的局限性也逐步暴露无遗,使它们面临一系列严峻挑战,在许多方面已经不适应全球化时代对IT技术的新要求,
1.降低成本的挑战
当前低迷的经济和剧烈的竞争要求企业大幅度降低成本,而许多数据中心的运行成本却反而在不断攀升。据专家分析,在今后的五年中,企业在管理和运作IT系统方面的成本将是其直接购买系统成本的三倍;使人们更加难以忍受的是许多服务器未能得到充分的利用。在很多企业的数据中心中,CPU使用率均低于25%; IT资源利用率也仅为20%左右。显然,如何降低人力成本,如何降低IT总体拥有成本,如何提高IT的投资回报,是摆在企业CEO、CIO们面前的重要课题和当务之急。
2.加快应变速度的挑战
目前企业业务变革的速度正在日益提升,一方面变革产生的各种风险随之增加,因而IT系统以更快的响应速度和更有效的应对措施,来降低这类风险也就变得愈加重要。另一方面,变革速度的加快给企业数据中心带来时间上更大的压力,这也迫使企业IT系统提高响应速度。
3.业务连续性和灾难恢复的挑战
局部的突发性灾难事件,如地震、洪水、飓风、火灾或者恐怖活动等,都可能对企业或机构的业务产生重大影响,导致公司收入减少,利润下降甚至失去客户。而重大灾难事件则很可能导致公司一蹶不振乃至倒闭。根据权威统计,在经历突发性的重大灾害后,有大约43% 的公司倒闭,还有另外51% 的公司也会在两年之内倒闭。
而当前许多企业或机构数据中心不能正常应对内外部的许多安全性挑战和威胁、满足业务连续性&可用性的要求,往往由IT故障和各种灾难使得企业停止提供服务,造成很大的损失。据统计,许多企业10%的成本开支是由于IT故障造成的。
4.能耗与空间方面的挑战
随着计算设备的更新换代以及高密度计算设备的广泛应用,企业在能耗和散热等能源管理方面对数据中心提出了新的要求。另一方面,企业的业务发展也对数据中心资源的要求致使服务器和存储的数量大幅增长,给数据中心在环境控制、电源与散热、空间管理等方面造成了巨大的压力。机房成本上的因素又限制了服务器机架占用的地面空间。因此,各企业都不得不在传统的低密度机架和发热量及功耗极高的高密度机架之间寻求一种平衡。如何能在有限的空间实现更有效的能源和环境管理,是企业数据中心面临的关键挑战之一。据美国环境保护局估计,在未来的五年内,服务器的能耗将增加一倍。服务器功率密度每年增长四个百分点。对于大多数类型的服务器,每单位服务器的热负荷都在不断攀升。由于能耗不断增长,数据中心的成本也随之提高。到2008年,一台服务器的能源成本将超过服务器的购买成本。过去,相对于IT 设备的购买成本,许多企业都将电源和散热成本忽略不计。如今,情况大为不同,能源和散热成本已严重失控,迫使数据中心必须立即对能耗管理作战略性变革。
现有数据中心的设计思想是困境根源
传统的数据中心之所以逐步陷入困境,决非偶然而是有其深层次原因的。什么是传统的数据中心?我们可以把传统数据中心的基本设计理念和特点归纳为面向物理设备和单个项目的静态资源管理和供应。其主要特点是:
1.静态的物理资源管理
传统数据中心的设计目标是能够持续工作,设计者们奉行的是“维多利亚女皇时代”的设计思想,要求所设计的产品能够用几百年不损坏、保持正常工作。设计者心目中的数据中心是一大堆物理设备孤立的堆砌;事实上,建立传统数据中心最初的动机,就是管理好日益增多的物理设备,保持良好的环境,不要损坏和丢失,出了故障有人维修。
2.静态的工作负载管理
资源孤立和不能共享、工作负载静态管理,不能在整个数据中心实时、动态调度,是传统数据中心资源利用效率低下的根本原因;不仅服务器工作负载是静态的,而且网络和存储系统的工作负载也是如此,造成各种资源利用效率的全面低下。
3.项目& 应用/基础设施静态耦合
传统数据中心许多部件都是紧密耦合的,牵一发而动全身,很难作任何改变。其内部形成许多基于单个项目需要而建立起来的一个 “项目孤岛”,从服务器、网络和存储所有资源都与单个项目静态地捆绑在一起、成为孤岛架构的系统。
传统数据中心这种静态的结构,带来了一系列严重的实际问题。例如:
复杂结构和昂贵开支:为了满足应用需求,传统数据中心自建立之日开始就不断扩展,基于不同时期技术的扩展(再加上人员变动),使得传统数据中心(以及一些以传统模式建立的系统)结构变得十分复杂,不仅管理和维护费用十分昂贵,而且几乎成了内部结构谁也不清楚的“黑箱”;
面向解决问题的被动管理:传统数据中心问题成堆,管理人员不得不处于应付、疲于奔命的被动状态;
漫长的实施周期:基于传统数据中心开发新应用周期很长,往往延误新应用和新产品上市的时间,失去了许多宝贵的商机;
消费中心:传统数据中心中瓶颈经常变化,不得不周而复始地更新和扩展各种设备,使之成为机构花钱的中心,CIO主要任务之一往往是向CEO要经费;
人工操作:传统数据中心很难实现自动管理,不仅如此,往往还不得不不断增加管理人员,使得管理费用成为机构的沉重负担;
建设新一代数据中心势在必行
从数据中心内部计算机应用模式发展历史来看,从最早的大型机、服务器 /客户机(Server/Clinet)模式、到今天的网络计算环境、今后的云计算环境,一浪一浪向前发展。革新传统的数据中心技术、建设新一代数据中心反映了数据中心技术的发展规律。
在“瞬息万变”和“适者生存”的全球化时代,传统数据中心失去了活力,同样必须加以变革。任何头痛医头,脚痛医脚的局部方法,都是不能根本解决问题的,唯一的出路是改革,建设新一代的数据中心!当前改造原有数据中心、建设新一代数据中心,已经形成一股席卷全球的新浪潮,造成了空前巨大的市场机遇。调研的结果发现:到2010年,一半以上的数据中心将迁移到新机房中;今后10年内,40%以上的数据中心将被更换。
数据中心革命任重而道远
在我国,随着信息技术的推广应用,许多机构都在计划改造原有的数据中心或者建设新的数据中心。但是革命的步伐还需要进一步加速。有些CEO往往担心影响当前的业务,希望等待新技术的进一步成熟。有些CIO往往不想改变自己一手建立的IT基础设施。此外,还有资金约束、习惯势力作怪以及对修补传统的模式存在幻想等方面原因,也可能会阻碍革新的迅速实施。中国社会不能走西方“先污染后治理”的老路。数据中心的建设也应当早日吸取西方发达国家的经验教训、走革新和跳跃式的发展道路。
当前要认真解决的一个思想问题是把革新数据中心作为负担,而不是机遇。事实上,建设新一代数据中心不仅是一个挑战,而且是一个很大的机遇。从挑战角度来看,传统的数据中心造成了一系列弊病,只有改弦更张才能克服这些弊病。传统的数据中心是我们辛辛苦苦建立起来的,投资也非常大。但是其历史作用已经完成了,必须加以革新,而革新后建立的新一代数据中心,将为开发创新应用开辟广阔的道路。传统的数据中心已经走到了“山穷水尽”地步,只有进行根本性的革命、建立新一代数据中心才能进入“柳暗花明”的佳境。这也是本文的主题和目的。
参考资料
[1] 《新一代数据中心建设理论与实践》,朱伟雄,王德安,蔡建华编译,人民邮电出版社出版,2009年8月。