机房协会蔡红戈:国内机房建设和管理现状
2009-10-13 比特网
中国计算机用户协会机房设备应用分会于1994年4月在北京成立,是国内唯一一个在机房技术与管理领域面向计算机机房用户、机房设备厂商、机房工程商的应用技术研究与推广的学术组织。
近日,机房协会副理事长蔡红戈女士应比特网邀请,就当前我国机房行业的发展趋势,所面临的主要问题及未来的发展方向等,进行了探讨。下面是本期访谈的精彩观点:
我国机房建设管理发现现状
主持人:请您介绍一下国内机房建设和管理的几个重要发展阶段历程。
蔡红戈:说到我们国内机房建设的发展阶段,一般来说我们把它分为四个阶段。我们机房协会的专家在几年前就讨论过这个问题。统一的观点是说把八十年代以前的机房,我们称为早期机房,早期机房实际上是因为国内刚有大型计算机的时候,我们根据单个的计算机的运行需求而搭建的一个环境。在我们当时的华北计算所和我们中科院计算所,统一把这种情况叫做计算机场地环境部门。这个场地环境,因为它是为了单个计算机的运行而设置的,当时没有相应的标准和其他的辅助设备,为了它的运行和散热有了制冷的措施,但是实际上并没有恒定温度和保持湿度的这种设备和措施。有了管道的送风。
当时没有UPS而是用稳压器来控制用电。同时当时也没有监控手段,人员管理是24小时多人值班,任何一种断电环境的这种尘埃颗粒包括温湿度的大的变化都可能引起我们计算机运行的终止。值班人员随时准备抢修保证它的继续运行。
到了中期机房八十年代以后,一般说80年到90年这个阶段,已经有了计算机系统。而机房是为一个计算机系统而建设的,这个时候我们国家1982年开始,有了第一本我们计算机场地环境的专著,叫做计算机场地技术。在这个里面对我们的计算机场地的温湿度供电电源质量都有了一定的要求,到了86年就有了我们国内第一本计算机机房的设计标准。80年到90年这个阶段机房的主要特点是说,我们已经引用了恒温恒湿空调,UPS电源,甚至对个别的参数指标也已经有了监控。而且消防已经是我们机房必不可少的手段。同时我们机房的设备的运行情况能够比较稳定的运行几十个小时或者几个月这种,各地当时大批涌现了一些机房的建设。但是当时的网络传输还不像我们现在发展的这么快。所以单个系统,它的计算和业务和异地的业务的连接还是比较困难的。
到了后期机房就是1990年到2000年这个阶段,我们又有了更新的标准。这个时候93年我们国内出台了一系列包括计算机机房的设计规范,施工与验收规模,相应的一些电源的规范和空调施工的规范。比较完善,包括房围的规划也出现了。这个时候我们的机房它的建设有了很多可以参照的标准,同时我们的机架式服务器也大量的出现。这个时候的机房有个标准化的要求,有了温湿度尘埃供电各方面的要求,对机房建设的单位就是我们作为施工方和设计方也有了一定的要求,比较专业。
主持人:您刚才说是中期机房,从九十年代到现在机房是不是进入了一个现代。
2000年以后我们现在统称为现代机房,实际从2000年到现在已经有很长一段时间了。现在机房的特点是说标准化、模块化更易于灵活的扩展,更易于维护和管理。同时在后期随着刀片式服务器随着虚拟化技术的出现,机房也产生了这种多样化的一个趋势。包括我们真正的高热密度机房,计算型的高热密度机房。像我们用户当中的这种国家气象局系统、石油勘探系统,等他们是以计算为主的,密度非常高、热量非常大的机房类型。还包括大型的综合性业务的机房。它的特点是不一样的。但这个时候,机房的主体基本上都是这个机柜了,我们在建设机房的时候。更多的考虑到他以后的扩展,考虑到他合理的布局。
这之后到2005年以后,我们的机房出现了多样化的趋势,包括高热密度的计算型机房,很多规模的综合性的业务的机房和一些现在随着虚拟化技术和我们一些金融企业这种两地三中心的业务的需要,出现了几万平米的大型数据中心。
主持人:您认为在当前机房建设管理的重点和难点是什么?以您的经验来看,企业如何来规避可能存在的一些风险。
蔡红戈:机房建设和管理当中的难点和重点,应该说我们一般把这个机房的整个生命周期分为几个阶段,前期是它的规划、设计。建设当中最重要的是实施。有一个检测环境。在运行之后最重要的就是它的维护管理。整个生命周期来看,最关键和重要的环节是它最早期的前期规划环节。我们一般认为它是非常重要的。因为只有做到了完善前期的规划,对我们今后业务发展的速度和规模有充分的准备,才可能避免今后的环节当中出现了各种风险。在这个前期规划环节中,如果做了很完善的话、有充分的准备的话,通过对需求的分析可以对如何满足它未来业务的需求和它未来的费用控制做好充分的准备。这个费用的控制通常我们包括了:建设的投资和以后运行维护的费用。
主持人:您刚才也谈过机房是经过前期、中期、后期以及现代机房的发展阶段。在您看来,未来机房建设的管理发展趋势会是什么?
蔡红戈:说到未来发展趋势,应该说有几种可能性,还有一个就是对未来的定义。目前看来,我们刚才说到虚拟化技术和金融业数据整合的情况。目前未来的几年内,可能机房的大规模化、大型发展是一个趋势。再远的将来可能会出现新的情况,我认为大的数据中心我认为它有它的管理、能源包括数据安全上的一些隐患存在。在更长远的一个未来可能还是会走上分散。
另外从技术层面上说,我们目前国家的新的机房标准把我们的机房按照可用性、可靠性分成A、B、C三个不同的等级。其中A级是最高等级,它是容错型的,C级是一个基础型的。最基本的。
根据我们机房协会的调研数据来看,目前国内机房最普遍的是C级,最高级的容错型机房实际上是最少的。只有在一些重点行业中,要求全年业务连续不能中断,一旦中断会造成非常大的经济损失和重大的社会影响的情况下,才会需要建A级的机房。A级机房的投资也是非常大的,难度也是非常大的。这种比例比较小,但是这种机房的规模比较大。我认为在未来的发展中,我们的专业化会越来越强。随着业务的发展和业务的需求,我们可能会从最大多数的C级机房,慢慢会变成B级在比重中占得最大。
新兴技术对机房发展的推动
主持人:刚才您也谈到了云计算和虚拟化,这两个技术正在吸引大家的关注。对于机房的管理,您觉得云计算和虚拟化能起到什么作用?我们国内在这方面有什么样的进展?
蔡红戈:云计算已经被沸沸扬扬炒作了好几年了,我也看了些相关的资料。我认为云计算应该比较适合大型的计算型的机房。后来厂家的宣传中出现了很多企业云、私云、公云包括后来现在的一些宣传模式会出现层云的这种技术。在国内我们目前还没有看到它真正实施后的效果和样板。但是我认为如果它真的是可行的话,它未来确实能够使我们的数据中心机房在现有规模上提高它的计算量和业务量。虚拟化技术这两年的出现,其实在我们这个节能和解决数据中心规模说起了很大作用。它使我们的计算系统提高了我们这个系统硬件的利用率。同时也能够使我们这个软件更新更简化。
但是目前在国内的发展也非常的有限,我们也曾经在协会讨论过这个问题。感觉目前它在国内的发展,是在投资上遇到了比较大的阻力。因为虚拟化技术也好,云计算技术也好。实际上它的软件成本会高于我们的硬件成本。而且在我们的新旧系统的组合使用上还存在一定的风险。所以目前这两条技术在国内的应用都应该说是非常的少。而虚拟化技术目前在我们协会了解的实力当中只有嘉实基金这一个机房。因为它是新建的。它在先期规划到后期事实中进行了的准备,使用了虚拟化的技术。由于它是我们目前北京唯一的一个案例,我们还曾经组织我们感兴趣的用户去嘉实基金进行了考察和参观。
专业的机房需要专业的技术人才
主持人:在您看来企业机房建设和管理对于它的参与人员有什么样的要求?目前我们是不是有相应的自知认证可以帮助企业来甄定他们需要的机房管理的相应的专业人才。
蔡红戈:说到机房建设和管理的人员资格是有不同的要求,应该说在机房建设当中对人员的要求是,从前期的规划、设计到实施阶段,需要不专业的专业人才进行合作,进行设计、实施。因为机房工程是一个综合性的系统工程,它包含了十几个不同的专业,包括了供配电、装饰装修、空调通风、弱电、消防等等十几个不同的专业。要想进行这样一个工程建设从计划、设计开始,这十几个不同的专业人员都要有。他们相互的配合、协调,才能完成这样一个工程的设计和实施。但是管理就不同了。我们现在随着机房大规模和自动化大规模的机房建设和自动化无人职守的机房管理模式会要求我们一个大型的机房要用尽量少的人员管理。我们管理人员需要一个人员对机房不同的专业都有一定的了解,能够进行运营维护和真正应急的措施。管理人员综合性素质要求更强。
资格上来说,应该说一些大的行业系统可能都会有一些内部的培训。机房协会近年来也一直在致力于这种人员的培训。从07年下半年开始,我们得到了信息产业部(现在是我们工业与信息化部)的认证。我们在机房规划设计的工程师认证、机房运维管理的工程师认证和现在目前最新要开展的是机房检测评估工程师的认证。这些方面都得到了我们部里大力支持,在全国开展这样的培训,也为我们这些用户和机房管理培养了很大的一批高素质人员。
主持人:一个成熟的机房,并不仅仅是一堆相应机器堆积,等离不开完善的管理。以您的经验来看,企业应该形成什么样的制度在加强管理的同时也不会影响企业业务的发展?
蔡红戈:说到机房的管理制度,应该说,要是用简单的一句话来概括,我们需要一个科学的、可行的、操作性强的、有针对性的制度。说得具体一点是,需要这样一套制度,包括人员岗位制度、运行维护制度,包括应急保障的措施,以及对这些制度和措施的一个审核监督的机制。只有这一套的东西都很完善的情况下,我们才能够说,这种制度对我们真正的机房的运行管理能够起到一定的保障作用。这个制度也不能是千篇一律的,它要根据我们不同机房现有的规模设备情况包括人员配制情况制订。它具有很强的针对性和很高的操作性,才能真正起到作用。
主持人:这个机房作为企业业务在线的桥头堡,往往面临各种潜伏的一些威胁比如说病毒、黑客以及自然灾害的侵袭。企业在机房建设和管理之前,他们应该如何未雨绸缪做好面对威胁的准备?
蔡红戈:您说的这个问题,也是很多用户非常关注的问题。您说到的病毒、黑客、自然灾害,它从我们安全角度来说是针对我们机房不同层面发生的一些问题。比如说病毒、黑客是我们计算机系统的软件层面会遇到的一些问题。自然灾害甚至一些设备故障,它是在我们机房的物理层面、基础设施层面会遇到的问题。实际上不管任何一个层面,一个机房的建设和管理当中,它的安全性和可靠性是我们最基本也是一个最核心的要求。从规划环节、建设环节以至于运行管理环节要对这个机房整体的综合的各个层面进行安全、可靠性的考虑计划。才能保证我们把风险降到最低、风险降到最小。孤立的去考虑比如说黑客问题或者自然问题,可能不太容易或者说不太现实。综合性的从前期去考虑和预防它是我们的建议。
专业的机房需要专业的技术人才
主持人:在您看来企业机房建设和管理对于它的参与人员有什么样的要求?目前我们是不是有相应的自知认证可以帮助企业来甄定他们需要的机房管理的相应的专业人才。
蔡红戈:说到机房建设和管理的人员资格是有不同的要求,应该说在机房建设当中对人员的要求是,从前期的规划、设计到实施阶段,需要不专业的专业人才进行合作,进行设计、实施。因为机房工程是一个综合性的系统工程,它包含了十几个不同的专业,包括了供配电、装饰装修、空调通风、弱电、消防等等十几个不同的专业。要想进行这样一个工程建设从计划、设计开始,这十几个不同的专业人员都要有。他们相互的配合、协调,才能完成这样一个工程的设计和实施。但是管理就不同了。我们现在随着机房大规模和自动化大规模的机房建设和自动化无人职守的机房管理模式会要求我们一个大型的机房要用尽量少的人员管理。我们管理人员需要一个人员对机房不同的专业都有一定的了解,能够进行运营维护和真正应急的措施。管理人员综合性素质要求更强。
资格上来说,应该说一些大的行业系统可能都会有一些内部的培训。机房协会近年来也一直在致力于这种人员的培训。从07年下半年开始,我们得到了信息产业部(现在是我们工业与信息化部)的认证。我们在机房规划设计的工程师认证、机房运维管理的工程师认证和现在目前最新要开展的是机房检测评估工程师的认证。这些方面都得到了我们部里大力支持,在全国开展这样的培训,也为我们这些用户和机房管理培养了很大的一批高素质人员。
主持人:一个成熟的机房,并不仅仅是一堆相应机器堆积,等离不开完善的管理。以您的经验来看,企业应该形成什么样的制度在加强管理的同时也不会影响企业业务的发展?
蔡红戈:说到机房的管理制度,应该说,要是用简单的一句话来概括,我们需要一个科学的、可行的、操作性强的、有针对性的制度。说得具体一点是,需要这样一套制度,包括人员岗位制度、运行维护制度,包括应急保障的措施,以及对这些制度和措施的一个审核监督的机制。只有这一套的东西都很完善的情况下,我们才能够说,这种制度对我们真正的机房的运行管理能够起到一定的保障作用。这个制度也不能是千篇一律的,它要根据我们不同机房现有的规模设备情况包括人员配制情况制订。它具有很强的针对性和很高的操作性,才能真正起到作用。
主持人:这个机房作为企业业务在线的桥头堡,往往面临各种潜伏的一些威胁比如说病毒、黑客以及自然灾害的侵袭。企业在机房建设和管理之前,他们应该如何未雨绸缪做好面对威胁的准备?
蔡红戈:您说的这个问题,也是很多用户非常关注的问题。您说到的病毒、黑客、自然灾害,它从我们安全角度来说是针对我们机房不同层面发生的一些问题。比如说病毒、黑客是我们计算机系统的软件层面会遇到的一些问题。自然灾害甚至一些设备故障,它是在我们机房的物理层面、基础设施层面会遇到的问题。实际上不管任何一个层面,一个机房的建设和管理当中,它的安全性和可靠性是我们最基本也是一个最核心的要求。从规划环节、建设环节以至于运行管理环节要对这个机房整体的综合的各个层面进行安全、可靠性的考虑计划。才能保证我们把风险降到最低、风险降到最小。孤立的去考虑比如说黑客问题或者自然问题,可能不太容易或者说不太现实。综合性的从前期去考虑和预防它是我们的建议。