戴尔:机房节能缺前瞻性布局
2009-07-21 通信产业网 编辑:李博
整体机房制冷过量,能耗严重现象一直是数据中心面临的最大问题,如何利用最少的能源,带来最大化的制冷量,保证机房的安全运营一直是行业关注的话题。戴尔公司大中华区大企业客户部数据中心解决方案高级经理邢伟凭借其多年的数据中心经验,为读者深度解析如何合理配置机房制冷问题。
一、机房面临的主要能耗问题是什么?
邢伟:在戴尔接触的大量客户当中,绝大部分的机房能耗问题体现在两方面。
大部分的客户都遇到机房局部过热(服务器高温报警)问题,这在夏天的机房运维中更加普遍。机房局部过热的另一个表现形式就是服务器扩容过程中的容量瓶颈。通常客户的机房面积是足够的(每个机架的服务器负载通常都小于5KW),即通过服务器整合可以实现在有限的空间中摆放更多的服务器设备;但随之而来的供配电及制冷容量的瓶颈限制了服务器设备的进一步增加。
能耗问题的另一个表现是机房的能耗过高,这在新建机房服务器部署的初期表现得更为明显。客户通常把配电系统与精密空调系统一次性安装到位,而服务器设备在数据中心建成初期只部署了一部分。由于缺乏整体数据中心机房扩容性的前期规划,造成了整体机房冷量过高,能耗浪费的情况出现。在该种状况下,贸然关闭部分精密空调设备又可能造成局部过热的出现,因而对客户形成了解决方案的两难。能耗过高的另一种表现形式是机房冷量分布不均匀,这就是为什么我们进入许多数据中心机房会发现部分区域过冷,而同时部分区域过热的原因。
二、什么样的耗能问题最容易被忽视?
邢伟:往往当数据中心过热发生时,客户才会从能耗配比的角度去寻求解决办法。即使这样,很多客户也选择增加精密空调设备来简单地达到制冷量提升。一方面这样做会导致走入了能耗问题的另一个表现形式(能耗过高),同时,简单的精密空调设备的增加并不能有效地解决冷量分布不均匀的问题,有时可能会让情况变得更糟。
我们在为一家电信运营商进行数据中心机房改造咨询实施的过程中就发现,起初客户只是一味地增加精密空调设备来应付日益增长的客户服务器托管需求。当精密空调不够空间继续增加时就通过安装吊顶商用空调来进行额外的制冷。直到所有的制冷设备再也不能增加时,客户才转而思考现时的数据中心机房是否有效率,是否存在着能耗浪费而导致的局部制冷不足,并如何通过气流组织与提高制冷效率实现对数据中心的优化。
三、如何有效发现机房耗能严重问题?有什么样的方法论?
邢伟:戴尔的数据中心实施方法论分为四个主要步骤:了解情况(Work-shop),评估分析(Assessment),方案设计(Design)和方案实施(Implementation)。我们通常会了解客户问题的现状并通过现场数据的收集与分析对数据中心能耗问题有一个全面的认识,之后我们通过数据中心送风、制冷、回风等各个方面寻找问题出现的原因。而解决问题的方法又是多种多样,最终选择哪一种方法取决于客户现有服务器设备运行的重要程度(例如是否可以进行停机改造)与现场条件、实施造价等。通常我们会与客户一起讨论得出大家都能接受的解决方案。我们还会对数据中心的制冷能力进行评估,从而判断出现有数据中心冷量在优化方案实施后是否能满足服务器热负载的需要,同时对未来的系统设备扩容是否有冗余支持。
改造的前后对比我们可以通过热成像模拟(CFD)给客户一个直观的认识,并通过软件对实施方案进行预先的调整。在数据中心改造项目中我们不经常使用业界通用的PUE(PowerUsageEffectiveness)作为对客户的能耗改善承诺,因为对于局部过热、冷量不足的数据中心而言,即使较低的PUE值也是不准确的。有些客户往往过于追求PUE的降低而忽略了局部过热的隐患。
四、针对现有条件,运维人员应该从哪些方面来进行节能工作?尤其是在现在持续高温酷暑的情况下?
邢伟:好的数据中心运维管理应该对数据中心的整体应用有全盘的战略布局。这种战略布局不但体现在软件应用、系统配置、管理工具等方面,更体现在数据中心布局、数据中心容量设定(机架级)、数据中心扩展性预留等环节。有了好的数据中心规划与执行,才能保证随着系统设备、系统应用不断增加、变更的情况下还能保证数据中心按照最初的规划进行扩容。这种前瞻性还包括了对未来几年内新技术的应用(如高密度服务器、虚拟化、存储架构整合等)。在节能工作上,运维人员可以运用一些简单的工具来测算自己目前的数据中心是否有效率,是否存在局部过热的隐患,总体制冷量是否足够等。在夏季高温到来前,应尽量对数据中心内部的气流组织进行简单的改造(具备条件的可进行全面评估与改造)以保证制冷能耗尽可能多地用于服务器散热并避免冷热气流的混合。
在实现了冷热气流的隔离并保持回风温度在合理区间后,精密空调设备本身的维护与设定也变得十分重要。许多厂商的精密空调设备在出厂前都设定了高温报警功能,在回风温度被优化后可能会超过厂家设定的报警值,这就需要在改造方案实施前与精密空调厂家进行充分的沟通。同时,较高的室外温度(35℃以上的高温)也会造成风冷空调室外机的热交换能力下降,从而产生高压报警,这也需要机房运维人员在夏季到来前对空调室外机进行检修,并把室外机尽量安装在阴凉通风处,并要求厂家提供足够的技术支持人员与相应时间承诺。
五、为从根本上解决问题,如何进行机房节能优化?
邢伟:首先,应该了解自己数据中心机房的容量瓶颈究竟在哪里,是空间、电量,还是冷量?在找到了瓶颈后,结合未来系统扩展规划,对现有数据中心进行数据收集与分析。目前我们接触的项目中绝大部分的问题不是冷量不足,而是没能结合数据中心的最佳实践对数据中心的气流组织进行优化。许多客户的收益就是经过了数据中心优化服务后不需要增加额外的精密空调设备就可以实现对现有服务器设备的有效制冷,同时还可以对能耗进行进一步的降低。
戴尔的数据中心优化解决方案还包括了虚拟化服务与节能型服务器(如戴尔的定制服务器)的部署,即从根本上降低服务器热负载,从而减少基础设施的能耗压力。结合数据中心基础设施优化解决方案,我们可以为客户在保持现有数据中心计算能力的前提下节约约70%的能耗。