APC:解决高密度服务器部署所致冷却问题
2010-08-06 中国IDC产业联盟
中国IDC产业联盟讯 对数据中心管理人来说,采用单个机架来部署高密度服务器的要求是一个挑战。 商家们目前设计的服务器,如果安装在单一的机架上,则需要高达20kW的冷却。 在平均冷却能力为每一机架不超过2kW的数据中心,需要采用一些创新的冷却策略。 本白皮书介绍提高冷却效率和冷却能力以及提高现有数据中心密度的十种方法。
1. 实施“健康检查”
就像定期检修会对汽车有好处一样,对数据中心的维护使其能够在最佳效率上运行,以保证其可以胜任商务过程,防止将来发生问题。 在进行昂贵的数据中心升级以解决冷却问题之前,要进行一些检查来鉴别冷却基础设施的潜在问题。 这些检查可以明确数据中心的健康情况,以避免和温度相关的电子设备故障。 检查亦可用于评估今后适当冷却能力的可用性。 报告当前的状态和建立原始数据档案,以便作为今后改进的依据。
2. 着手指定冷却维护方法
据Uptime Institute2报道,在其参观的数据中心中,有50%存在着冷却不足的情况。 尽管统称为“冷却不足”,但在某些情况下却是由于执行维护工作不当或缺乏维护制度所造成的。定期维护和预防性保养对数据中心对其最佳性能工作至关重要。
3. 在机架中安装挡板,制定机架缆线管理方法
如在机架柜内存在着没有利用的纵向空间,则从设备流出的热空气可通过“短路”返回到设备的入口。 这种没有控制的热空气循环造成了设备的不必要发热。
4. 清除下地板障碍物和密封地板
在有高架地板的数据中心,下地板用作分配管道或导管来作为冷却空气的路经,使冷却空气从CRAC单元流到机架前的带孔地板砖或地板栅栏。 这一下地板也常常用于安装其它设施如电力线、光导线、网络线缆,在某些场合还用于安装水管和/或火警探测和灭火系统。
5. 将热机架分开
如果高密度机架紧密聚集在数据中心的地板上,则大多数冷却系统的冷却能力都不够用。 将这些机架在整个地板区域上分开布置,可以缓解这个问题。
6. 实施热通道/冷通道布置
除极少数例外情况以外,绝大多数机架安装服务器的设计为从前面吸入空气,从后面排出空气。 如果机架都朝向一个方向,则第一排机架排出的热空气在通道中将和供应空气或室内空气相混合,然后进入到第二排机架的前面。
7. 重新对齐CRAC单元
CRAC单元的空气排放管必须正确对齐,以优化到地板栅栏的冷却空气路经。
8. 管理地板通风孔
机架气流和机架布局是实现冷却性能最佳化的关键因素。 然而,地板通风孔的位置如果不当,可造成CRAC空气在进入负载设备前和排放的热空气相混,从而成为前述冷却性能不佳和费用增加的原因。 送气和返回空气通风孔位置不当的情况非常普遍,并且使得热通道和冷通道设计的种种优点丧失殆尽。
9. 安装气流辅助装置
在有足够平均冷却能力,但却存在高密度机架造成的热点的场合,可以通过采用有风扇辅助的设备来改进机架内的冷却负荷,这种设备可以改善气流,并可使每一机架的冷却能力提高3kW到8kW。 这些设备,如APC的空气分配单元(Air Distribution Unit, ADU)和空气迁移单元(Air Removal Unit, ARU)可有效地从邻近空间“盗取”空气。
10. 安装自给高密度设备
如果采用纵向气流,当一机架内的冷却需要超过8kW时,要向各个服务器的前面提供均匀的冷空气将会越来越困难。 在密度非常高的场合(每一机架超过8kW),要采用平行冷空气供应,以便使得从上到下的温度能够保持一致。 自给高密度冷却系统设计为在数据中心安装,同时也不影响其它机架或现有的冷却设备。 这些系统是“房间中性”的,可以自房间内吸取冷却空气,并将相同温度的空气重新排放到室内,也可以在封闭的柜内使用自己本身的气流。
在数据中心安装最新的IT设备,如刀片式服务器,有着众多的优点。 但是,这些设备的能量消耗量每一机架为现有设备的2至5倍,相应的散热量也会加大,这一点已成为停机的潜在原因。 为有效地避免设备故障和不明原因的速度缓慢,并延长设备的使用寿命,制定定期的健康检查计划比过去任何时候都更加重要,以便确保冷却设备是按照所设计的容量、效率和冗余运行。 采用本文所介绍的各个步骤,可以使得数据中心能够在其峰值效率运行,以保证其可以胜任商务过程,防止在将来发生问题。