2014年积极主动的UPS维护是所有数据中心经理的必修课绿色数据中心

2014-02-17    来源:机房360    编辑:litao984lt
每当新的一年开始之初,我们都决心要更好地照顾自己,并制定出保持身心健康的计划。在此,我们也要建议数据中心经理们更加积极主动的进行不间断电源(UPS)的维护,不要再等到

  如果一台UPS出现故障,其结果可能是灾难性的。在Ponemon Institute于2013年12月发布的一份研究报告中探讨了数据中心停机的成本。调查发现,在2013年,企业单次停机中断的平均成本超过627000美元。到目前为止。造成数据中心停机的最大单一原因是UPS故障,占到Ponemon Institute所评估的数据中心停机的四分之一。在数据中心停机所导致的总计4500万美元的收入损失中,由UPS的故障所带来的损失占到了1100万美元。事实上,这其中许多停机中断事故本来是可以通过采取积极主动维护的方法避免的。

  除了保护数据中心免于发生停机中断的事故,积极主动的UPS维护还能有助于其更高效的运行,进而节约了更换零件和能源的资金成本,并让数据中心经理能够对未来进行合理的规划编制预算。

  甚至在不久前,仍然存在着这样的理念:认为花费时间和资金来进行数据中心相关设备的维护和检修似乎被认为是不必要的。数据中心的设施管理人员们并没有意识到,甚至可能某些管理人员至今仍然没有意识到,他们的UPS并非处于休眠状态,并非一直要等到大风暴或地震等灾难降临,正常电源发生故障时才需要用到UPS。数据中心的UPS无时无刻不是处于工作状态的,而这是为了防止正常电源发生变化而破坏服务器。

  UPS:数据中心24/7的员工

  除了防止明显停机中断事故,对UPS的适当维护能够根据不断变化的网格正确调节功率。2012年《纽约时报》一项研究发现,超过80%的数据中心所消耗的电力都用在了保持服务器做好充分的准备,以应对数据或突发性大流量的需求增加的情况。每一天UPS都必须确保持续,稳定的供电,并全天候不间断的控制能量流。

  这种不断的调整占据了UPS工作的一部分,通过UPS的处理,即使几分之一秒的时间内也能处理庞大规模的工作负载,这种操作为组件带来了巨大的应变压力。据美国能源部2007年的报告显示,一家数据中心所消耗的能量比一幢标准的办公楼高出100倍。《纽约时报》的研究推测,在世界范围内,数据中心使用的30GW的电源大致相当于30座核电站的输出。

  所有的电力都是由UPS逐秒进行管理的。因此,积极主动的维护方法是确保您数据中心UPS设备继续保持服务器在峰值时期正常运行,而不会发生停机中断的关键。

  主动维护的定义

  当我们谈到UPS设备维护时,积极主动的维护到底意味着什么?第一步是由经过培训的专业人员进行定期的预防性服务。UPS的基础设施是复杂的。维修和修复他们需要一定的技能和信心,因为他们不能在执行维修和修复工作时将UPS设备关闭。因此,在日常的服务过程中,一个错误的举动也可能触发关机。这项工作是技术和细腻心思的结合。在维修UPS系统领域的经验是提供预防性服务的关键。

  良好的预防性维修将处理整个UPS组件,包括从电池和半导体到布线,电阻器,电容器,断路器,风扇。所有的UPS组件均需要经常保持最高效率运行状态。

  例如,风扇对于从UPS内部结构中移除废热具有重要作用。据艾默生的《风扇排热点可靠性,及其对系统可靠性的影响》白皮书报告中称,一个100千伏安的UPS系统可产生5千瓦到10千瓦的热量。所有热量可导致部件故障,并降低UPS系统的效率,从而提升了能源和更换成本。例如,风扇可从SCR、IGBT和功率模块中散热。一个单一的IGBT如果是由过多的热量破坏损失可达1200美元以上。因此,请务必确保您数据中心的风扇都充分运作,并定期更换以消除昂贵的设备更新费用。

  定期对风扇进行预防性维护能够减轻机械和电气故障的可能性。一个熟练的现场技术人员会记录操作环境的空气温度,这是一种对整体性能的衡量,然后注意清洁和并全面的进行视觉检查,包括全面的清洁配件。电机线圈将被评估,以避免电气故障和机械问题,其可以通过更换过滤器来减轻监测轴承的磨损,并确保风扇叶片和外壳没有被扭曲。对风扇的所有部分进行定期检查,确保其能有效运作,将保持UPS的其余部分在最佳温度环境下运行。

  预防性维护服务有助于削减开支

  预防性维护服务是至关重要的复杂工作,是不能忽略的,尤其是因为除了维持正常运行时间之外,其还能产生经济效益。最直接的经济利益来来自于防止停电,其成本可从每分钟500美元到16000美元不等。第二,一个良好的UPS系统需要一些低成本的紧急服务电话,在某些情况下,可以降低成本达50%以上。最后,当完成定期的维护服务之后,可以让UPS组件的使用寿命比制造商报告的要延长25%至50%,从而减少更换部件的费用。

  此外,预防性维护服务能够保持UPS组件在最佳状态运行,这将降低能源费用。并随着时间的推移,所有这些均有助于带来显著的成本节约。

  跟踪整个系统确保正常运行时间

  对于大型的数据中心而言,UPS冗余是为了避免代价高昂的停机时间,并最大化正常运行时间的重要策略。第三级和第四级中心通过保持多台UPS与UPS的冗余配置并联,在备份设备上提供对备份的备份,满足其业务的正常运行时间目标。分层UPS创建了一个高度复杂的基础设施,需要严格的监测。

  需要做的第一步是严谨的列出一个UPS组成部分的详细清单。编写这样的清单可能是相当繁琐和混乱的,特别是如果有多个站点,或有众多的系统在多个楼层。数据中心团队可以开发其专有软件帮助数据中心管理人员有效的管理整个UPS组合。其包括设备的细节,如序列号、安置地点、维护服务日期,这些信息都实时连接到服务的历史记录,有助于了解操作上的不足及其在线状态。这样的信息为数据中心管理人员提供了实施更加积极主动的维护的一个简单的方法。

  下面的图1显示了一家公司所拥有的跨度若干个全国数据中心的UPS库存模型。如图片所示,这样的一副详细清单允许数据中心管理人员能够通过移动设备或一个屏幕了解整个组合运行状态。管理一个复杂的全面冗余和各种配置要求的系统,需要有一个所有部件的完整视图。如果没有,需要更换的组件可能被忽略,并且,在发生故障的情况下,可能需要更多的时间才能找到发生故障的UPS设备。

  图1、设备清单显示UPS组合的关键信息

  一旦设备清单被创建,管理人员可以通过地理位置、设备处于什么部分或使用年限来分析UPS部件的需求。例如,进一步可以分析各个部分,帮助管理者全面了解每个组件的状态。在图中,搜索有轻微缺陷的部件,显示有7个部件单位,涵盖了全国所有的位置,包括马萨诸塞州,科罗拉多州,明尼苏达州,佐治亚州和加利福尼亚州。这很容易看到重要信息,例如安装和上次维护的日期。这种类型的具体且深入的信息是规划日后的维修,维修和更换零部件的重要工具。

  图2、搜索发现在多个站点存在有轻微缺陷的组件。

  主动维护改善预算编制过程

  规划未来是数据中心成功管理的关键。更换整个UPS对于企业而言无疑是一项相当耗资的决定。而采用主动维护的方法,及时更换零件,并对大修进行规划和预测,从而有助于进行本预测。与此相反,没有彻底的主动维护,会带来意外的部件维修费用,进而产生计划外的费用。

  适合所有数据中心的积极维护计划

  从数据中心整个建筑的UPS单元到地下室的一个小UPS系统的维护,均是为您企业提供安全,可靠的数据中心基础设施的重要组成部分。有计划的预防性维护服务能够确保峰值性能,带来更高的能源效率,有效的预防停电事故。当然,数据中心管理人员也需要利用相关的工具进行未雨绸缪。
 

1
3