数据中心关键任务环境中的预防性维护运营维护

2010-09-14    来源:UPS与机房    
预防性维护是一个用词不当的说法!定期润滑的机械设备和其它检查实际上可能没有防止故障,因为严重的内部故障和电超载可以很长一段时间不引人注意。一个更有效的维修计划是必要

  预防性维护是一个用词不当的说法!定期润滑的机械设备和其它检查实际上可能没有“防止”故障,因为严重的内部故障和电超载可以很长一段时间不引人注意。一个更有效的维修计划是必要的,用来支持关键设备,这些关键设备是用来维持数据处理中心或数据存储设施不间断运行的。

  电机、水泵、暖通空调装置、制冷机、电控机柜和配电板很少在没有任何警告下,发生故障!更多的,往往不是即将衰竭的迹象,如振动水平提高或内部温度高,在日常的任务中不会引起注意。然而,结果可能是灾难性的。

  有关旋转机械和电气设备的健康往往是隐藏在设备的一些信号中,使用振动监测与分析技术以及红外温度记录就能够发现问题。如果得到适当的解释,这些隐藏的迹象能够查明问题的性质、位置、甚至发展中的问题的严重性,以便及时采取措施,以避免数据和投资的损失。

  虽然每一个数据中心备份最近的资料,并保持冗余系统,以防止不可替代的数据的损失,但是,你的全天候运行可能永远不会考虑一个小故障导致设备关机的可能性。然而,及时发现在电机、水泵、风机、或其它机械设备中的潜在的不良因素,能够避免灾难性的故障,并能够为您节省数千美元。

  预防性维护

  有时被称为以可靠性为中心的维护,预防性维护大大超出了普遍对预防性维护可以接受的规则,根据设备要求的条件,只在必要时履行服务。如果故障是迫在眉睫的,该装置可能需要立即修理或更换。如果性能没有明显退化,有可能拖延修理,直到可以安排备份,以避免失去的时间。

  机械设备健康管理执行这种办法,又向前迈进了一步,按照每台机器对运行的重要性,将机器区分出先后次序。然后,给最重要的机器更多的照顾,以确保它们正常运行。例如,振动监测是更加频繁了,而且在某些情况下,对必须连续可靠运行的关键设备,可安装连续在线监测装置。对于重要性差一些的支持设备,对振动数据的收集进行得较少。

  监测所产生的信息被收集起来,这些信息被分析师和维修管理人员用来预测很可能发生的问题。用这种方法,可以在需要时安排维护(在问题变得严重得足以对设备设施性能产生不利影响之前)。

  预防性维护已被证明在行业中,作为一个重要的方式,用来改善效率,同时降低维修费用和意外停机情况。

  实施基于对机器健康的监测的预防性维护项目,发现在数据中心和存储设施中的问题,通过及时修理,极大地减少了停机时间的风险。

  优先权1:要求立即修复行动;

  优先权2:要求尽早修理;

  优先权3:允许在方便的时候,安排维修。

  优先权4:起作用

  优先权5:预防性战略。

  优先权4和5的情况是:一般保留没有处理关键任务的设备,这些设备如果发生故障,只会导致很小的损害或根本没有损害。

  在所有情况下,确定潜在问题的结果,用较低的成本,进行较好的维护。

  可靠性挑战

  在信息技术时代,为了管理好一个机构的核心业务和工作的数据,数据中心必须可靠地处理事物及存储重要的电子信息,以便一个现代化的企业和政府能够有效地运转。在服务器机房、数据中心及UPS系统中,关键的机械和电子支持设施包括:

  ♣用于控制温度和湿度的暖通和空调装置;

  ♣用于冷却和除湿的冷却器;

  ♣用于冷却器和暖通空调制冷装置中除热的冷却塔;

  ♣支持冷却设备的泵;

  ♣作为备用电源的的发电机组;

  ♣电控制柜、电动机控制中心和开关装置;

  ♣不间断电源(UPS),自动转换开关;

  ♣配电板。

  防止设备故障

  振动分析是一种非侵入性的技术,通过用户在机械上附加频谱分析仪,记录波形信号。分析这些数据,使我们能够诊断:

  •轴承、皮带、联轴器,齿轮及支持结构中的机械磨损情况;

  •不平衡和失调情况;

  •其它缺陷,如:润滑油失效,轴弯曲,电机转子断条,共振等等。

  结论

  在没有停机余地的情况下,数据中心需要有一个战略,以确保支持设施的可靠性。恶化的机械可能会导致严重的问题,利用先进的、在关键任务环境中的预测技术,可以避免这些问题。

  最好的做法是对重要的设备使用预防性维护方法,状态监测是可行的。通过采用红外温度记录和振动监测,您可以观察重要支持系统的健康情况,以便发现即将发生的故障,将一场灾难的风险降到最低。

1
3