数据中心物理基础设施的测试与验收机房建设

2010-09-20    来源:UPS与机房    
在UPS前面安装带漏电保护器的空气断路器是不恰当的。如果用户坚持要装,为了可以起动UPS,将所有的抑制共模干扰的电容器全部取消,但这样做都会带来不良结果。

  1漏电保护开关误区的代价

  漏电保护开关是为了保证人身安全而采取的措施。但如果使用不当就会带来很多麻烦,甚至造成损失,这在数据中心建设中不止一个例子,这个问题不解决,以后还会出现类似事件。

  1.1为什么UPS前面不能加漏电保护开关

  有不少用户为了人身的安全要求市电供电系统输入加漏电保护开关,但当具有此功能的开关加上后,UPS一旦开机,开关就跳,不少人认为是UPS漏电。是不是漏电呢?

  由于UPS的前置低通滤波器中已接入抑制共模干扰的电容器。这两个电容尤其是CLE,在加电瞬间会有很大的电流流入地线,一般这个电容器的容量都在1μF以上。从图中可以看出,漏电保护器传感变压器输入是火线电流IL,输出是零线电流IN,输入输出绕组的方向是按照磁通抵消的原则绕制的,铁芯上还有一个次级绕组e,漏电保护器不跳闸的理想条件是:IL=IN。这时由于变压器内磁通等于零,即Δφ=0,所以感应电势e=0。但在加电瞬间由于这个电容CLE的瞬时短路,就有一个很大的电流ILE直接入地E,使得IL≠IN,Δφ≠0,e≠0,使空气断路器的执行机构跳闸断电。这就是跳闸的原因。

  总之,在UPS前面安装带漏电保护器的空气断路器是不恰当的。如果用户坚持要装,为了可以起动UPS,将所有的抑制共模干扰的电容器全部取消,但这样做都会带来不良结果。

  1.2某大型机房措施的误区与代价

  在我国有几个大型机房是由外方设计的,由于加了漏电保护开关使UPS无法起动,几经商榷而达不到共识。在无奈的情况下,经专家认可后就在UPS前面加装了隔离变压器B,这样一来UPS加电跳闸的问题就解决了。为什么在UPS前面加装了隔离变压器B后就不跳闸了呢?UPS加电跳闸的问题解决了会不会仍满足“突出以人为本”的功能呢?

  由前面的分析可知,在UPS起动时所以使带漏电保护器的断路器跳闸就是由于抑制共模干扰的电容所致:在UPS开机时除了正常的机器用电流(这个电流的输入值IL等于零线上的返回值IN)外,还有一个经过CLE返回地的电流ILE,而这个电流只从火线进入而不经零线流回,所以才造成入出电流不一样的差值。加入如图2所示的隔离变压器后,如果变压器B的次级绕组不接地,输出电压就是悬空的,因此抑制共模干扰电容CLE的两端就没有电压,因此也就没有电流ILE产生;如果变压器B的次级绕组接地,就相当于CLE和CN2并联,形成了抑制常模干扰的较大容量的电容,接地点只是一个参考点,不会有电流流过。

  对于变压器B的初级绕组而言,因为只有一个回路,所以IL=IN是必然的,因此UPS开机跳闸的问题解决了。

  但变压器B的加入隔断了输出与开关S的联系,而且在实际应用中都把零线接地,如图中虚线所示。在这种情况下,就相当于输入市电,仍能形成人员触电回路,这时再也不能保护了。如果变压器次级零线不接地,又是很多用电设备绝对不允许的,至于将抑制共模干扰的电容去掉的危害是明显的,因为取消了共模干扰抑制的功能。

  其结果是加了变压器B后,漏电保护开关就不起任何作用了,该出现的人身触电事故照样出现。还不仅如此,由于供电主干路上多了两个串联环节,不但多占用了资金、多占用了机房面积、多了一份功耗,还就多了两个故障点,使系统供电可靠性大打折扣。这就是误区的代价。

  1.3对普通电源变压器的误解

  在建设数据中心机房中有不少地方要求必须加隔离变压器,甚至UPS的输出也必须有隔离变压器。其理由是电源变压器可以抗干扰、可以缓冲电流的突然变化、可以抵抗电网电压的大范围变化和冲击,等等。将这个变压器说得神乎其神。实际情况并非如此,电源变压器的真正功能就是两个,变压和产生隔离接地点。在三角形变星形结构中虽然可以消除3次谐波,那只是在线电压上,220V的相电压享受不到这个好处。在此仅对前两个说法简单说明一下。

  1)电源变压器可以抗干扰之说

  最简单的知识:抗干扰的功能必须由非线性器件来实现,而变压器在正常工作时是呈线性的,目的是保证初级和次级电压波形不失真。而线性器件是不抗干扰的。另一方面,若变压器抗干扰,它必须有分辨干扰的能力,但它根本就不具备这个功能,也就不抗干扰。不要把变压器看成是低通滤波器。

  2)可以缓冲负载电流的突然变化之说

  众所周知,IT设备的工作电流是在变化中工作的,也许一直是用100A电流在工作,有时就会突变到200A,如果此时变压器给缓冲一下:就是不提供200A,仍然送出100A,“缓冲”一段时间后再给出200A。如果真是这样,这些正在正常运行的IT设备非出错不可,甚至停机。像这样的变压器还会有人要么?……

  所以数据中心不一定非要变压器不可,变压器的重量大和体积大并不代表功能多。一般多用变压器产生隔离地,以减小原来的零地电压。

  2数据中心的防雷与接地

  验收机房的第一个目标就是接地环境,如果接地不理想就会给中心的正常运行带来好多麻烦,现代机房一般都和建筑物共地者多,所以一般要求接地电阻要小于1Ω。良好的接地对防雷很重要,可使强大的雷电流顺利泄漏入地。

  2.1机房接地的必要性

  计算机系统运行的稳定性在很大程度上取决于供电系统的稳定性。有些干扰问题也一直在影响着用户的情绪,如电网电压不稳定,零电位漂移数十伏,直流地极阻值大于1Ω,地极引线绝缘损坏以及地线截面积小于50(mm)2,等等。我国区、县级电力系统运行条件比较差,使得UPS输出零电位对直流地之间电位差大于1伏乃至数十伏,这将导致一些计算机系统无法投入运行。那么在UPS又未选配隔离变压器的情况下,能不能使UPS的输出“零、地“电位差达到用户希望的小于1伏呢?回答是肯定的。UPS系统是独立的工作系统,系统负载工作稳定,而且还可以均匀地分配在三相回路里;当UPS输出末端插座零、地之间电位差大于1伏而小于4伏时,可使UPS工作零线二次重复接地;当UPS输出回路零、地电位差大于4伏时,首先应检查零线高电位是电力系统引起的还是UPS自身产生的。当零线电位漂移大于4伏时,一般都是电力系统产生的。由于电力系统电压波动大、三相负载平衡度差,从而造成零点电压漂移大于4伏,在这种情况下,仅靠二次重复接地是解决不了问题的。如前所述,由于UPS是一个独立负载系统,三相和单相负载当然是自成负载回路,那么UPS工作零线可以与电网工作零线断开而独立接大地。UPS工作零线独立接大地有两种接法:一种是可以接独立地极,该地极阻值小于3.5欧姆即可。另一种是接到直流地极上,从直流地极上接出两根截面积大于50(mm)2的导线,将这两根导线同时引入机房分电柜中,并分别接到直流地极母带和UPS工作零母线上即可。由于计算机各厂家对计算机零、地接法的要求不同,像CYBER系列计算机在机房进线入口处把直流地、安全地、交流工作地等要求接成一点;而IBM就不允许诸地接成一点,而且UPS专用插座上零、地之间电位差必须小于1伏,否则就认为场地供电系统不合格。

  2.2计算机房对干扰的接地防护

  计算机系统运行不稳定的另一个因素是机房静电及空间强电磁场的干扰。现代机房如何避开这些干扰是高可用性机房中必须重视的问题。机房产生静电干扰,主要是机房的湿度偏低所致。因为静电地板里的氯分子具有很强的吸湿能力,可改变静电地板的电阻值。当机房湿度<30%时,抗静电地板呈现高阻抗(>1010欧),人在机房中行走时会产生>1000V的静电电压,这个电压难于对大地释放。这时如果人体接触MOS电路,就很容易击穿组件模块。所以,计算机机房在干燥季节应通过加湿系统将机房湿度调节到>35%,才能减小静电对计算机的影响。机房空间电磁场的干扰主要来自机房内部动力源电磁场和外部空间电磁场,故内部动力线应敷设在远离弱电系统的金属线槽内。至于外部空间电磁场,因现代机房已走向金属化维护结构,机房六面体(彩板墙体、金属吊顶和金属地板)的金属骨架采用的是网状组合并接大地,这样不仅可满足机房安全接大地的要求,而且对雷电等干扰也具有一定的屏蔽效果。

  建筑物结构金属网与各地共点接大地的情况。该建筑物的防雷系统是双层保护系统,外部空间是避雷针引下线保护,建筑物维护结构是金属骨架共点综合接地,也叫一点接地—等电位接地。等电位接地是当今机房接地认可的一种保护方式,机房里等电位接地不是把各种地(如保护地、交流地、直流地等)直接接成一点,而是通过等电位体接到一点。正常情况下各种地是独立接大地的,只有雷击或浪涌电压冲击时等电位体才被击穿,从而各地才对大地形成一点接大地的等电位。这时,外部的交流、通信、网络和天线等传输线路引入的浪涌冲击均会被大楼结构地吸收。所谓结构地就是机房外围结构金属骨架的网点化接地。而金属顶板、彩钢墙体和活动地板等金属体,均被安装在这些骨架上。因此这种等电位接地的方式不仅可避免浪涌电压的袭击,而且也隔离了空间电磁波及其相互之间的干扰。需要注意的是,直流地极应尽可能距离防雷地极15m远以上。

  2.3供电系统的保护

  电在架空线的远距离传输过程中会受到外界因素的污染,尤其是雷电的污染更为严重。所以,在电网电压接入机房时,需要在入口处安装防雷器或称浪涌吸收器,如图4所示就是供电系统的三级保护方案。需要注意的是,两个防雷器或浪涌吸收器的距离应大于15m。从图5中可以明显地看出,经过三级防雷器抑制后的浪涌电压幅度已衰减的很小了:第一级将6000V以上的浪涌电压的幅度抑制在3000V以下,第二级又将其压缩到2000V以下,第三级将上述幅度控制在1500V以下,达到了机器可接受的输入程度。以上三级防浪涌器件的反应时间都必须<25ns。而且这三级防雷器应安装在配电柜内。

  在加防雷电浪涌措施时,市电总开关柜首当其冲,一般都要安装一级或二级防雷器,对于UPS输入柜和UPS输出柜则是二次、三次保护。所以,在远离大楼电源输入端的小型机房(小于150m2)里一般可不安装防雷器,因为若安装级数过多,反而有时会引起UPS输出系统宕机。

  计算机场地建筑有的位于外部直接雷击区、雷击冲击波干扰区、电线电缆感应区及浪涌电压引入区等,为此应根据不同的情况采取不同的措施。对于直接雷击区不仅要有良好的防雷天线,而且要有良好的天线引下线(比如在大楼柱子中,焊接良好的钢筋是理想的引下线)接至防雷地极网(电阻≤10Ω)。对于雷击冲击波的防范,一般可采用等电位体连接方式。在这个例子中,将机房中的电源线(220/380VAC)外皮、C&I或EDP电缆外皮和通信电缆外皮,以及水管、燃气管和阴极保护的输油管等,通过等电位连接体同时接到基本接地极上。而电源线和信号线又通过各自的保护器连到等电位接地体。

  同电位接地网的形式与接公用网的情况。上面两个图是基本的等电位连接网形状,下面两个图是将各等电位连接网接到公用接地系统等电位网的情况。对强磁场感应区要采用屏蔽接地(机房结构金属体及线缆桥架良好地接地,屏蔽接地极网电阻<1Ω,桥架接地极网电阻≤3.5Ω);对线缆浪涌电压要采用浪涌保护装置(接地极网电阻≤3.5Ω)等。

  3数据中心机房物理基础设施的验收

  3.1物理环境的验收

  查看了接地与防雷后,还要看机房的布局和隔断是否符合消防要求;就可以看一下机房的保温措施;空调机的排水系统,不少空调排水系统的排水槽不规范,主要是槽的坡度不是向出水口倾斜,而是相反,造成积水现象;新风室是否合乎要求;测量机房的气压是否为正压;地板下是否有灰尘;地板下的布线是否阻挡了风道;地板的风口是否能防止老鼠之类的进入;机柜的排列是否冷热风道分开;IT柜内是否将可使气流短路的空位用盲板隔开;IT柜内的设备功率是否符合这种制冷方式的散热等。

  3.2机房供电系统的验收

  1)常规指标的测量

  在不带正式IT负载的情况下先测静态指标:

  先从输入开始,测市电电压的变化范围,测ATS的切换时间。

  测UPS输入输出电压的精度和稳定度、测旁路开关的切换时间。

  测UPS的电网调整率与负载调整率…

  像这些常规和非常规指标的测量有专门的机构承担,并且有详细的表格,这是一些规范化的程序自不必说。这里只对一些由于机房建设中对供电系统各环节考虑不周而导致的问题。

  2)电池后备时间验收不合格

  对电池后被时间的测量是带负载的,通过这种测量就可以发现电池容量是否符合设计要求。不过在此相测量中发现了一些异常现象:本来设计的电池容量足够,而且也是严格按照设计容量配置的,但却出现电池后被时间不够的现象。导致这种现象的原因很多,大致如下:

  A.电池方面的问题

  有的电池厂家的产品质量不过关,均匀性不够,导致性能不一致,导致容量不能全部发挥作用;有的电池产品本身的原始容量就不足;有的电池由于放置时间过长而出现硫化现象导致容量减小;电池在测试前未被充足电;甚至有的电池本身就是劣质产品。

  B.负载性质问题

  有的测量着由于概念不清楚,简单地采取了UPS额定功率与负载功率因数相乘得出线性负载的办法而接入假负载。从前面的分析可知,这样不但导致电池后被时间缩短,甚至有烧毁UPS逆变器功率管的危险。

  C.电池到UPS之间的线路问题

  在电池的质量确实有保障的情况下,电池到UPS之间的线路问题是需要考虑的,首先是连接电池输出端子的连接处是否接触良好、隔离开关或保险丝是否接触良好,在这些接触点上是会有电压降的。再就是电池到UPS之间的电缆长度L和电缆截面积也很有关系。尤其是对那些电池组电压比较低的情况。比如电池组电压为12V×4=48V的UPS,在放电时一般都稳定在46V而不是48V,关机电压大约是42V,其中只有4V的差值,如果由于电池到UPS之间的距离太远,但因为设计者仍按短距离时的电缆接面积施工而导致沿路压降上升到2V,那么UPS的关机电压就会提前到42V+2V=44V,后备时间当然就不够了。某用户就是因为电池在一楼而UPS在5楼,导致后备时间短很多,当把电缆截面积适当加大后就满足了要求。

  3)供电方案施工完毕后验收测量结果不满意

  由于供电方案未经充分论证就仓促购置和施工,验收时测量结果不理想,此种情况不仅在一处发生,此时无论如何生米做成熟饭,已无法更改,只好认可。现举例如下:

  某数据中心机房300m2,用电容量约为100kVA,机房供电系统配置如图9所示。由于机房要求可靠性较高,采用了双路市电供电方式,两路市的切换采用了进口的ATS产品,后面是200kVA的EPS,由于EPS还要给空调机供电,故容量用的较大;IT设备供电采用了双总线方式,选用的高频模块化UPS结构,由于认为变压器可增加供电的可靠性,于是在UPS输出端增加了变压器机柜,又为了增加供电的可靠性,在变压器后又配置了静态开关STS在一台UPS故障时进行切换。此供电系统采用了两套,如图所示,单配电系统就配置了20多台机柜,如果再加上双倍的空调机柜,近30个机柜。

  此系统安装完毕后进行测量验收时普遍发现有如下问题:

  ◆一路市电断开,ATS在20s后才能将第二路市电接入,切换时间过长。

  ◆EPS由空载在加半载的情况下输出电压从380V降到了360V,电压调整率太低;

  ◆对UPS进行测试时,当接到输出端的标准功率表指示为50%负载时,UPS面板的液晶显示近80%,几台都是如此对应。设备面板指示偏差过大。

  ◆外加100kVA变压器在室温不到20℃的机房内其外表温度竟为90℃,功耗很大。

  ◆STS的切换时间是100ms,国外标准是<5ms,该产品说明书上是4~6ms,不符合出场指标。

  4)供应商偷梁换柱

  不止一处发现,供应商提供的产品并非合同指定的产品,技术指标相差甚远,为系统运行的可靠性大为降低。

  经过如此测试可以看出:

  ◆系统建好后有必要请第三方测试验收,但目前大多数机房并没如此认真去做。原因是尽管上述测试发现了这些问题,但至今系统运行仍然正常,最大的可能是市电尚未断电之故。换言之,有很多机房设备不一定就是厂家给出的指标,有时会低很多,只能说这些是隐患。用户不知道时仍然认为整个系统设备良好,一旦用户知道了结果,无疑就多了一层担心。但有不少设备在运行中出故障,是否和没有进行全面测试有关,也未可知。

  ◆从前面对UPS冗余并联与双总线供电方案的讨论中,可以看出这种系统是双倍的投入,至于可靠性如何不言而喻。但理论分析可靠性低不一定就马上出故障,隐患终究是隐患而不是频频出现的故障,从侥幸的观点说是否可以接受呢?正因如此,有些用户也就不“多此一举”了。

  4大型UPS供电系统的带载验收

  4.1以往UPS供电系统带载验收时造成的困难

  1)假负载的来源问题

  为了安全起见,UPS在待时机设备之前都要做假负载试验,一般的假负载如图10(a)所示。这些假负载一般说功率都比较小,都不超过2kW。用这些负载既方便又容易解决。但往往为了这个负载由谁来出而造成供应商与用户的矛盾。尤其是功率较大时,假负载就成了一个很大的问题。如果觉得电炉子或热风机因功率太小而大量采用,更牵涉到资金问题,原因是这些假负载是不容易借到的。

  2)假负载的安装地点问题

  即使假负载的来源问题解决了,这样的负载一般作10kVA左右的假负载还可以,如果功率太大,比如100kVA以上,即使2kW的电炉子也得50多个,那么5000kVA就是200多个,放在地上就是一大片,如10(b)所示。即使用功率较大的盐水缸,如10(c)所示,机房内是否有如此大的空间?如果没有,拉向何处?现场条件是否允许?如果可以拉到室外,遇到雨天如何让办?等等,这都会成为问题。

  3)假负载的功耗问题

  上述这些假负载都是实实在在消耗有功功率的,而且这些被白白消耗掉的功率变成热量海区污染环境。比如一个消耗5000kVA功率的数据中心,即使是0.8的功率因数,也要消耗4000kW,在号召节能的今天还要如此浪费,是否应该。

  4)假负载的处理问题

  从大多数用户来说,假负载必需花钱购置。而买来以后基本就用一次,最多也只几个小时。假负载用过后如何处理?卖掉,不值钱;扔掉,更可惜;留下来,也许几年用不着,还占用着很多地方。总的说,也就是浪费了。

  5)假负载试验的时间问题

  从筹划负载到开辟场地、从安装负载到测试试验、测试完毕后要拆卸负载、要处理负载,等等,这一系列过程要花去几天时间,劳民伤财。

  4.2带载验收新技术

  1)新技术的测试能力

  当代技术已发展到不需要上述过程的简单程序。这就是采用了专利的EASY-LOAD负载测试技术,这是一种完全绿色的测试,无需外部负载箱,无需相应的电缆安装工程,只需一台电脑,使UPS自己内部产生一个满载负荷,可以对UPS内部的所有功率部件及连接件进行满载测试,测试UPS、旁路、电缆和开关设备上的发热现象,并可以进行满载电池放电测试。整个过程可快至2h。EASY-LOAD带载测试技术原理图。

  2)新技术EASY-LOAD的测试原理

  因为这是一项新技术,有必要把它的工作原理作简单介绍。图4-54(a)示出了这种技术的基本原理。其EASY-LOAD基本工作流程是两个交流电源(UPS逆变器输出和市电)之间通过某一个电感L连接起来,该两个交流电源有着同样的电压值,为了能有电流在两个电源之间流动,在这里就调整逆变器电压比市电电压有一个超前10的相位差。由于电压和电流同相位,所以这就是一种功率传输。

  (a)功率传输原理图(b)两个交流电源的相位关系图

  这是一台UPS带负载测试的能流路线图。市电通过旁路开关接到逆变器,使用数字控制技术,逆变器就能够依靠改变相位关系来调整功率,使其反向流向旁路开关,如图中箭头的指向所示。由于逆变器从直流电源母线将功率传到输出,那么整流器就自然而然地作出相应动作,从市电中吸取功率并传送到直流母线。整流器从市电中吸取的功率等于逆变器给出的功率加上UPS内部的传输损耗。这个损耗一般是5%。

  在这里就会产生这样的一个问题,所有这些能量都传到哪里去了?能量实际上是经过了UPS这个路径,从市电来又回到市电。要知道设计UPS的目的不是为了消耗能量而是为了传输能量的,小孩玩的热土豆传送游戏就是一个很好的比喻。逆变器、旁路开关和整流器都在以“热土豆游戏”同样的方式传送能量,而且这个能量是一个真实的负载。

  在整流器输入开关断开时测量电池放电的后备时间,如图14所示。在多数情况下,反流到市电的能量一般都被数据中心大楼内其它电子设备或仪器所吸收。如果这里的设备不需要如此多的能量,那么多余的部分就会被送回到市电电网。不过在多数情况下,在作电池全放电前对本地的负载调整时需要考虑的。

1
3