UPS在应用方面的发展趋势
2010-09-08 机房360
摘要:数据中心的建立遍地开花,发展如雨后春笋。由于在这个时期发展很不平衡,中心规模和用电容量变化很大,因此要求UPS具有随变的功能,这就是“适应性”。
一、从单机向冗余结构变化
由于数据中心的重要性越来越显著,因此供电电压的任何中断都会造成重大损失。任何单机供电都存在着断电的危险,为了实现供电的高可靠性,多机冗余连接已经成了数据中心用电的必要手段。
二、从注重系统的可靠性向注重系统的可用性变化
任何系统的可靠性都不是绝对的,更不是一成不变的100%。数据中心IT设备所关心的不仅仅是供电会不会中断,更需要知道断电时间有多长。换言之,需要知道在制定时间内能有效工作的时间比例,这就是可用性的概念。它可用下式表示,即
式中,A为可用性:
MTBF为平均无故障时间,用h表示;
MTTR为平均修复时间,用h表示。
从式(1-1)中可以看出,提高可用性的途径有两条:一条是提高设备的可靠性,即延长平均无故障时间MTBF,但是这样做的效果不太显著,并且提高了造价;另一条是缩短平均修复时间MTTR,这一条容易做到,UPS的冗余连接就可达到缩短平均修复时间的目的。例如,两台UPS冗余连接,当其中一台出现故障时,另一台可继续供电。待这一台故障机器修复后再接入,故从供电未曾中断的监督看,MTTR=0。所以,冗余连接是实现高可用性的必要手段。图1-5示出了降低单机故障率与采用冗余措施的可用性比较。
从图1-5中可以看出,尽管将单击的故障提要到了0.015,但是其可用性值才仅仅为0.998;在双机冗余连接的情况下,即使单机故障率为0.01(几乎是前者的10倍),但其可用性却几乎为1。
至此不要产生另一个误会,即为了提高可用性,只要降低MTTR就行了,可不去考虑MTBF值的大小。这种看法对吗?
当然这是一种误解。为了提高可用性,只要求降低MTTR而可不去考虑机器的质量(即MTBF)的做法无异于拔苗助长。这可用下面的例子来说明。
当要求可用性A=0.99999时,每年允许停机的时间t为
t=365×24h×(1-0.99999)=8760h×0.00001=0.0876h=5.256min
在n+1冗余的结构中,加入排除故障的时间是MTTR=10min,根据式(1-1)可算出硬件应具有的平均无故障时间为
当MTTR=20min时,硬件系统的可靠性R就要求MTBF=33333h。见表1-1的对应关系。
从表1-1可以看出,维修的时间越长,要求平均无故障时间也越长,换句话说,对设备的质量要求就越高。其原因有两个:一个是在一台UPS因故障进行修理时,尽管另一台在继续正常供电,万一在这个期间出现故障,就会造成停电事故。故障UPS的修理时间越长,出现停电事故的概率就越高;UPS的质量越差,出现停电事故的概率也越高。
第二个原因可用下面的例子来说明。
假如两台并联的UPS有着同一个量级的可靠性(但绝不会是一模一样),如它们各自的平均无故障时间分别为
MTBF1=50h
MTBF2=51h
那么两台UPS同时出现故障的时间就是它们的最小公倍数50×51=2550h。就是说,每隔2550h就出现一次两台UPS同时出现故障的现象。这时两台UPS同事需要维修,由于整个供电系统已经瘫痪,从不间断的意义上讲维修时间再短又有何用!另外在2550h(8个月)之内,由于UPS的质量低劣,也可能会频频发生故障,同样也会造成很多损失。
如果两台UPS的质量提高一步,即将平均无故障时间提高到:
MTBF1=500h
MTBF2=510h
那么它们最小公倍数就是25500h(3年),于是两台UPS同时出现故障的时间由8个月延长到3年;如果再将两台UPS的质量提高一步,即
MTBF1=5000h
MTBF2=5100h
它们最小公倍数就是255000h(29年),就将两台UPS同时出故障的时间推迟到29年以后,即在29个念头以前就不会有两台UPS同时故障的现象发生。这时,两台UPS互为备用的条件才被满足,减小MTTR才真正有了实际意义。
因此,只有在保证UPS质量(MTBF)的前提下,减小MTTR才具有真正的意义。
三、从单出供电系统向保证整个IT运行环境(NCPI)变化
当年数据中心所关心的是整体运行效果。如图1-6所示就是一个木桶式解构的机房解构原理图,数据中心机房的各设备就像组成木桶的模板。木桶盛水的容量取决与两个因素:一个是取决与构成木桶所有模板中最矮的那一个;一个是取决于模板之间连接的密封情况.木桶的寿命则取决与所有模板中质量最差的那一个。所以在这个要求综合效果的木桶中,作为UPS的这一块模板,高度再高也不能增加木桶的容量,质量再号也不能晏城木桶的寿命。比如空调机故障,高温可导致停机了由于机架布线太密而堵塞了俸禄,形成的热点也可导致停机了监控系统时效可使盲目运行的机器出现故障,等等。因此只一味地提高电源的指标和质量已不能保证整个系统的质量,必须要提高整个运行环境的指标。美国可用性研究中心为这个运行环境命名为网络关键物理基础设施,用NCPI(NetworkCriticalPhysicalInfrastructure)表示。
四、提高UPS供电系统的“适应性”
数据中心的建立遍地开花,发展如雨后春笋。由于在这个时期发展很不平衡,中心规模和用电容量变化很大,因此要求UPS具有随变的功能,这就是“适应性”。