数据中心“上路”前需要第三方测试验证?绿色数据中心

2014-06-06    来源:机房360    编辑:佚名
数据中心验证是业主对于数据中心建造质量进行确认的一个过程。在欧美的建筑行业,验证作为工程质量管理的规定步骤已经存在了30多年。近10年来,欧美的数据中心客户也已经把验证

  数据中心验证的定义——ASHRAE的观点

  数据中心验证是一个系统性的质量验证过程。此过程验证并记录该数据中心设施作为一个整体及其所有的设备、子系统满足用户的设计目标和运行要求。

  ——ASHRAE 美国采暖、制冷与空调工程师学会

  作为全球最有影响力的行业组织,ASHRAE更看重数据中心验证过程的重要性。数据中心验证是业主对于数据中心建造质量进行确认的一个过程。在欧美的建筑行业,验证作为工程质量管理的规定步骤已经存在了30多年。近10年来,欧美的数据中心客户也已经把验证作为数据中心工程质量管理的规定动作了。

  国内近几年建设的大型数据中心也都开始把验证作为必须的要求。但相对起国外,行业人士预计还有80%的国内数据中心没有聘用专业的第三方机构进行数据中心的验证。这为数据中心稳健运行埋下了隐患。

  而从数据中心项目实际进展的角度,规划、设计、建设阶段投资大,周期长,验证是确保投资达到预期目标的最重要的手段,也可以看作数据中心建设的终点。与此同时,验证是数据中心运行的起点。一个专业和完善的测试验证可以极大降低数据中心在其运行早期的故障率,并为其全生命周期的稳健运行奠定基础。也就是说,数据中心验证过程发生在工程竣工和投产之间的关键节点,这个节点也直接决定了数据中心前期投资和后期运行能否按照规划顺利实现。

  基于大数据导致业务量激增和数据中心能力不断增强的双重需求,无论是以金融业为代表的注重自身业务持续性的行业用户,以互联网、运营商为代表的希望通过数据中心扩展业务收入的行业用户,以地方政府为代表的以产业园模式介入数据中心产业发展的新兴用户,还是以提供数据中心服务为己任的老牌IDC提供商们,都需要全程参与数据中心的从无到有。而用户自身参与的过程也为数据中心项目带来诸多潜在风险,最值得引起重视的风险包括前期数目巨大已经投入的投资风险和后期业务对数据中心潜在的严重依赖风险。

  数据中心验证的价值——为什么要做?

  以汽车为例子,在生产线上有严格的质量管理,出厂前也有厂验。所有汽车在从组装线下线之后、交付用户之前,需要经历整车综合测试、道路测试。同时,对于每个车型要做碰撞实验,以模拟最坏情况下汽车整车的应对能力。只有那些通过了所有上路实际测试的车辆,才能让我们放心驾驶。

  数据中心建设和汽车有很多相似之处。安全(可靠性和可用性)也是头等大事。未经测试直接投入运行的数据中心,未必立刻出现故障,但存在用户自己也无法掌握的隐患和风险。经过对行业案例的分析比对,专家认为,忽视数据中心验证过程会增加风险变成事故的几率。举例来说,北京某知名数据中心,投产前因工期紧张等原因未进行测试验证。在运行一段时间后,用户希望对A路UPS 进行保养,在操作断开A 路断路器的时候,不幸的是,B路UPS 却被切断,导致系统中断,也因此付出了数额不菲的经济代价。

  由此可见,只有在投产前进行全面的测试验证才能发现全部问题,排除定时炸弹。数据中心验证作为项目必须经历的重要过程,应该引起国内用户们的足够重视。

  通常情况下,客户会要求具备相关能力和资质的第三方公司针对包括供配电、安防、空调、监控、环境、布线、线缆、防雷接地等子系统进行设备测试、系统内测试、系统联调、和基于故障模拟的集成测试。

  高端客户更看重基于故障模拟的集成测试,模拟极端情况,测试系统实际抗故障能力:模拟发电机故障以测试容量及冗余能力,模拟市电故障测试转换开关和发电机性能,模拟UPS 故障测试UPS 冗余能力,等等。

  可以说,数据中心验证作为检测必备环节,正在成为每一个数据中心建设工程的标准流程。

  验证能够有效帮助后期正常运行,对项目实际运行、后期运维和可能的事故预案都有着非常重要的作用。

  测试验证过程通过多层级测试、模拟多种情景来帮助发现系统可能存在的问题,并且针对薄弱环节进行整改,减少实际运行的故障隐患,提高系统可靠性,保证项目前期投资;

  另外,验证过程所实施的大量测试工作,为运维团队提供了提前参与项目管理的机会,使得运维团队对系统更加熟悉,并且掌握了一定的解决问题能力,便于后期对数据中心的全面管理;

  更为重要的是,针对关键设备、系统内、系统间及基于故障模拟的集成测试的验证过程,为业主提供了大量真实有效的测试数据,为将来数据中心的各项操作提供了全面的数据支持,也为业主完成标准化管理流程和运维预案提供了价值素材。

  数据中心验证的实施——谁来做?

  数据中心验证最重要的目标就是通过对所有故障可能性的设想和模拟,来找到数据中心在设计和建设过程中留下的问题,帮助用户规避更多风险,降低数据中心故障率。好的验证服务就是为业主发现当前的问题,并且提醒业主所有的单点故障点,为潜在的问题敲警钟。所谓当前的问题,就是通过测试中发现的问题,比如断路器的线可能接反;又比如线路标识的缺乏;或者是电路接点没有拧紧。所谓单点故障(Single Point Of Failure) 就是列出所有供配电及制冷系统上可能引起系统中断的点。

  实践中,有些数据中心管理者业存在这样的误区:我是否还需要验证?我已经有监理公司负责工程了?设备厂家也会来调试设备的啊?

  机房工程中,业主会因为工程复杂程度以及施工多头介入而头痛不已,聘请工程监理介入施工过程是国内常用的做法,工程监理主要关注于工程的安全、进度、预算、材料质量的把控。但却不能对整体工程结果性能负责。究其原因,工程监理驻场的团队一般仅有1-2名,无法三头六臂看顾偌大工程,没有相应的仪器和测试经验,也无法精通从供配电到制冷到弱电等全部专业的技术,无论从团队能力还是团队力量可能都没法胜任专业的验证过程。

  还有部分业主把测试验收分别交付给设备厂商或是工程承包商,他们或只着眼于自身所提供设备的质量验收,无法提供系统联调的专业服务,更无故障模拟测试能力;或者无法提供用户角度的第三方的测试验收和整改意见。显而易见,监理、施工公司和厂商代表都无法帮助业主完成真正意义上的验证过程,而测试验证真正需要的是专业技术团队的实施,从而保证最终的整体工程结果的性能符合设计要求和运行要求

  数据中心验证的内容——做什么?

  以国内数据中心技术咨询服务公司——中科仙络咨询服务公司为例,专注于数据中心技术服务领域,拥有10年历史,及为上百家IDC和金融客户提供数据中心全生命周期咨询服务的经验,是美国Uptime研究所认可的战略联盟伙伴,拥有Uptime认证之ATD及ATS 技术人员。

  拥有专业理论、丰富项目经验和权威的技术团队等优质资源,中科仙络认为,通过对关键设备测试、系统内测试、系统间测试以及基于故障模拟的集成测试这四个不同层级的专业测试,以及通过图纸审核、现场测试、专家评审、整改总结等步骤来完成测试验证过程。测试验证的目标就是挑出数据中心所有的问题和潜在的弱点,通过测试及验证,最大化降低系统性风险,提高数据中心的可靠性、可用性程度;确认机房竣工前关键节点的施工质量、安装工艺、系统可用性;减少及规避机房建设阶段的问题及隐患,降低带病工作的可能性;获得设备、设施第一手真实的相关数据,评估及优化设备、设施的配置以达到节能的目标,让业主对项目验收和未来的投产更有信心。
 

1
3