以机柜为基本单位的服务证券业数据中心
2009-06-17 千家综合布线
证券行业有休市假期,与银行不同。但是证券业对开市期间的数据中心可靠性要求极高,因为股票行情的实时波动很大。我们在2006年底建成了行业最大的数据中心、容灾中心,建设标准类比等同于北美TIA942的T3标准,入驻证券公司32家,覆盖营业部占全国营业部总数的42.34%。
建设证券行业数据中心要考虑三方面因素,第一是可用性,购买的设备必须是高可靠设备。设备不可能不坏,关键是设备发生故障后,恢复时间要尽量缩短,同时严格规避人为错误,这样就提高了可用性。第二是灵活性,即系统适应变化的能力。系统建好才是开始,系统建好后需要运行10~20年。数据中心要保证业务发展,就必须要有灵活性,我们要考虑的是过程,而不是开始。第三是成本,成本也是过程的成本,而不是建设成本。在考虑建设成本的时候,也要考虑后续服务和运营成本。
我们建立数据中心参考了理论标准——NCPI理论,不是面向数据中心机房,而是直接以机柜或机架作为基本单位。我们总结了建立数据中心要考虑的基础环境七要素:强电、弱电、温度、湿度、空气洁净度、磁场、辐射。谐波对人是有危害的,绿色除了指节能,还包括环保,所以磁场和辐射也是我们应该考虑的。国标是我们建设数据中心的最低物理标准,其次是按照TIA942,我们参考PDCA理论和ISO27001运维标准来管理数据中心。
安全最终要落实到可用度方面。提高可用性的目的是消除单点故障、提高容错能力和可维护能力。提高可用性很重要的手段是增加冗余。冗余有两种,一种是单总线,一种是双总线。那么,怎么认定可用度是高的?我们运用的手段就是分析可用度指标MTBF(平均无故障时间)和MTTR(设备平均故障修复时间)。设备可靠性高,MTBF相对就高一些。要缩短MTTR,就需要服务来支持。我们提高可用性、可靠性所做的工作是把MTBF尽量提高,把MTTR尽量缩短。
能耗也有几个指标可以参考,最常见的是PUE(电力使用效率)和DCiE(数据中心基础设施功率)。我们考虑还要增加数据中心的电力使用性能指标PE。业务处理能力与IT设备功率要有指标来关联,这是我们在规划系统时要考虑的问题,也给设备厂商提出了要求。设备厂商提供的硬件能耗要合理,不能因为过分追求性能加大能耗。要求用户提高空调效率,PE就要求设备厂商尤其是前端设备厂商要提高效益。