数据中心的无缝迁移
2016-01-21 机房360 编辑:
数据中心迁移并不是个轻松的任务,但是却是企业必须面临的问题,因为数据中心需要进行合并、转移、整合、构建以及其他更新。毫无疑问,这样一项任务会很快成为数据中心管理员的新挑战,特别是当需要进行地面布局和有其他物理需求时。
除了一部分很明确的规划,如设置机器的修养期、安排旧设备淘汰和进行服务器整合,管理员也必须考虑应用软件的停工期。幸运的是,由于可进行数据中心托管并且硬件价格低廉,因此彻底停止数据中心的服务在当前是可以避免的。
然而,应用软件托管需要充分的预先计划,任何阶段和产品需求都不能出差错。尽管当前将核心系统转换到外部环境的情况已大大减少,有时管理员还是不得不咬紧牙关选择托管的方式以确保应用软件的持续运行。
恰当的计划是使服务和设备转换平稳进行的关键,只有这样才能使用户的工作不受到任何影响。最终管理员结束这一艰巨的任务,这需要不同IT小组(包括工程师和技师)之间良好的沟通,可以使这一重新部署任务圆满完成。
最近,CMP通路检测中心实验室(CMP Channel Test Center lab)需要进行迁移。为了圆满完成这一迁移,必须创建一个小型计划,这样就可以保证只有两到三天时间基础设施无法达到最大利用率。在整个计划完成了一半时,地面设计、动力资源供给、USP服务和网络设计等都发生了改变。为了将转移期间停工时间最小化,我们迅速制定出了行动计划。如下是计划的实施步骤,解决方案提供者可以制订相似的转移计划,这样就可以尽量避免转移过程中问题的发生。
1、将设备、电工和IT员工相协调:从一开始,我们就很明确地告诉每个小组我们需要转移基础设施设备和机架的最小量。迁入的新服务器机房比以前小,因此我们面临着潜在的所需机架和架子的空间安排问题。我们计算出所需机架和架子的最小量——既可满足需要,又可放入新机房内。
2、停机但是保证数据中心持续运行:在转移的当天我们提出一个普通但是很却很有效的行动计划。员工在转移设备和部件时不断开关键的网络通路。
3、冷却系统和其他系统:此处有一个被忽略的内容。由于设计原因,CMP Channel Test Center新服务器机房需要更少的冷却设施,但是数据中心总的工作量却没发生变化。我们需要仔细观察并进行测量。转移一个数据中心时,你也需要与电工讨论相关问题,例如新机房可获得的最大电力负荷,以确保未来的机器数目增长可与之相适应,同时也使CIO和CEO们了解机房的电力承载力。
4、维持数据中心运行:数据迁移和保证核心应用软件运行从来不是什么大问题。然而,根据我们的经验,成本最少的行动方案是将工作分解。换句话说,在迁移期间实际存在两个数据中心。维护小型数据中心的VAR应该推荐采用这一方式以保证数据中心的持续运行。这可实现在迁移过程中不需要进行基础设施托管。
5、开始运行:不在万不得已的情况下,不要断开机架和网络的线路连接。断开的连接越少,花费越少,同时一个客户机可以更加迅速地恢复运行。为了加快CMP Channel Test Center的迁移速度,员工尽量保证线路连接,同时在断开的网络连接上贴上标签。结果显示我们节约了大量时间。
6、测试,测试再测试:不要对任何一个小的环节掉以轻心。检测网络连接,外部服务和服务器,和其他参与迁移的人员保持联系,并让其对任何损坏负责。
对实验室的重新部署点醒了我们大家。很多工作中和设备测试中经常被忽略的小细节都显示出其重要性,需要在迁移中引起重视。
生产量计划也是一个需要引起我们重视的核心环节。这次是二十年来实验室的第四次迁移。尽管中间出现了一些小的卡壳,但是工作顺利进行,我们感到很有信心,因为迁移过程中潜在的无法预料的电力供给和需求增长以及其他网络限制问题都没有对整个迁移过程构成影响。