当前位置:首页 > 机房建设 > 正文

管理应急预案,保障机房安全

2009-05-12 C114中国通信网

突发事件:机房安全的大患

对于网络机房而言,突发事件可以被广义地理解为突然发生、可能对机房造成不同程度的危害、必须采取非常规方法进行处理的事件。威胁机房安全的突发事件可能是自然原因造成的,比如冰雪、洪水、地震等;也可能是人为原因造成的,比如由于管理疏忽所引起的火灾,由于维护不及时导致设备老化所引起的突发性系统故障,由于操作不当致使负载过高所引起的系统崩溃,等等。无论何种原因,突发事件都是威胁机房安全的最不可控因素,因此也成为机房管理中的“痛点”。

在金融和IT行业,随着信息技术应用的不断深入,网络的关键性越来越强,作为网络心脏的机房重要性不断提升,而在突发事件面前机房却显得更加脆弱。2005年11月,东京证交所发生大规模系统故障,导致停盘;2006年4月,全国银联系统发生故障,全国跨行交易瘫痪8个小时。IT行业由于突发事件导致系统故障甚至崩溃,从而造成巨大损失的例子更是不胜枚举。因此,如何通过采取积极的措施,有效地应对突发事件,将损失和影响降到最低,正成为包括金融和IT行业在内的各行业信息系统管理者关注的焦点。

应急预案:有备无患

古人云:居安思危,思则有备,有备无患。因此,提前做好防备、制定应急预案也是处理突发事件、保障机房安全的最佳途径。应急预案是针对具体机房环境和设备,在安全评价的基础上,为降低突发事件造成的损失,就事故发生后的应急救援人员,应急救援的设备、设施、条件和环境,行动的步骤和纲领,控制事故发展的方法和程序等,预先做出的科学而有效的计划和安排。突发事件虽然不可控,但通过事先制定应对措施,则能在突发事件到来时沉着应对,减小损失。

应急预案必须做到科学性和可操作性的统一。科学性是指预案要科学有效。应急预案是一个科学的体系,应该包括具体详细的预案文本,完善的应急组织管理指挥系统,强有力的应急工程救援保障体系,综合协调、应对自如的相互支持系统,充分备灾的保障供应体系,等等。预案的科学性是可操作性的基础。可操作性是指应急预案应当切实可行,在遇到突发事件时能够迅速启动,按照流程高效地处理问题。为了保证预案的有效性,必须对其进行不断地检验、反复地论证,制定好预案之后通过战前演练确保能够充分使用一切资源,达到最佳效果。

应急预案是一个不断完善的过程。正是由于应急预案对科学性与可操作性的要求很高,因此需要在实践中不断完善,逐步走向成熟。比如艾默生网络能源,作为业内领先的网络能源设备、解决方案和服务提供商,一开始只有面向设备的常规预案,局限于故障设备的处理,后来在多次救灾和应急保障过程中,建立了灾变事件应急机制,制定了相应的应急预案,同时在公司的内部形成了跨部门的协调机制,逐步完善了应急预案。正是由于有完善的应急预案作保障,在2008年抗击冰雪灾害、抗震救灾以及支持奥运当中,艾默生网络能源表现卓著,很好地践行了“关键业务全保障”的理念。

艾默生预案管理服务:价值凸显

由于应急预案是一个复杂的体系,需要科学性和可操作性的统一,需要根据实际情况和机房环境的发展趋势不断完善,更需要专门的人力和物力的支持,因此,预案管理作为机房运维当中的一项重要服务内容,其价值逐渐凸显,同时也越来越需要作为一项专业的服务内容提供给各个行业的客户,尤其是金融和IT这些对信息系统依赖程度大的行业的客户。艾默生网络能源应急预案管理服务也正是在这一背景下推出的。

艾默生预案管理服务的主要内容是:分析应急措施和预案的完整性、可行性和有效性,提出优化改进建议;调查评估相关人员对应急措施和预案的熟悉程度,提出改进建议。其中应急预案评估以及评估模型的建立是这一服务的关键内容。评估可以衡量应急预案的有效性,通过提前发现预案的不足,指导完善应急预案,而评估模型是统一、规范应急预案评估活动的标准,也是衡量、完善应急预案的指导。艾默生将评估模型的要素分为管理和预案两大类,每个大类又细分为若干小类,这样就能够在评估中做到有章可循,有案可查。

大家都爱看
查看更多热点新闻