当前位置:首页 > 机房建设 > 正文

中航集中监控确保IT安全运维

2010-01-05 网界网

  作为国资委麾下央企中唯一从事信息服务的企业,中国民航信息集团公司(简称中国航信)一直将系统的安全运维视为企业的“生命线”。2009年10月,新一代中国航信IT运维监控管理系统的上线,让这条生命线更加强健和稳固。

  作为一家港交所挂牌上市、资产总额达到73亿人民币的企业,中国航信是目前航空旅游行业领先的信息技术及商务服务提供商,其主营业务包括航空旅游电子分销、机场旅客处理、航空货运数据处理、互联网旅游平台、国际国内客货运收入管理系统应用和代理结算清算等服务。

  这些复杂、庞大的业务系统由中国航信的运行中心负责运维,其管理的IT部件包括,超过2000台硬件设备、超过17000端口的光纤和客户网络、接近1PB的存储系统,1000余套系统中心平台、80套左右的数据库平台、50余套中间件环境。这些设备目前分置于两个高等级数据中心,分别位于北京的东四和三里屯,总面积超过6000平米。数据中心的环境基础设施均符合行业标准最高级别要求,机房符合国家A级机房环境标准和国际通行的IV级设施保障标准,数据中心采用双路供电,可抵御8级裂度的地震。

  高等级的数据中心需要高等级的IT运维。为此,中国航信一直将IT运维的安全性和可靠性作为IT服务水平持续改进的关键目标。“中国航信拥有30年的IT运维管理经验,目前已经形成了具有自身特色的IT服务管理模式。从2004年起,我们开始系统的实施基于ITIL最佳实践的ITSM(IT服务管理)体系。”中国航信副总裁兼运行中心总经理荣刚说。

  ITSM与业务深度融合

  谈到中国航信IT服务管理体系的演进历程,中国航信运行中心运行部总经理沈强表示,随着自身业务的发展和IT基础设施的不断扩张,中国航信注意到IT管理正在从侧重资源管理向侧重于业务和服务水平的IT服务管理演进。而IT监控也相应地从资源监控向业务监控转变,因此构建一个强健的IT运维监控管理体系对中国航信信息化的发展至关重要。

  据介绍,中国航信于1999年开始启动开放系统的构建和监控体系,并于2003年引入集中监控机制。2004年引入访问控制管理等管理理念后,实现了用户集中管理、审批、特权用户使用限制等安全管理措施。其基于ITIL的ITSM体系自2004年持续演进至今,已经部署了事件管理、问题管理、变更管理、配置管理、容量管理、业务连续性管理、服务级别管理、成本管理、供应商管理等9个管理模块和流程。“目前,ITSM的管理理念在中国航信已经得到全面的引入和落地,‘Good Practice’(优秀实践)一直是中国航信IT服务管理的目标。”荣刚说。

  基于自身的IT监控管理需求和实践经验,中国航信的ITOMS系统(即IT运维监控管理体系,IT Operations Monitoring&Management System,简称ITOMS)已经进入了成熟运营的阶段。“所谓ITOMS,是中国航信根据ITIL管理思想构建的全面IT运维监控管理体系。它以展现业务的健康状况为中心,是一个面向业务的、分层次的监控管理体系。”沈强说。

  ITOMS以业务为核心

  沈强表示,中国航信ITOMS系统经历了一个循序渐进、不断发展的过程。2009年10月,中国航信开放系统集中监控功能完善项目的完成,标志着中国航信ITOMS在历经三代发展后,成为一个真正“面向业务”的监控体系。

  沈强介绍,该项目完善了ITOMS此前未能实现的功能,其增加的功能包括,知识库管理系统、统一的事件中心、报表与分析中心、业务影响视图。同时,在不改变原有基础监控平台功能的前提下,实现了系统与配置管理、事故管理等管理组件更有效的结合。

  “‘运维知识库系统’的建立是这项目的一大亮点。”沈强说。这个国内首个自主研发设计的“运维知识库”,是ITOMS的核心。它采用IBM Tivoli Netcool解决方案实现统一事件平台的功能。其中,基于Sybase内存数据库的Netcool OMNIbus是事件汇总的中心、Netcool Impact和Gateway使OMNIbus能够和外部数据库关联,业务视图、影响视图、服务视图的展现通过Tivoli TBSM进行,Netcool Probes作为底层软件与OMNIbus的接口,负责往OMNIbus中插入事件数据,报表系统基于TCR(Tivoli Common Reporting)构建。

  沈强表示,基于自身的业务需求和多年行业经验,中国航信坚信,成熟的监控管理必须能够与知识库相关联,全面展现业务的健康状况。基于IBM Tivoli Netcool构建的新一代ITOMS,在一个平台上把监控、安全、存储、备份等10多种运维管理软件所产生的报警信息进行了统一处理、统一规则、综合呈现。

  “这种对不同管理软件所产生事件信息的有效整合,极大地提高了事件管理的水平,为ITSM进一步的升级转变建立了强有力的IT管理支撑。”沈强说。他强调,就复杂、超大规模IT系统的运维而言统一的事件信息展现平台是十分必要的。该平台以一致的方式来展示源自各种IT运维管理系统的事件信息,它还必须能够与配置管理平台和知识库平台紧密融合,以帮助值班人员快速定位和解决问题。而围绕企业的关键业务,该平台需要借助动态的业务影响视图来实时展现整个业务的服务水平。

  “事件管理、配置管理和运维知识库的整合是中国航信ITOMS渐进式发展进程中的关键一步。它让中国航信的IT运维监控管理体系实现了‘以业务为中心’的转型。”荣刚说。据透露,2010年中国航信将在北京和上海周边开始兴建新的大型数据中心。按照未来的企业发展规划,届时中国航信运行中心将负责全国近6万平方米数据中心的运维。荣刚表示,中国航信开放系统集中监控功能完善项目的完成,为其在更大范围内的IT服务管理实践提供了有力保障。

大家都爱看
查看更多热点新闻