Compuware Vantage助力吐哈油田从被动救火到主动预防
2011-03-02 中国IDC产业联盟
中国IDC产业联盟讯
客户
中国石油吐哈油田
行业
油田
业务挑战
油田公司信息系统运维所面临的主要问题是缺乏以终端用户体验管理为纲、以应用性能管理为目、以IT基础设施管理为科的完整运维管理体系。同时,缺乏以油田职工为中心,以油田业务为导向的思想观念,没有建立有效的业务服务管理平台,造成运维工作效率难以有效发挥。
解决方案
Compuware Vantage
客户价值
大幅度提高了整个吐哈油田信息系统及各个业务系统运行性能,将信息管理水平将提高一个档次,完成了信息服务从被动救火到主动预防、定性模糊排查到定量精准优化的转化。
业务挑战
吐哈油田信息化建设经过多年努力,逐步建立了涵盖油田公司各个单位、涉及油田所有员工的各类信息应用系统近百套,成为油田生产、生活、经营、管理必不可少的一部分。但是,在网络及系统之上的应用层缺乏相应的监控告警手段,则处于被动维护模式,无法从根本上保障各个应用系统的稳定运行,也无法在第一时间内获知应用系统的状态,往往是用户告知后,才开始根据告知寻找应用系统故障。油田公司信息系统运维所面临的主要问题是缺乏以终端用户体验管理为纲、以应用性能管理为目、以IT基础设施管理为科的完整运维管理体系。同时,缺乏以油田职工为中心,以油田业务为导向的思想观念,没有建立有效的业务服务管理平台,造成运维工作效率难以有效发挥。
为此,根据国内外信息运维的发展趋势,结合信息系统的实际状况,吐哈油田引进了以 Compuware 公司的 Vantage 为基础的信息运维管理套件,参考中石油总公司、工信部、国家及国际组织信息建设、维护标准,建设了一套完整的吐哈油田信息系统运维管理系统,为整个油田公司的各个相关单位提供全面、精准的信息运维服务,协助我们有效预防系统问题、高效解决生产系统的故障。
解决方案
吐哈油田信息中心,为了从业务部门信息应用的维度出发来构建信息运维保障系统,采用了国际成熟、先进的模型构建技术,来保证业务应用功能高效稳定地实现:
首先是采用了强大的数据块技术,为基层技术、中层管理、高层决策等不同角色、不同层次人员提供个性化的信息门户。全方位、大纵深、多角度、积木式展示整个油田各个业务部门信息应用系统及其相关IT基础架构的实时状态以及历史统计报表。
其次是灵活的自动与手工相结合的建模引擎来保证业务逻辑与信息基础架构的有效关联,当应用系统性能下降或IT设备发生故障时,能迅速、精准、正确定位故障原因,快捷、全面评估故障影响范围,引导相关部门根据事件轻重缓急采取响应措施。
最后是多种的数据采集接口将企业所有的信息管理工具软件、业务部门考核指标、流程规章管理制度甚至场地安防管理等与信息相关的数据全部集成到统一的管理平台上,按照国际、国内先进的管理标准如 ITIL、6Sigma 等构筑整个油田信息运维保障管理体系。
以上三部分的结构示意如下图:
而在用户体验保障方面, 从终端用户使用的维度衡量信息系统的性能。 通过网络端口镜像分析出用户操作在客户端、网络段、服务器端、页面生成等四个时段的精确用时与流量,7×24 小时监测所有用户在所有地点对油田内部网络和业务应用的使用体验。
以用户体验监测为例,它不仅能自动从 IP 地址、OA 用户名、VPN 用户名、Web 网页用户名等监测用户访问业务应用系统每一个页面、每一个动作的响应时间与数据量,而且能够按页面访问组合来监测完整事务性能。具体到隔离故障区域:强大的多种数据专家分析模块可以综合分析多种数据源,对TCP/UDP/HTTP/HTTPS/DNS/SMTP等协议、VOIP 质量、数据库查询、Exchange 收发邮件、SAP GUI 操作、XML/SOAP 访问等等进行详细分析,在不干扰用户前提下准确隔离用户性能问题发生的具体区域,如客户端、网络、服务器端或者页面设计问题等。而通过优化运维流程: 引导相关专业部门、人员根据用户体验监测主动优化业务应用,并利用系统报表以及灵活的数据挖掘接口 DMI 按照企业运维要求建立起持续优化的信息运维流程体系。
本部分的整体流程如下:
客户价值
与国内、外多数网络系统综合管理软件类似,我们现有的网管系统重点解决信息基础架构所涉及资源的监测管理问题,即对网络设备、服务器、数据库、存储设备等等 IT 基础架构的诸如 CPU 利用率、内存利用率、网卡吞吐量、磁盘空间、进程活动等相关参数进行实时、定时以及连续性监测,显示资源的逻辑拓扑结构以及物理地理分布图,按某种逻辑进行业务关联等等。在此基础上,吐哈油田运维保障系统将对基础架构所承载的业务系统进行端到端的性能管理监测,重点包括三方面。
一是在网络上,采用无干扰的探针方式对网络上的数据流量按照业务、协议、链路、设备进行解码分类并计算出应用响应时间,自动生成应用访问拓扑逻辑,评估系统运行效能,发现网上应用漏洞。
二是在服务器上,采用统一的管理模板和先进的专家经验库对业务性能相关的IT基础架构进行监测,包括各种硬件平台、操作系统、数据库、应用服务器、虚拟机服务器等等,降低技术人员对运维管理的学习难度,提高系统运行效率与排错能力。
三是在业务应用上,可以根据需要在生产环境中分布式部署代理程序深度分析应用性能的根本原因,找出引发问题的具体路径、服务器、J2EE 方法及其子方法、.net 调用过程或函数、数据库 SQL 语句甚至相对应的存储系统物理磁盘等,为软件开发人员提供精准的优化指导。
本方案的引入建设,大幅度提高了整个吐哈油田信息系统及各个业务系统运行性能,将信息管理水平将提高一个档次,完成了信息服务从被动救火到主动预防、定性模糊排查到定量精准优化的转化。
欲了解有关Compuware的更多细节,请访问:www.compuware.com.cn 。