企业数据共享:新的数据虚拟化驱动程序数据应用
对企业来说信息资产的合理利用是很重要的,由于经济疲软,现在比以往任何时候更是如此。信息资产在日常的业务交易中往往扮演着重要的角色,正如以下所列出的:
- 为了对抗新的竞争威胁,业务分析需要多种数据来源,包括企业数据仓库,营销和财务系统,客户关系管理系统以及外部研究数据源。
- 为了调整库存量来应对不断变化的需求,供应链分析需要最新的内外部供应数据,以及从多种销售渠道获得的综合需求信息。
- 为了推迟购买新设备的时间,延长旧资产的寿命,厂房维修团队需要对厂房故障和修复数据进行比较。
数据虚拟化是一个久经考验的数据集成技术,企业和政府机构用数据虚拟化来充分发挥他们信息资产的作用。越来越多的企业和机构采用数据虚拟化技术来补充他们早期数据整合及数据同步的投资。此外,数据虚拟化的使用正在加速,因为采用数据虚拟化的范围已经从单个项目扩大到企业范围。企业级数据虚拟化出现了几种形式,用更为统一的方法解决广泛的业务问题。其中一种形式——企业数据共享正日渐流行,大量信息使用者使用一系列分析和报告工具来查看和分析大量的、从完全不同来源或多个地理位置获取的各种各样的数据。
企业数据共享构成
三个因素促使企业的数据共享成为可能:XML行业标准,数据服务和数据虚拟化中间件(见图1)
行业级XML数据标准为所有数据使用者建立了一致的使用模式,而不管其源数据模式或位置是怎样的。近年来,这些标准变得越来越重要,因为数据在一个大型企业集团内被众多部门和团队所共享,同时也被公司的合作伙伴,供应商,客户以及其他人所分享。
这些建立在XML行业标准基础上的数据抽象规范使用数据服务进行开发和部署。这种面向服务的方法有几个优点。首先,每个服务都能作为一个独立的单元来开发,部署和修改,它有更大的灵活性和复用性。第二,数据服务很轻松的将数据源和信息使用者配对,减少了源数据或信息使用者任何一方变化所带来的影响。第三,使用现代可视化开发工具,数据服务可以进行快速简便的开发和修改,因而符合当今快节奏商业时代所需的灵活性。最后,他们可以利用其他数据服务来对工作进行细分,例如采购服务,联合服务,标准转化服务,具有更大的灵活性和复用性。
开发人员使用数据虚拟化中间件来建立和运行基于XML标准的数据服务。顶级的在线数据虚拟化开发工具可使得多种源数据与内部或行业标准的形式达成一致。这些工具确保了高效的开发环境,它们为流行的语言提供本地支持,包括SQL、XQuery和Java,以及图形化开发技术,自动代码生成和性能优化。一经完成,这些服务就从开发环境部署到数据虚拟化服务器上,在运行时,应用程序可以在这些服务器上根据需求通过诸如SOAP、JMS和REST等协议来调用这些数据服务,查询请求的数据。接着高性能的数据虚拟化驱动程序执行数据服务,完成所有访问、查询、合并、提取和传输,从而向用户提供所需的异源数据。运作透明是一个重要的特性,它使得数据虚拟化中间件能很轻易地适应任何已有的IT环境。快速提供解决方案,降低信息拥有成本,有效的利用现有人员和技术资源,这些都是数据虚拟化中间件带来的好处。
克服障碍
虽然Gartner和Forrester数据行业专家建议将数据虚拟化作为数据集成工具包中的一个战略工具,但人们仍然存在一个先入为主的观念,那就是企业级数据仓库是唯一的大规模共享数据的途径。不言而喻,企业级数据仓库解决了很多问题,然而15年的行业经验表明,只有25%的用户有效利用了他们的仓库,因为往往只有一小部分可用的企业财务、销售和市场数据存放在数据仓库中。因此,有一种方法可以克服这种障碍,那就是将企业数据仓库定位为共享数据的关键来源,与其他诸如业务数据存储(ODS),源交易系统,外部数据源等共同作为共享数据的来源。
有趣的是,基于XML的行业标准既是一个潜在的障碍,也是一个重要的驱动程序。虽然诸如流程生厂商包括炼油厂的MIMOSA标准,用于上游勘探和生产的PIDX标准,和用于海事信息的MIEM标准,是满足XML行业标准需求的起点,但我们仍然面临缺乏全面标准的窘况。
最后,有一个关于数据所有权的问题,或者换一种过时的说法,“这是我的数据,为什么我要与你分享?”企业数据共享有助于通过使用统一标准和通用方法来对抗这种拒绝数据共享的行为。这使企业无需承载传统数据整合或标准兼容所带来的繁重基础设施负担。
广泛采用的加速器和路线图
如前所述,行业标准有利于加速企业数据共享。虽然各方估测不同,但使用预先存在的标准减少了30%到50%建设数据服务所需要的努力。有了预先设定的如何使用数据的标准,全部的设计和开发资源可能集中在访问和转化数据上,来满足这些已经协定的标准。
第二个加速器是现今高效的数据虚拟化的开发环境,用于建设所需的数据服务。为降低成本,最佳的开发工具提供了灵活的开发环境,满足了精通XML,SQL设计者和Java,XQuery开发工作人员的喜好,对于Java和XQuery的开发者来说,这些工具用来创建符合标准的自上而下的数据服务。对于面向数据的开发者来说,这些工具为底层数据访问和联合服务提供了自下而上的开发环境。
第三个加速器是大规模地改变或重新使用已经开发的数据资产。完成此任务需以下几个简单实用的步骤:
1. 企业和政府机构应该清查他们现有的数据虚拟化部署,将抽象的关系视图和数据服务分类,使其可重复使用,实现更大规模的数据共享。
2. 为了定位潜在人群和进程问题,IT应该在一个现存的集成能力中心或共享服务机构内,和各应用软件开发团队一起来制定数据虚拟化设计,开发和运营活动的计划。
3. 必须强制性的收集硬性的业务数据,例如销售额增加,生产率改进,风险降低,以及重大科技指标(例如降低成本,快速解决方案和知识)。有了这些,使用者可以放心地投资数据虚拟化中间件所需的资金。
公司和相应的公共机构需要能充分发挥其信息资产投资的技术。数据虚拟化是一个战略性的技术,越来越多地被IT团队采用,实现企业数据共享的承诺。制药和能源行业的企业以及联邦情报机构从企业数据共享中获得了有形资产收入,生产力,兼容性和成本效益所带来的好处。由于诸如缺乏全面行业数据标准此类的障碍已经消除,更多的企业和公共机构将会体验到企业数据共享所带来的益处。