整合与分析:发挥大数据价值的两大关键
2013-07-25 通信世界周刊 编辑:鲁义轩
Q&A:中兴通讯有线经营部服务产品总监 汤太军
Q近期美国AT&T开始向需要的公司销售客户使用数据,被视为利用大数据资源盈利的一种尝试。此前许多电信运营商的很多数据都是通过专有网络引擎以及高度专业化的CRM及计费软件收集的,但如何于挖掘这些数据的价值并为己所用,似乎没有太强的能力。在您看来,这样的现状需要通过哪些方式解决?
汤太军:运营商现在主要的问题不在于没有数据或是数据量不足,而是在于其有效识别和组合分析数据并将其转变成知识的能力相对较弱,AT&T对外销售的是经过分析处理的数据资产,这需要具备大数据的分析处理能力,而不是原始数据的简单销售。运营商首先要能把自己业务系统中产生的各类数据整合起来,比如CRM系统、计费系统、信令系统、资源系统等,找到数据间的相关性,识别真正有用的数据,排除数据废气的干扰,同时还要考虑用户隐私保护问题,经过一系列科学化处理以后的数据才能真正称之为大数据资产。运营商目前迫切需要的正是这样一个大数据的前期处理平台,能整合来自不同业务运营部门分散的数据库,统一数据存储,完成数据清洗和转换,转变成可进行多维度分析的数据元组保存下来,进而不断利用或者交易它们。所以运营商要解决大数据资源的盈利问题第一步需要建立一个适应大数据的集成平台,第二步是基于平台开展数据整合工作。运营商可以通过采购成熟的大数据系统和数据分析服务来快速获得这种能力,也可以通过战略合作的模式逐步打造培养自身的大数据资源和人才队伍。
Q 在挖掘大数据价值并转变为商业价值的同时,运营商该综合哪些因素的考虑,利用哪些技术搭建起一个平台,使其发挥数据分析的作用?
汤太军:电信运营商的数据特征较为鲜明,一类是海量但实时性要求不高的数据,如后付费计费消息、信令消息、性能统计数据等,另一类是实时性高的流数据,如流量统计、位置信息、实时账单等,因此在构建大数据平台时必须兼顾这两类数据的处理。
运营商以往的数据库系统比较适合格式化、批处理、非实时性的数据,而在流数据和互联网数据处理方面存在不足。构建大数据的平台并不需要抛弃运营商已有的关系数据库系统,相反可以继续利用关系数据库系统在处理结构化数据方面的效率优势,在此基础上叠加针对非结构化数据和流数据的系统,从而实现最低成本的大数据平台演进。
毫无疑问,在非结构化数据批量处理方面,Hadoop已经是事实上的标准,主流的数据库厂商也都采用了这一技术,运营商也不例外,但由于Hadoop是开源技术,同时对使用者的技术要求比较高,因此我们建议运营商选择经过商用化处理的Hadoop内核方案,在易用性和可扩展性方面都好于纯粹的开源产品。而对于流数据的处理,业界已有比较成熟的解决方案,基于复杂事务处理的流处理技术已经有较多的应用,可以选择商用化的系统进行部署。
当然要实现数据的高效利用,还需要在数据的输入部分和输出部分做一些定制化的处理,使得数据输入环节能识别和区分不同的数据处理需求,将合适的数据分发给合适的系统进行处理,而数据输出环节则充分利用可视化技术以更加友好的方式来呈现结果。
在搭建大数据的价值转化平台过程中运营商应该综合考虑技术、成本和资源的因素,还要考虑与现有数据处理系统的兼容性问题。
借鉴国际经验
Q 国际上有哪些运营商已经开始利用大数据提供服务获得先期经验?
汤太军:Verizon在美国推出的“Precision Market Insights”服务,已经开始向第三方售卖Verizon手上的用户数据,对商场、体育馆、广告牌业主等出售特定场所手机用户的活动和背景信息。
2012年西班牙电信公司成立了一个新部门——西班牙电信数字洞察(Telefonica Digital Insights),目的就是为企业及公共部门提供基于用户匿名位置数据的“分析洞察”,其第一款产品是智能步 伐(Smart Steps)已为零售商和其他机构提供手机用户全天活动的位置“热点地图”(heat maps)。
德国电信和Vodafone在利用大数据为自身业务服务之余,已向商业模式跨出了一步。主要尝试是通过开放API,向数据挖掘公司等合作方提供部分用户匿名地理位置数据,以掌握人群出行规律,有效地与一些LBS应用服务对接。
从国外运营商的先期经验来看,大数据服务尚处于初级摸索阶段,运营商更多的是扮演大数据资产拥有者的角色,并没用通过大数据的洞察和利用来获得更多的价值。西班牙电信公司成立单独的公司运作大数据应用,通过独立公司或控股合作公司专门开展大数据服务不失为一种好的发展模式,可供国内的运营商借鉴。
数据分析与流量经营
Q 此前运营商谈的较多的是流量经营,通过分析不同的业务等级提供不同级别的服务从而获得差异化经营,大数据的数据分析以及商业转型似乎和流量经营有同样的方向,大数据服务如何融入到流量经营策略中?
汤太军:流量经营的一个核心是要能对流量进行高效的识别和分析,要实现基于流量的精细化运营更要求系统能对大流量数据实现实时化的分析处理,从而为流量管控提供真实可靠的参考信息,因此流量经营一定程度上可以说是大数据在大流量数据实时分析处理方面的一个典型应用。
但大数据的一个最重要的优势就是数据可以通过再利用发挥更大的价值,需要不断发现新的价值模式。以流量经营为例,通过对实时流量数据的分析可以实现流量的及时管控和流量疏导均衡,这些实时的流量数据是否过时就没用呢?不是的,通过对一段时间历史流量数据的批量分析,运营商又可以发现整个网络的流量分布特征,这可以指导运营商调整网络的规划布局,发掘新的流量增长点。通过对特定人群的流量数据分析,可以推出个性化的流量套餐,进一步提升套餐价值。需要说明的是,流量数据仅仅是大数据中的一种类型,通过把流量数据与其它的业务经营数据结合进行相关性分析,还能获得更多的商业机会,流量经营仅仅是运营商结合大数据分析拓展收入的一个方向而不是惟一方向。