中国联通:赢得大数据时代的先机行业资讯
大数据有大价值
大数据是当下的热门话题,有一句话说得非常好,叫云计算改变IT架构,大数据改变商业模式。在未来,企业所有能够量化的内容,全部都会数字化。在这个过程中,云计算由于能够具有计算和存储所需的扩展性和弹性,可以以更低的成本和更高的效率,去分析、挖掘企业所有的数据。可以说云计算等技术为大数据的发展、未来企业的数字化奠定了基础。
从当前的行业背景来看,运营商们还处在转型的过程中。中国运营商2012年的财报显示,中国的电信市场是一个红海市场,已经有超过11亿移动用户,而每个月都有将近8000-9000万用户在大进大出。除了中国移动的利润率相对高之外,中国电信和中国联通的利润率仅处于2-3%的水平。这意味着,运营商必须要做出转变,提高利润空间。
另一方面,OTT对电信业务的替代和冲击日益严重。例如,2013年春节期间,虽然运营商总体的短信量是上升的,但仅是微幅上升,而且点对点的短信实际上下降了10%左右。这表明,互联网OTT业务正在蚕食或替代传统的电信业务,运营商必须要转变发展模式,利用大数据技术,实现更低的成本和更高的效率。
中国联通期望从三个方面去发挥大数据的效用,即提升客户体验、加强透明管控和科学运营、构建新的商业模式。首先,中国联通可以把除了IT系统所包含的结构化数据以外的其它数据,进行整合,包括用户上网日志、访问记录、位置信息、终端信息等等。这些信息能帮助运营商更加清晰地感知用户的实际需求,知道用户是谁、在什么地方、用什么样的终端、需要什么、访问什么……也就是说,运营商可以通过数据,发现和感知客户需求,从而为用户提供更好的产品和服务。
第二个方面是针对运营商企业内部的透明管控和科学运营。通过数据,运营商能够360度地透视每一级运营主体,知晓市场发展情况、财务状况等,以便从更多维度了解企业,更好地去平衡收入和成本之间的关系。我们也称之为精准化的资源匹配,这将改变传统的粗放型经营模式。
大数据使用的第三个领域是构建新的商业模式。国内最近谈得比较多的话题是虚拟运营。如果虚拟运营是未来新的商业模式,那么运营商就需要把用户的完整数据提供给虚拟运营商。然后,虚拟运营商才能基于基础运营商的网络和数据,开发一些有特色或者创新的产品。另外,运营商在应对OTT业务竞争时,也离不开数据的支持。这表明大数据对运营商而言,是开创新价值蓝海的重要保障,有利于改变传统的经营模式,有助于提高客户的感知质量,增强运营商自身的实力,能有效应对来自于虚拟运营和OTT的业务冲击。
现在,国内的大数据应用暂时处于尝试和探索的过程中,产业链中的玩家们需要冷静下来,认真思考企业的实际情况和所处阶段,探讨未来大数据能带来的价值,推动大数据应用真正落地。
中国联通如何赢得先机
分析运营商的优势与不足
过去十几年,运营商一直在努力地成为智能管道,但是很遗憾,转变的过程相当艰难。不可否认的是,中国信息化基础设施水平有非常大的提升。对运营商来说,也形成了几个关键资产,那就是网络、用户、数据。网络是基础,是高速公路,所有用户都要接入到运营商的网上来,会产生各种各样的消费记录,这些记录又是通过数据来量化的。
因此,运营商可以获得的第一手数据就是客户姓名、性别、年龄、流量等,还能进一步知道客户的终端类型、经常访问的内容。过去,我们因为成本很高、企业管理粗放等原因,让这些数据白白流失了,没能将其真正转化为价值。
而在今天,云计算和大数据提供了基础技术保障,使我们可以把这些数据整合起来,进一步分析和挖掘,提炼出面向新商业模式的,或者面向客户感知的数据。这样的数据就是高价值、高聚合、高密度的数据,有助于实现上述三个目标。这也是运营商的先天优势。
当然,运营商也有不足。具体来说,运营商主要的经验来自于传统的通信产品和服务,很难做到面向每一个用户的精准的洞察和业务提供。但毫无疑问,运营商必须朝这个方向努力,否则无法与OTT相竞争。关于这个话题,如何满足用户的需求——CEM(客户体验管理),在今年TM Forum上也有很多探讨。此外,在国内还存在体制和机制问题,三大运营商需要进一步激活,才能真正参与到大数据、互联网、移动互联网的竞争中来。
转变IT系统建设模式
中国联通在国内运营商的大数据应用中,走得比较靠前,集团公司的领导层非常重视大数据的应用,以及新商业模式的创造。从线上来看,中国联通已经把大数据作为未来发展的主要战略,IT系统的下一步发展也确定了是以“集中大数据为核心,顶层设计引领IT建设,服务下层,助力客户感知”为总体战略。
在这个思想指导下,中国联通全面启动了以数据为中心的、集中化和一体化的IT系统建设,其目标是改变传统的建设模式,即每个系统从应用到数据,全部是烟囱式的建设模式。这是源于在数据层面,分散、割裂的数据难以形成一致性,数据和数据之间整合的代价也非常高昂,数据的应用很难发挥其整合优势,或者说数据越大,边际效应和价值越高。因此,中国联通未来的建设模式全部要转变为“平台+应用”的模式,构建全集团唯一的、集中、开放的大数据平台,并在这个平台上构建各种各样的应用。
这是建设模式的重要转变,其核心就是大数据的平台。中国联通计划把所有IT核心的数据、网元侧的数据、互联网的数据,乃至与外部合作和关联企业或者第三方交换的数据,全部整合,形成能够反映企业全景、客户全景、所有产品/渠道的大数据平台。这个平台采用大数据技术处理海量数据,并且能够将不同需求、不同业务有效整合,为上层应用提供定制化的服务,就是“统一平台,应用百花齐放”。
当前,除了把传统的IT数据集中之外,中国联通也在采集手机用户的互联网浏览日志、访问记录,并据此在2013年“315”正式对外提供用户流量查询服务,目的是解决数据时代用户的透明消费问题。在此基础上,运营商还能有更多作为,比如进行基站的优化。根据采集到的流量数据、访问记录,运营商能很清楚地知道,每个基站的用户实际访问量、负荷,从而判断基站规划是否合理,基站是否要扩容、是否要优化、是否要增强承载能力,或者缩减等。这样一来,运营商就能提升网络规划的质量和效益。
另外,运营商还可以做定向的营销。举个简单的例子,假设某个用户本月对数据的需求特别多,流量即将超出套餐使用的范围。此时,运营商能精准地知道用户的流量使用情况,及时推送一些临时加载流量包,这就非常契合用户的需要。这类应用场景在过去是不可能实现的,这是因为我们把流量数据扔掉了,现在我们把它收集起来,下一步还会把信令信息收集起来,为用户提供更多服务。
随着数据的集中,以及基于这些数据的关联、整合、分析,很多数据应用场景应运而生,可以无限畅想。在这些方面,中国联通做了非常多的尝试,将会推广更多新的业务模式。
克服系统集中化的挑战
为了建设大数据的统一平台,中国联通需要建设企业数据中心和资源池,对此,中国联通的最大挑战来自于过去的两级系统、两级架构,公司的管理、组织架构、IT系统等都是两级架构,即31个省有各自的系统、数据和应用。因此,我们的挑战在于把传统的两级架构,变成集中式、一体化的IT架构。具体过程是:在过渡期,系统会把数据从31个省,抽取汇集到集团的一级系统;在目标期,省级系统逐渐弱化,最终不再保留,实现一个平台支撑所有应用和场景。
由于小型机无法支撑如此庞大的数据量,一个平台在过去是不可能实现的。而现在,云计算技术在计算和存储上实现了极大的扩展性与弹性;大数据技术则实现数据层面更多的关联、整合与分析;应用软件的SOA架构有助于灵活适配各种场景对系统的柔性配置要求。所有这些技术为集中化、一体化系统提供了必不可少的技术保障。
第二个挑战是系统集中化之后,集中运营能力的建设,包括集中系统要能够快速响应市场,满足客户需求,适配不同阶段的具体管理需求。集中运营能力将会成为未来信息化战争的中枢神经系统,能够记忆数据,洞悉从省公司到地市,甚至到一线的网格的实际经营情况,还有客户感知,并做出及时的、针对性的反馈和知会。
中国联通在集中运营方面的进展非常明显,部分集中系统已经建成,还有很多计划在实施中。毋庸置疑的是,这是一个清晰、明确的战略。中国联通从上到下已达成这个共识,转型也在稳步推进中,所有新系统的规划和建设全部以数据为中心,注重数据的透明、刚性、规范、质量、安全,这是一切基础的基础。
实施IT基础设施云化
中国联通IT基础设施建设是以大数据为核心的一体化、集中化的模式,会形成全国性的2-3个EDC(数据中心)整体布局,称为两地三中心。中国联通在两三年前就做了规划,目前实施了两大数据中心基地的建设,很快会交付使用,分别是廊坊基地和呼和浩特基地。北京亦庄和廊坊是双活的两个生产中心,距离只有18公里。同时,呼市会构建一个灾备中心。这样就能形成北京和廊坊,以及呼市的两地三中心的总体架构。
在IT基础设施方面,中国联通强调资源的池化建设,计算和存储资源应该集中、共享、开放,技术选择也依据这几个基本原则,所有应用全面向云化的方向迁移。承载模式重视基础资源的弹性和复用,利用“X86+虚拟化”,以及大数据分布式计算,构建超级大的集群,面向应用提供计算能力和存储能力。从2012年开始,中国联通集中系统的建设全部采用了这个架构。
资源的池化有很多成功的案例。以淘宝为例,其每天产生大约1.5PB数据,其计算的集群大于1500个,只需要2小时,就把1.5PB数据处理成20TB的高价值数据,提供给上层的各个应用和各个部门,以及所有用户。这对我们是非常好的借鉴。同样地,运营商未来的数据规模也会非常大,大量数据是低价值、低密度的,需要进行处理、加工,得出高价值、高聚合的数据,并且和运营商已有的IT系统的MBO数据进行整合,然后提供给业务。
定制混搭的数据处理技术
数据有不同的类别,有结构化、半结构化、非结构化的数据。传统IT系统的数据就有结构化程度比较高的MBO数据,还有半结构化的用户访问互联网的日志数据,以及非结构化的用户访问互联网的内容数据,等等。
不同的数据有不同的应用场景,需要采用不同的数据处理技术。传统关系型数据库能处理复杂的关联分析、多维挖掘,对于结构化数据的处理有它的独到之处。Hadoop比较擅长非结构化和半结构化数据的加工和提炼,对海量分布式数据的处理效率非常高,但不擅长做复杂多维关联分析。也就是说,对于海量的低价值、低密度数据的加工和处理,运营商可以采用Hadoop这样的计算体系。在处理完这些数据,并整合、关联、汇总,形成高价值数据后,运营商可以使用Oracle等传统的数据库或MySQL这样的新型数据库。
当然,还有一些场景,比如用户的即时查询,需要通过内存数据库提供加速,让用户感知非常快捷,一点击就能得出想要的结果,还有一些使用列存数据库的场景……所以说,单一数据库肯定不能满足需求,运营商需要一套体系来适应不同场景、不同应用的需要,即深度定制的混搭结构才是最合适的。