大数据将成电信运营商金矿行业资讯

2014-04-24    来源:C114中国通信网    编辑:张海龙
C114讯 4月24日消息(张海龙)在2014国际数据产业峰会上,中国电信云计算与大数据产品线总监杨明川表示,我们一直是把大数据比喻成一个金矿,大数据众所周知,数据是资产,数据是

  C114讯 4月24日消息(张海龙)在2014国际数据产业峰会上,中国电信云计算与大数据产品线总监杨明川表示,我们一直是把大数据比喻成一个金矿,大数据众所周知,数据是资产,数据是生产力,数据是金矿。实际上在数据是金矿到数据真正能够发挥它的价值,其实有很长的一个路径要走,这是需要有多个环节的。任何一家公司,包括中国电信在内,不太可能从头到尾把所有的环节都能做好。而实际上目前为止,中国电信很多运营商还是做得比较基础的方面,我们更多是把数据资源,能够采集,能够做一些处理,做一些汇聚,真正让数据发挥价值还有一定的路径要走。

  在杨明川看来,大数据对运营商存在四个方面问题,一个是成本,一个是技术门槛,一个是商业模式的问题,一个是管理创新的问题。在这四个方面,通过大数据的一些技术,通过大数据的一些业务,能够为运营商能够带来很大的市场潜力。

  首先我们来看第一方面的价值,成本和可用性方面。Hadoop是大数据的底层技术,Hadoop来自于谷歌相关的系统,它的核心理念,是用大量的廉价设备,来构建高兴能,低成本的集群。大数据对于整个运营商的系统而言,第一个价值就是能够省钱,特别是我们现在拥有海量的数据。以前海量的数据,可能绝大多数的数据可能在经过一些简单的处理之后,就全部放弃掉了,因为我们没有这么大的存储和这么大的计算资源,可以保留下来,可以进行深度的挖掘。现在通过大数据的技术,我们有可能能够使这些数据不断的挖掘,不断发现新的价值。像这种理念,就是从大数据的系统设计理念来讲,本身也是一种互联网式的。

中国电信云计算与大数据产品线总监杨明川

中国电信云计算与大数据产品线总监杨明川

  第二个方面,大数据技术和以前用的大量的IT系统,数据库系统一个很大的区别,整个这个体系,绝大多数都是基于开源系统来做的,我们现在也在讲怎么样利用开源,怎么样去IOE,这里面给我们一个很重要的价值,就是我们现在有可能比较低的成本,在开源的基础上,根据自己的需要去研发相应的系统。

  我们把大数据分为四个层次,数据存储,计算框架,数据分析,数据应用。在数据存储方面,我们现在引进到分布式文件系统。

  数据库我们从光纤数据库到新的数据模型,使得我们有可能去处理一些比较复杂的,副规则的,非结构化的数据。

  结构框架来讲大家讨论最多的,其实我们最早分布式计算,我们有并行高兴能计算机的,包括现在的大型机,超级计算及MPP的架构,到网格这样一种并行计算的技术,到大数据2.0,我们现在通过YARN这样一个框架,能够把不同的计算模型进行整合。

  数据分析这个层面,传统的统计分析,积极学习,我们现在新的技术也在不断推动大数据体系的发展,包括数据可视化,深度学习,新的一些技术的出现,推进大数据能够向纵深进行发展。

  在应用这块,大数据的应用,我觉得总结起来很简单,所有的大数据应有围绕这三个东西做文章,一个是怎么样研究人,人的行为,人的特征,人的兴趣。一个就是物,包括我们研究的各种各样的事物,比如说我们要做电子商务的,我们要做影视娱乐,我们要做其他的。还有很关键的就是研究它们的关系。

  接下来我们再来看一下大数据是否能够给我们带来新的商业模式,我们一直是把大数据把它比喻成一个金矿,大数据众所周知,我们都已经达成共识,数据是资产,数据是生产力,数据是金矿。实际上在数据是金矿到数据真正能够发挥它的价值,其实有很长的一个路径要走,这是需要有多个环节的。我们从矿山里面把矿挖出来,再把它提炼出来,再进行交易,再生产加工,最后做成成品,整个一个链条,我们以这样一个挖矿的模式做一个对比,每一个环节大家可以看到,真正的大数据发挥价值,它实际上是一个产业链协同的发展。任何一家公司,包括中国电信在内,不太可能说我从头到尾把所有的环节都能做好。而实际上目前为止,中国电信很多运营商还是做得比较基础的方面,我们更多是把数据资源,能够采集,能够做一些处理,做一些汇聚,真正让数据发挥价值还有一定的路径要走。

  这个商业模式在大数据未来的产业会形成数据资的提供商,数据技术的提供商,数据的处理商,数据平台的运营商,数据能力的开发商,数据应用的提供商等等,每个环节可能都有不同的公司,不同的合作伙伴在里面,大家共同能够形成一个产业链。

  这是从另外一个维度来看大数据的商业模式,我们可以从三个维度来看,一个是数据来源,应用领域,应用场景。我们来看大数据的行业应用是什么样的一个方式。

  从数据来源来讲,运营商有大量的数据,但其他的至于互联网公司,金融机构,互联网部门也有大量的数据,在不同的行业,互联网,电信,影视传媒等等不同的模式。这个魔方里面的任何一块,可能都能去挖掘出一些新的大数据的商业模式的点。

  大数据的价值,除了前面讲的,创新的商业模式,技术门槛等等,还有一块是大数据对于运营商来讲能够驱动管理创新。我们做了一个以往预警的案例,大家知道3G用户几家运营商之间竞争也很激烈,我们做了一个预测,这个预测本身不是很新的技术,但是有一点,这个预测本身是一个多环节闭环的过程。从我们进行以往用户的发现,就是我们的预测发现,到我们对它进行一些策略的用户的分类,到一些维系,到效果评估,我们真正要把这个以往大数据分析要做好的话,它会成为一个闭环,而且更为关键的是在这个闭环里面的每个环节,需要电信系统的不同系统要和它做对接。这里面隐藏一个思路,我们要用大数据的方法,去驱动内部各个关联系统的改革和创新。这一点我觉得未来可能这只是其中的一个案例,未来大数据可能在内部应用来讲,真正要发挥价值的话,更多的并不是我的技术本身,并不是我的算法本身,而是这个技术的算法,怎么样能够和各个系统能够形成一个有效的衔接,能够从技术推动管理的创新。

  第二个问题,我们未来3到5年,能不能成为一个大数据公司。要成为一个大数据公司,我们需要具备几个方面的条件。首先我们要有丰富的数据资源,这个条件还是比较具备的,第二要有强大的数据分析能力。第三是成熟的商业模式和足够大的市场空间。后面这两点还有待检验,目前来看大数据虽然说业界炒作很热,但是真正很成熟的,有很大市场空间的利用,其实还处于初级阶段。

  我们首先来看运营商的数据资源,这个应该说是一个现成的数据,从运营商的角度来讲,我们的数据有几个特征,首先是覆盖广,我们的海量的用户数,包括不同类型的用户数。然后是种类多,包括幸运数据,呼叫数据,终端数据等等。还有就是体量大,都是TB级以上的数据。还有就是质量。

  通过不同来源,高质量,高数据量的数据,我们有可能在大数据领域做出我们自己的贡献。

  第二,今天会的主题也是云和大数据,其实云的资源可能能够为大数据提供一个很好的支撑。因为大家也知道,包括Hadoop这样的系统,它需要海量的计算资源去构建海量的集群,在这种方式里面,云的资源应该和大数据有一个很好的结合。中国电信现有的SDN也好,怎么样把SDN,把职能广告,和IDC的优势资源和大数据相关的技术和业务进行有效的整合,未来可能会在整个大数据的产业链里面,为我们争得更有利的地位。

  运营商在这块,我们也进行了大量的大数据的探索,总体来看无非就是两个类型,一个是对内的大数据应用,一个是对外的应用。对内其实很多,这里面不能一一列举了,比如我们利用大数据分析网络运行的数据,能够进行网络优化,能够进行用户的刻划和分析,能够对我们电信的产品进行一些精确的营销,能够对我们现有的产品进行一些评估等等等等。

  对外可能是空间更大,更有潜力。当然也是最有不确定性的。我们大数据的创新的应用,大数据的行业应用,我们开放的数据服务,可能也会提供大数据的资源服务等等这样一些。

  我们也在前面讲了,我们有大数据的资源,有云的资源,我们也在研究云和大数据怎么样进行融合,这是我们的一些前期的探索。

  从数据的角度来讲,把大数据的价值要真正能够挖掘出来,我们有一个数据金字塔的模型,这是从底层的数据,我们通过逐层的分析和提炼,使数据价值越来越高,也越来越对接行业的需求。我们希望通过这个数据金字塔的打造,能够不断的挖掘新的数据价值,不断去贴近用户的需求,也能够更好的做好数据的运用。

  在这些事情做了之后,我觉得未来我们做大数据一个制高点,或者是一个真正的能够让大数据这个产业能够有效的凝聚起来,我们可以尝试开放式的平台。这里面有几个关键词,一个就是聚合,在做大数据尝试的时候也发现,单有运营商的数据其实也很难说能够做出一个很好的大数据的应用,其实应该更多的把运营商的数据和互联网的数据,甚至政府的数据,各种数据进行一个聚合,通过数据的聚合,能够具有更多的数据价值。

  第二就是开放,在数据的基础上,怎么样能够使大数据以产业链的方式,能够和合作伙伴一起来做开放的应用创新。

  第三就是跨界,真正最成功的大数据的案例,就是做跨界,把互联网和金融怎么结合起来,互联网和隐私怎么结合起来,电信和保险怎么结合起来,所有成功的大数据的应用都在做跨界的事情。

  最后一个关键词是创新。你这个能够徽剧的数据源越多,根的基础就越扎实,主干就越茁壮。树的上半截不同的分杈,不同的行业,有了这些数据汇集了以后,你朝不同的行业延伸得越多,树越能够茁壮。我想这里面主干我觉得就是我们数据开放的平台。

  最后还要谈一点就是数据安全,这是非常关键的。其实主要就是说数据安全本身,还有就是保障用户本身,用户的隐私,这个话题我觉得首先来讲,我们非常重视数据安全的保护,也采取了很多的措施,包括用户的数据,它的加密,它的脱敏等等。还有就是我们数据和对外合作的时候,一定是汇总之后群体的数据,避免用涉及到个人隐私的数据等等这样一些措施。当然这些信息在未来几年还会是一个不断争论的开放的问题。

1
3