大数据对资本市场的吸引力方兴未艾行业资讯

2014-04-25    来源:中文科技资讯    编辑:佚名
日前,位于美国硅谷的大数据智能关系管理公司RelateIQ再获4000万美元融资(新估值2.45亿美元)。而在最近一年的时间里,全球大数据行业已有20多起千万美元规模以上的融资案例,累计

  日前,位于美国硅谷的大数据智能关系管理公司RelateIQ再获4000万美元融资(新估值2.45亿美元)。而在最近一年的时间里,全球大数据行业已有20多起千万美元规模以上的融资案例,累计涉及投融资金额超过20亿美元。   

  与以往融资的大数据公司主要处理结构数据不同,RelateIQ主要是通过实时分析公司业务中的电话、短信、邮件等非结构数据,为公司管理客户、维护员工提供建议。   

  “现阶段全球对大数据比较成熟的开发应用主要在于个人信息、交易纪录等结构数据,这部分的价值显而易见。RelatelQ的成功融资表明,文本、视频、图片和音乐等非结构数据的开发正在成为大数据的新蓝海。”专注于企业级非结构大数据处理公司慧思拓CEO包启挺表示。   

  占比八成以上   

  根据包启挺介绍,对于企业CRM数据库、网络浏览轨迹等结构化、半结构化数据,由于相关的处理方法和计算模型比较成熟,已成功实现商用,例如应用比较普遍的电商网站推荐系统。   

  与之相比,躺在办公室、互联网各个角落的非结构化数据,像员工日常工作中产生的会议记录、录音或者电子邮件,以及潜在网络客户浏览的文本、发表的评论、晒出的图片等等,却因分布零散、分析困难,很少有大数据公司前往问津。   

  但这并不意味着这些非结构数据就没有价值,或者比结构数据的价值要小。   

  相反,国外一家类似RelatelQ的非结构数据公司慧锐(VERINT)的一项调查显示,有42%的企业管理者认为非结构化数据处理起来是一个很大的难题,同时93%的管理者认为这些非结构化数据对企业来说非常重要。   

  “非结构数据分布广泛,获取方便,这为价值挖掘提供了条件。比如,虽然淘宝的用户数据是封闭的,用户的评论和评价都是公开的,抓取之后,通过各种维度的重构和计算,同样能提炼出对企业的产品设计、定价、营销和售后等各环节有用的信息。”包启挺说。   

  国际市场研究机构IDC的一份报告还显示,结构化数据只是大数据的很小一部分,当前数字领域约1.8 万亿 GB 容量中,非结构数据占比在80%~90%之间,并且直到2020年都将以44倍的发展速度增长。   

  为大数据提供云计算服务的浪潮集团高级副总裁王恩东也指出,现在正处于行业内异构数据共享和价值释放的阶段,并在未来相当长的时间都会处在这个阶段。“这个阶段,会有大量的新技术和新产品涌现,无论是硬件还是软件。对于产业链上下游的系统厂商、行业ISV来说,这都是难得的"历史新机遇"。”   

  大佬陆续抢滩   

  鉴于非结构化数据在商业价值上的广阔空间,目前,全球范围内传统企业服务领域的大佬都在抢滩占位。   

  在国际市场上,代表性企业是以IBM为代表的国际咨询公司和SAP等国际数据巨头,它们致力帮助企业利用内部系统的非结构数据来改善内外部管理。国内市场方面,百度、阿里巴巴等为平型台IT企业也在利用自身的数据资源,开始了对非结构化数据的初步开发,主要用于监测和改进自身的产品服务。   

  非结构数据的一块重要领域,互联网上的非结构化数据在企业中的应用,也吸引了部分本土公司的注意,慧聪研究(HCR)和拓尔思(300229,股吧)(TRS)就是其中的两家。   

  公开资料显示,HCR是规模最大的本土市场研究公司,近几年频繁传出大动作;拓尔思则是中国最早的、最大的企业级搜索服务平台,在政企舆情监测、中文非结构化数据分析技术开发等方面有多年的积累,2011年已在创业板上市。   

  2013年年底,两家公司合资,成立了中国第一家专门针对非结构数据的企业级大数据处理公司,即是前面提到的慧思拓,由HCR副总裁包启挺出任合资公司CEO。   

  “拓尔思是中国最早的企业搜索公司,在中国政府舆情监测市场处于领先地位,在企业级非结构化数据抓取分析方面具有丰富的积累。HCR的优势在于,多年的企业服务经验,可以将海量非结构数据分析结果融入到企业的具体需求中去。”包启挺说。

  把握需求是王道   

  “慧思拓成立以来,我们一直在思考,怎么才能利用互联网大量的非结构数据创造商业价值。这里需要考虑两个问题,企业对非结构数据的需求是什么,非结构化数据如何重构成产品。直到现在,总算有了大致的思路”包启挺说。   

  在包启挺看来,这是一个全新的市场,国外算是刚刚起步,国内基本上是空白,而且不能完全借鉴国外仅有经验。因为国内外在文本、音频及图片等非结构化数据形态上存在天然区别,直接影响到后续的分解、重构过程,这恰恰是非结构大数据应用的最核心环节。   

  以文字为例,英语的语言结构相对简单,无外乎“主谓宾定状补”等六大部分,相对而言比较容易按照一定规则进行拆解和分析;而汉语就复杂的多,一个字多种词性、多种语音、多种意思的比比皆是,必须通过复杂的组合和计算才能准确进行解析。

  某知名大数据营销公司高层表示,“大数据的开发就是分析和重构,非结构化数据分解困难还在其次,最为重要的是,如何将分解之后的数据结合企业的市场需求,重构成为满足企业各种需求的信息产品,这也是目前最为困扰各大数据公司的地方。  

  目前,慧思拓在非结构化数据的相关产品已经展开试点,比如常见的客户回访,传统打电话方式的费时费力,转而通过抓取和分析网络上大量有关该产品的评论、晒图等非结构数据,将会对传统调研结果形成非常有效的补充和印证。   

  “当然,非结构化数据在企业层面的应用,绝对不局限于对客户回访、舆情监测等传统业务的改造,慧思拓还在尝试围绕海量非结构化数据为企业产品的生产、定价、售后等提供一整套全新的参考信息产品。”包启挺说,具体产品还在研发阶段,暂不方便透露。

1
3