IBM将Apache®Spark™纳入其核心分析与商务软件IBM

2015-11-03    来源:IDCUN    编辑:IDCUN
IBM公司日前在拉斯维加斯"Insight 2015"大会上宣布通过Apache®Spark™重新设计了公司超过15个核心分析与商务解决方案,极大加快了实时处理能力。IBM还宣布,继测试版 计划成功试用13周之后

  IBM公司日前在拉斯维加斯"Insight 2015"大会上宣布通过Apache®Spark™重新设计了公司超过15个核心分析与商务解决方案,极大加快了实时处理能力。IBM还宣布,继测试版 计划成功试用13周之后,在IBM Bluemix上正式推出其Spark即服务(Spark-as-a-Service)解决方案——IBM Analytics on Apache Spark,试用期间,超过4600名开发者利用它来构建智能商务及数据驱动型消费者应用。

  由加州大学伯克利分校AMPLab实验室开发的Apache Spark以易于创建能够利用来自复杂数据洞察的算法而闻名。通过利用适用于频繁访问的信息并能更快处理数据集的Spark内存缓存,IBM能够简化一些 最广泛使用的软件解决方案与云数据服务架构,例如IBM Big Insights、IBM Streams和IBM SPSS。

  例如,IBM把公司最流行的数据准备和数据精化服务Data Works代码库从4,000万行代码缩至500万行代码,削减超过87%,通过在Spark上重新开发而简化操作,大大降低构建与部署时间。Data Works现将直接得益于Spark的可扩展性、分布式编程模型、数据源连接及项目参与者向Spark交付的频繁增强功能。

  Spark是一个敏捷、迅速并易于使用的开源技术,同时能够从根本上简化开发应用的流程。作为一项基于IBM托管的云数据服务中为广泛的开发者提供的服务来 说,IBM Analytics for Apache Spark可轻松集成IBM Bluemix云平台上的开源、专属和第三方工具。因此,开发者可以实时地将分析工具融入到他们开发的应用中。

  位于加拿大新斯科舍的SolutionInc公司提供全球50个国家的酒店、会议中心和热点中托管、高需求的公共Wi-Fi和有线访问。作为一家跨国Wi- Fi提供商,SolutionInc需要迅速分析来自多个数据源的海量Wi-Fi数据集,以识别流量模式与趋势。利用IBM Analytics for Apache Spark on Bluemix,SolutionInc能够提取诸如峰值时间、黄金地段、路由模式与设备类型等相关数据集,为其客户提供可行洞察。 SolutionInc总裁兼首席执行官Glen Lavigne表示:“通过IBM Spark技术,我们能够探索超过2.4亿行Wi-Fi日志信息并识别设备流量模式与多方位数据。这些分析工具能够让我们更好地了解市场需求和趋势,并为我们的客户提供更卓越的服务。”

  IBM大数据与分析产品开发部副总裁Rob Thomas表示:“对 于那些想要通过其数据做更多事的数据科学家和工程师们来说,诸如Spark等技术的开源创新实力与吸引力不容否认。IBM致力于利用Spark作为其行业 领先的分析平台基础。通过提供基于IBM Bluemix完全托管的Spark服务,数据专家们能够更快访问并分析其数据,且大大降低复杂性。”

  IBM云数据服务总经理DerekSchoettle表示:“云 数据服务聚焦于给开发者提供必要的工具,使他们能够尽快的将应用投放到市场上。IBM Analytics for Apache Spark简化了开启Spark的进程,让数据专家可以专注于开发应用,而不是去耗费时间管理Spark集群或者具体的操作。由于融入了关键的IBM云数 据服务,因此用户可以更轻松的在Bluemix上构建一套完整的解决方案,并以事半功倍的效果从更多的数据中提取更深刻的洞察。“

  自2015年6月宣布将致力于Apache Spark社区以来,IBM已经对Spark项目做出了60多项贡献,其中包括机器学习与SQL,同时IBM Spark技术中心已雇佣了35名Apache Spark提供者,并通过BigData University.com的免费线上课程培训了310,000余名数据专家。由IBM在美国波士顿、旧金山、中国北京和上海等城市主办的全球 HackSpark挑战赛,数据专家们已创建出100逾种不同的数据产品,其中包括一个利用Spark分析与安珀警报相关的车辆流量的视频传送项目,及一 个将被旧金山警察局用来帮助预测犯罪事件的热图。

  可参看来自IBM商业价值研究院的更多详情:根据"Analytics: The Upside of the Upsurge"报告显示,至少有四分之三的研究人员正计划或者已经应用到数据流、实时数据、自主分析工具和基于云的数据或分析服务。

1
3