MapR加入EMC大数据 拥抱新的Hadoop分布式平台存储与灾备

2011-05-30    来源:Stor-age.com    
MapR科技与数据存储和安全巨头EMC在5月25日披露了一个新的软件授权协议,并在EMC的新Apache Hadoop分布式系统中加入它的知识产权。 座落于加州圣何塞市的MapR将会成为EMC Greenplum HD企业版

  MapR科技与数据存储和安全巨头EMC在5月25日披露了一个新的软件授权协议,并在EMC的新Apache Hadoop分布式系统中加入它的知识产权。

  座落于加州圣何塞市的MapR将会成为EMC Greenplum HD企业版的一个重要组成部分,它实现了对Apache Hadoop软件堆栈的100%的界面兼容。新的装置将为预集成和测试分布系统使用MapR技术的集群IP。

  由以前的苹果公司、Xerox PARC和雅虎资深开发者Doug Cutting创建的Apache Hadoop,是一个建立在Java上的开源软件架构并使用分布式加强数据应用来工作。它使得应用能够安全的扩展以便可以处理无数的节点和PB级数据。

  尽管一些Hadoop分布式系统是可用的,但它们无法处理所有的单点故障问题,缺乏快照功能、缺乏镜像功能以及性能低下,这些都是为何要将MapR推上台面的原因。

  MapR的功能概述

  MapR的CEO John Schroeder对eWEEK透露了一些关于MapR的功能,其中包括:

  对网络文件系统(NFS)的直接浏览,允许用户使用NFS协议来简化加载以及直接在Hadoop集群中浏览数据,允许标准工具和实用程序直接运行在包含于Hadoop中的数据上。

  Heatmap用户界面提供全部的集群可视性与控制。

  所有的单点故障不会出现在Hadoop 堆栈中。

  JobTracker HA(高可用性)能够确保连续执行作业。

  带有高可用的分布式的NameNode(命名节点) 解决主要的可靠性问题的同时,也提高了性能和扩展性。

  快照允许对时间点数据的保护和恢复。

  维持企业工作连续性的镜像包含大范围的复制支持。

  Evaluator Group 的高级分析师John Webster指出“这对每位Hadoop用户来说是一个重要的进步。MapR的创新与EMC的大数据分析能力和服务相结合,将会允许更多的人来使用大数据分析的能力。使得出现实质性的市场增长。”

  “MapR已设法在性能、降低成本、可靠性和易用性上得到改进,这标志着Hadoop的市场将发生重大的改变。”

  Hadoop受到Google's MapReduce的启发

  目前在Cloudera担任Apache 软件基金会的主席Cutting曾表示:Hadoop受到过Google's MapReduce和Google文件系统的启发,MapR使开源软件MapReduce实现了商业化。

  以Cutting儿子的大象玩具来命名的Hadoop,不断的被全世界各地的参与者所维护和改良,其中作为Hadoop的初始推动者之一并正在赞助一个Hadoop开发者会议的雅虎公司,已拥有为此项目服务的大量参与者并广泛的使用Hadoop来应用于自己的业务当中。

  Webster指出:“在从传统数据仓库转换到大数据分析的过程中,Hadoop起到了主导的作用,EMC的Hadoop商业化战略旨在为企业级用户精简并强化Hadoop,使得Hadoop更多程度上成为企业必须具备的实时分析工具。”

1
3