EMC赞助《大数据,最大增长在远东》数字宇宙报告行业资讯
2013年3月1日, EMC公司公布了由EMC赞助的IDC数字宇宙报告《大数据,更大的数字身影,最大增长在远东》。该报告显示,尽管个人和机器每天产生大量数据,使数字宇宙前所未有地不断膨胀,但仅有0.4%的全球数据得到了分析。
随着全球范围内个人电脑、智能手机等设备的普及,和新兴市场内不断增长的互联网访问量,以及监控摄像机或智能电表等设备产生的数据爆增,使数字宇宙的规模在最近两年翻了一番,达到惊人的2.8 ZB。 IDC预计,到2020年,数字宇宙规模将超出预期,达到40 ZB。
仅就数量而言,40 ZB的数据相当于:
· 如果地球上所有海滩上的沙粒有700,500,000,000,000,000,000(即七万零五亿亿)颗。40ZB相当于地球上所有海滩上的沙粒数量的57倍。
· 如果把40 ZB的数据全部存入现有的蓝光光盘,这些光盘的重量(不带盒子或包装)相当于424艘尼米兹号航母。
· 2020年,40ZB相当于地球上人均5,247GB的数据。
今年的研究报告是IDC第一次显示了数字宇宙中的信息来源地,即它们是在哪里被首次抓取或利用,并揭示出一些正在发生的重大转变。六年来,该报告测量和预测每年产生和复制的数字信息,其中包含对“大数据鸿沟”的研究,即那些价值被隐藏的数据量和价值被真正挖掘的数据量之间的差距,和数据所需保护和实际交付水准之前的差距,以及全球数据的地理分布。
报告亮点:
· 快速膨胀的数字宇宙:IDC预计,到2020年,数字宇宙将超出预期达到40 ZB。
o 从现在到2020年,数字宇宙将每两年翻一番
o 在2020年,地球上人均数据预计将达5,247GB
o 数字宇宙膨胀的主要原因是机器生成的数据量的增长,由2005年占数字宇宙的11%,到2020年将超过40%。
· 大量有效数据正在丢失:大数据的前途取决于从大量未开发的数据中提取价值。然而,大多数新的数据是基于文档未被标记的非结构化数据,人们对它们知之甚少。
o 2012年,如果经过标记和分析,数字宇宙中23%的数据(即643EB)将成为有效的大数据。然而目前只有3%的潜在有效数据被标记,而得到分析的数据量则更少。
o 随着数字宇宙的增长,有效的数据量正在不断膨胀。到2020年,如果经过标记和分析,33%的数字宇宙(即13,000EB)将具有大数据价值。
· 大部分的数字宇宙未受到保护:需要保护的数据量的增长超过数字宇宙自身的增长。
o 2010年,数字宇宙中需要保护的数据不到三分之一,预计到2020年,这一比例将超过40%。
o 2012年,大约35%的信息需要某种形式的数据保护,而实际只有不到20%的数据得到了保护。
o 数据得到的保护级别因地区而异,在新兴市场受到较少保护。
高级威胁、安全技能的不足、消费者和企业忽视最佳安全实践所带来的挑战使问题进一步恶化。
· 地理上的转换即将到来:数字宇宙过去曾是发达国家的一种现象,这种情况将随着新兴市场上人口的数字影子的增长发生变化。
o 2010年新兴市场只占数字宇宙的23%,到2012年它的份额已高达36%。
o 到2020年,IDC预测62%的数字宇宙将来源于新兴市场。
o 目前数字宇宙的全球比例:美国32%,西欧19%,中国13%,印度4%,其他国家32%。
o 到2020年,预计仅中国将产生全球21%的数据。
其他主要研究成果:
· 随着云计算在大数据的管理中扮演越来越重要的角色,全球范围内服务器的数量将增长10倍,而由企业数据中心直接管理的信息量将扩大14倍。
· 存储在云中的数据类型也将在未来几年内经历重要变革。 IDC预测,到2020年,存储在云中的46.7%的数据将涉及娱乐,而不是企业数据,其余为监控数据,嵌入式以及医疗数据,还有电脑、手机和消费电子产品产生的数据。
· 储存在数字宇宙中的个人用户信息量将超过他们自己创建的数据量。
· 西欧对数字宇宙的管理投入最多,每GB的投资额为2.49美元。美国排名第二,每GB投入 1.77美元,中国排名第三,每GB 1.31美元,然后是印度,每GB 0.87美元。
· 随着数字宇宙的基础设施进一步互联互通,信息将不会也无需停留在其被采用的位置。IDC预测,到2020年,近40%的信息将被云计算所“触及”,也就是说,在一个字节从起源到被采用这一过程中,它将在某个位置,在云中被存储或处理。
EMC公司高管引言:
EMC公司产品运营与市场营销高级副总裁Jeremy Burton
“大量复杂的数据不断地干扰业务运营,促使IT部门必须做出选择:要么因信息过载而瘫痪,要么采取措施以利用这些数据流的巨大潜力。今年的研究报告强调了数据可以为企业带来大量商机,它不仅发现了数字宇宙的潜在效益,而且强调了通过技术、安全实践和IT技能的正确组合来驾驭数字宇宙的重要性。EMC拥有独特的优势,能够帮助客户管理、保护和挖掘这些可以改变游戏规则的数据价值,并把它们直接转化为竞争优势。”