如何为您企业大数据结构分析做好准备行业资讯
在一个主题为"大数据分析时代的数据探索与分析”的网络研讨会上,TDWI研究主任菲利普卢瑟姆表示,企业收集了大量的数据信息,这些数据信息可以帮助他们发掘出关于他们的业务和客户的新见解,但是,仅仅是将这些数据信息收集起来并不意味着他们已经为大数据分析做好了准备。
“为了进入大数据分析这一全新的领域,企业可能需要扩大你的数据仓库环境,并对其数据仓库体系结构做一些调整。"卢瑟姆说。
各种各样的变化可能是传统的数据仓库无法很好的应对大数据挑战的主要原因。大量收集到的数据是非结构化的,包括社会媒体的文章帖子或来自医疗记录的档案。而大量分析工具的设计初衷不是为了从传统的关系型数据库中提取数据。大数据的速度对于传统数据库也是一大挑战。例如,关系数据库可能难以从传感器跟上数据流的步伐。
基于这些原因,卢瑟姆推荐一种新的数据结构,可以配合并跟上企业实施大数据分析的需求。这样企业做能够实现的就不再是简单的管理数据,而是能够进一步的从中提取有价值的信息。
“我经常告诉人们永远不要满足于将大数据作为一个成本中心管理。”卢瑟姆说。我们要确保我们能够从中得到一些商业价值。
想要从大数据集中获得有用的信息,实施大数据分析是必要的。但卢瑟姆表示没有一款工具能够执行所有的分析功能。分析数据从数据捕获开始。然后企业需要去探索,看看里面有些什么,这时便是实际的分析了。最后,分析输出的结果必须是一个可视化的结果,这样管理人员才可以理解它。
大数据分析的每一步过程都可能需要各自的工具,卢瑟姆说,这可能需要一家企业在其现有的数据仓库体系结构中建立新的功能。一些数据管理专业人士可能会嘲笑这种想法,因为这将不可避免地带来了更大的复杂性,使架构更难控制。但卢瑟姆说数据管理者对此有些过虑了。
“增加更多的数据平台到数据仓库环境的关键在于能够应对数据类型和分析算法的多样性。”他说。“数据中心经理们已经处理复杂性多年了,所以我觉得绝大多数专业人员对这些应对起来应该很容易。”
卢瑟姆为日渐增长的数据仓库体系结构提供了相关的管理贴士:
•在实施部署之前,确定驱动业务的新数据集或应用程序。
•数据仓库的物理布局(例如,数据存储的位置)往往并没有相关的概念或逻辑水平同等重要,这决定了应用程序在一起发挥其功能。
•注意:妨碍架构成功部署的障碍在于相关的某些技能和人员编制。
•在项目早期就要解决好企业行政支持和资金到位等其他问题。
•建立数据仓库的标准,但对例外情况放开。