数据中心的数据存储组织与管理绿色数据中心
詹姆斯·马丁指出,在20世纪80到90年代,对某些企业来说,要将低档次的数据环境一步一步改造成高档次数据环境,需要话费5~10年的时间,前期存在着大量的数据文件和应用数据库,中期应用数据库减少、主题数据库增加,到后期主题数据库才会站主导地位。对于我国的一些企业和政务信息化工程来说,由于所处的时代不同,面临竞争和发展的压力,以及综合信息技术的成熟,数据环境的改造优化工作不能拖上5~10年,而应该压缩在3~5年,这就是“跨越式”的发展。
根据主题数据库的特征,需要在规划设计好稳定的数据结构之后,由数据源头一次一处地将数据输入系统,不允许许多次多处输入系统。这样,从数据源到是主题数据库,就是数据中心的数据存储的最重要、第一阶段的数据存储组织过程;这一阶段的工作做好了,第二阶段的数据仓库的组织存储,实际上并没有多少困难。
但如果没有第一阶段的工作,即数据环境的改造优化不从主题数据库着手,而是在现有的大量数据库文件和应用数据库的基础上,采用面向主题的方法做数据抽取、转换,企图建成数据仓库,支持管理决策,一般来说困难很大,成功的很少。
最底层的“各种信息源”包括生产现场各种自动化监测、监控仪器设备采集的数据,操作层管理人员录入的数据和管理层在使用信息系统过程中交互产生的数据。这些源数据,经过“数据标准”的规范化作用,进入到设计科学、结构稳定的主题数据库中;然后,主题数据库中的数据,再经由“数据标准”和“指标体系”的规范化作用,进入到为决策曾准备标准和管理机制,则是由存储在信息资源元库中的元数据信息和体系结构信息决定的;而信息资源元库是由辅助软件工具所驱动、创建和维护的。
标准规范、信息资源元库和辅助软件工具,都离不开人的管理工作。除了通常的信息系统开发和运行管理工作中的数据库管理员和数据管理员外,在数据中心的数据存储组织与管理工作中,更要强调信息资源规划核心小组“三大员”的持续性、关键性作用。
规划方案管理员、管理元库管理员和信息分类编码管理员,是信息资源规划阶段的技术管理的关键人员,也是后续开发阶段技术管理的关键人员,他们在信息资源规划结束后,要成为后续开发阶段的信息分类编码组、数据库设计组、数据交换协调组的骨干,即数据中心的数据存储组织与管理的关键人员。