浪潮云服务进驻住房与城乡建设部技术经验
项目背景简介
中华人民共和国住房和城乡建设部,是2008年中央“大部制”改革背景下,新成立的中央部委。是中华人民共和国负责建设行政管理的国务院组成部门。主要承担保障城镇低收入家庭住房、推进住房制度改革、建立科学规范的工程建设标准体系、规范房地产秩序、监督管理建筑市场、规范市场各方主体行为、负责住房公积金监督管理、承担规范村镇建设、指导全国村镇建设等责任。
目前,建设部信息中心IT基础架构是典型的分散式架构。即各应用使用独立的服务器,各个应用间相互独立,同时,在今后将进一步开发和上线其他应用。因此,需要规划和建设立足当前,面向未来的灵活而强壮的系统架构。
当前,建设部的WEB站点群、公积金上报系统、舆情监控系统、建筑能耗数据分析中央级平台等应用系统采用了传统模式建设,即单服务器单操作系统单应用的架构,采用多台服务器来承载大型应用系统。
客户困惑
困惑一:业务分散,缺乏统一管理
以应用为单位建设系统,不同业务之间缺乏统一的管理手段,应用系统缺乏高可用性保护,数据分散存储,不同应用之间缺乏必要的信息共享;主机、存储等系统构件各异,所使用应用软件均基于不同平台开发,管理上各有不同的单点工具比较杂;
困惑二:机房负荷重
机房服务器数量多,机房空间、机房电力接近满载,以CPU为代表的硬件资源利用率较低,迫切需要提供一种更加高效的基础架构模式;
困惑三:业务单点故障,数据存在安全风险
目前大部分服务器采用了单机运行的模式,存在着单点故障的风险;同时数据采用各服务器分散存放的方式,缺乏有效的统一存储和备份管理,数据安全存在风险;
困惑四:规划管理问题凸显
由于平台缺乏统一的规划,随着服务器数量的增长,如何批量管理、统一管理成为一个亟需解决的问题,同时,如何降低管理工作的强度和管理风险也成为当务之急。
面临挑战
挑战一:如何实现应用模式统一规划
应用模式统一规划有利于各项业务间的联动处理,并且有利于实现分级授权,加强控制和监督,提高集约化管理水平。如何提升应用服务质量,降低应用管理成本。
挑战二:如何提高效率降低成本
随着信息化技术的不断发展,特别是以多核处理器为代表的新的软硬件技术的不断涌现,服务器硬件的处理能力得到了大幅度提升。但是受制于传统的单服务器单应用系统的模式,多核心服务器的应用性能未能充分发挥出来。用户关注如何充分发挥服务器性能,大大提升应用效率,从而从根本上达到信息化的高效能和开源节流的目的:
挑战三:如何保证数据安全性和高可用性
作为用户数据集中的系统,数据的安全是第一位的。必须从网络、操作系统、数据库、存储设备等方面建立起一套严密的保障措施,保证用户和业务数据的100%可用。传统的数据由于比较分散,管理和备份都相当困难,容易造成损坏或丢失,安全性很低。希望采用集中存储的方式,提高数据集中度,简化备份和数据管理过程,大大提高数据的安全保障。
挑战四:如何提高可管理性
高效能数据中心平台将应用系统和技术架构分析,从根本上提升IT管理的效率。通过远程管理技术和数据中心效能管理,将大大降低管理成本和管理风险,提升管理效率。如何借助云计算的模式,实现业务流程、资源的统一规划和管理。
解决方案
一期建设方案
虚拟化整合、资源动态管理:
在住建部网络中互联网服务临时区内构建云计算测试平台。
采用8台浪潮NF8560M2服务器和浪潮AS500G3光纤存储构建云计算资源池。
住建部虚拟化平台一期建设拥有两个业务集群,集群一建设部集群拥有四台四路服务器和2台旧有IP存储,集群二水专项集群拥有2台四路服务和2台FC存储AS500G3。
目前运行住建部应用补丁分发平台、大兴公建、公积金上报系统、建筑行业监管平台、住建部网站系统、住建部水专项、舆情监测系统等多个住建部核心应用。
提高系统可用性:
消除计划停机时间。通过虚拟化平台整合,可以通过虚拟热迁移技术消除计划停机时间。
降低非计划停机时间。通过虚拟化平台整合,可以通过虚拟高可用HA技术降低非计划停机时间
应用快速部署,快速响应,提高效率。
二期建设方案
从2010年11月开始,住建部虚拟化平台正式上线,一直安全运行。住房和城乡建设部已经完成云计算平台的初步部署,并且已经将部分业务迁移到云计算平台 。在2012年11月浪潮技术工程师对住建部虚拟化平台进行深入的调研和评估,进行二期的规划和建设,形成整体的住建部云计算解决方案。
在调研评估阶段,发现以下问题:
建设部集群和水专项集群主机使用率负载都不高。CPU资源使用30%,内存资源使用50%,计算性能能够有效保证业务增长;在资源充足的情况下允许继续新增应用。但是内存消耗较大。
IP san 存储阵列空间已经耗尽,触发存储空间不足警报,无法再新建虚拟机。IP SAN存储阵列性能比较差,主机访问存储延迟很大,并且承担较多应用,容易造成应用整体性能滑坡
规划方案建议:
内存是虚拟平台的消耗品,建议平台主机采用高内存配置。
建议新购买的FC SAN存储阵列空间充足。推荐将虚机建立在FC SAN阵列上。FC SAN阵列性能优异,延迟较小,建议逐步将部分虚拟机迁移到FC San存储阵列。
在一期的虚拟化平台之上,部署数据中心云计算管理平台,实现数据中心物理资源、虚拟资源的统一监控和管理,实现业务流程的梳理和业务资源申请在线审批。
在2013年7月份,住建部采纳浪潮的整体规划方案,对虚拟化平台进行了整体升级改造。升级方案如下:
对原有的四路服务器NF8560M2的处理器和内存进行扩配,提高单台服务器的处理性能,并消除内存消耗的瓶颈。
新增一台NF8560M2和虚拟化软件授权,对整个计算资源池进行扩充,保证新业务的增长后有充足的可分配资源。
新增2台光纤存储AS500H替换原有的IP存储,提升存储系统性能和存储容量。
新增浪潮云数据中管理平台软件“云海OS3.0”和云平台管理服务器NF5280M3,实现数据中心的统一管理和资源的自服务。
最终方案的系统架构拓扑图:
客户收益:
降低成本,提高效率
使用传统模式建设数据中心,需要近100台的服务器来承担现有业务,采用云计算模式仅需要7台四路服务器,功耗花费下降78%,空间占用减少70%。
高可用
集群服务器上部署的虚拟机可以互相接管,实现业务不中断,同时虚拟机部署到存储上实现整个虚拟机连同业务和数据库的备份。
高扩展性
通过采用业界先进虚拟化技术构建私有云,扩展性良好。当用户需求增长时,通过增加服务器节点即可解决,系统升级平滑简便,能够随着用户业务的扩展不断扩展。
降低TCO
采用了云计算技术,物理服务器的数量减少了50%以上,设备功耗大幅度降低,资源利用率也提高了10倍以上。
安全性增强
通过虚拟化集群中的HA,vmotion,虚拟备份功能,避免计划内停机和最大限度的减少计划外停机,大大提高的系统的安全性
管理智能化
浪潮云数据中心操作系统“云海OS3.0”管理平台,实现了数据中心资源的统一管理;针对传统业务系统上线需要重新采购/部署硬件的弊端,通过云管理平台,数据中心可以在线审批业务部门的资源申请,进行资源的按需分配,实现数据中心的智能管理和云计算自服务模式。