“云网管”解决服务器监测三大矛盾网管
网络运维管理发展之困
在目前的网络运维管理实践中,随着用户业务的不断发展以及数据中心建设的不断扩大,用户要监测的网络设备规模越来越庞大、投入监测服务器的成本越来越高。用户的运维管理实践在不断发生变化,运维管理软件市场已经由对单一工具集产品的需求转变为对完整解决方案的需求。用户越来越需要一场新的技术变革来突破当前所面临的挑战和困局。
美信科技(以下简称“MXsoft”)技术总监陈新刚说:“在这样的背景下我们推出了全新的CreCloud云网管(以下简称‘CreCloud’)完整解决方案。其设计原理可以简单概括为:将多台普通监控服务器虚拟为一台计算能力强、运行稳定的大型监控服务器,帮助用户在低成本的情况下,实现对大规模服务器和网络设备的监控。CreCloud作为一个完整的解决方案,从根本上革命性的解决了传统网管产品所无法解决的种种问题。”
问题一:传统网管产品的监测能力和庞大的网络规模之间的矛盾
MXsoft的技术总监陈新刚认为:“在我们熟知的网管领域中,不管是简单还是复杂,传统网管产品都是以单套部署的原理来工作。即一套产品只能安装在一台监控服务器上,这种模式有一定的局限性,其监控能力和规模都受限于这台监控服务器的性能。当被监控规模超过这台服务器监控极限时,用户不得不再购买一套产品,安装在另一台监控服务器上,对超出部分的被监控对象行进监控。同时,还需要对用户、权限和预告警数值等参数重新设置。这无疑会大大增加人力、物力上的成本。监控的目的是为了提高工作效率,多套传统网管产品的部署在解决问题的同时却大大增加了对管理工作的复杂度。所以传统网管产品对于大范围的网络监控往往力不从心。而目前,有很大一部分的用户需要监测的设备越来越多,比较典型的是门户网站、网游公司和类似中石油这样的大型工业企业,动辄就要监测上千台服务器。传统网管软件已渐渐无法满足这类大中型规模企业的需求了。”
问题二:传统网管产品的运行机制和高品质监测需求之间的矛盾
传统网管产品大多采用单套部署的方式,这样网管产品本身容易形成单点故障,一旦由于网管产品本身的原因(Java或者.Net编写的网管产品在高负载时容易出现不稳定或者占用系统资源太多的情况)或者安装服务器的原因(比如掉线、宕机等)而发生故障时,所有的监控任务都会无法进行。这是过去几年中几乎每一个行业用户都会提出的问题,“网管产品对IT和网络进行监控,那么如何保证它们自身的安全运行呢”?
问题三:传统网管产品的不可扩展和未来监测扩容之间的矛盾
传统网管产品由于采用单套部署的方式,当监测容量达到软件自身的限制时,比如监测服务器和网络设备达到100台时,性能就会大幅下降,当达到500台时,就会保持极限运行,随时都有发生故障的可能。目前国内的许多行业客户都在大力发展信息化建设,IT业务处于快速增加之中,设备和应用轻松就会达到上百个,这样当监测需要扩容时,网管产品却出现了瓶颈,不能随着IT网络的扩容而自适应增加管理能力。如果实现监测扩容,就需要新增加一套或者多套网管产品,这样管理的效率问题就随之而来。
除以上问题外,传统网管产品还面临着其它问题,比如对网管服务器的硬件要求过高从而容易加大用户的成本,不能有效利用用户的闲置服务器帮助用户节省资源,都以工具或者工具集的形式出现,无法成为真正的完善的解决方案等。
“云网管”解决之道
随着新型的互联网和IT应用层出不穷,用户的数据中心越来越大,服务器和网络设备的数量越来越多,这些海量设备的存在为运维管理提出了新的挑战。陈新刚表示:“为了从根本上解决以上网络运维管理所面临的困境,美信将云计算的概念引入到这个领域中,推出了CreCloud云网管产品。云计算有两个最根本的特征:虚拟化和动态扩容,在CreCloud的产品设计中,我们充分地体现了这两个特征,CreCloud通过把多台服务器的监测能力虚拟成一台超级服务器,实现了虚拟化监测。当数据中心的服务器和网络设备增加时,CreCloud通过增加‘监测云’中的服务器来实现动态扩容”。