深圳共济易南昌:云平台数据中心运维外包服务与管理互联网

2013-01-05    来源:IDCUN    编辑:IDCUN
数据中心云运维---基于云平台的数据中心运维外包服务与管理,我们公司业务主要的包括一体化监控,还有基于埃托(音译)的服务管理和基于这些管理的支持、工具、经验的外包服务平台

  大家好,我和大家分享一下数据中心云运维---基于云平台的数据中心运维外包服务与管理,我们公司业务主要的包括一体化监控,还有基于埃托(音译)的服务管理和基于这些管理的支持、工具、经验的外包服务平台。也就是我今天要讲的主题,云运维平台。

  深圳共济科技有限公司今年出第三方交换机构的调查报告,共济科技的市场份额是29%,继续保持数据中心监控领域市场份额第一的地位。共济科技也参与了很多国家的相关的标准的制定和编写,也承担了一些国家,省的重点的相关的研究项目。

  话题转到数据中心运维,现在随着数据中心规模的扩大,它的运维成本是一年比一年增加,比重在整个运维费用里面越来越大,如果把能耗的成本算进来现在已经超过70%,就是这个图的中间。这个图的这间这块是运营成本,上面是能耗成本,总的成本占到数据中心的7层以上。


深圳共济科技有限公司总工程师 易南昌

  明年的第二个困难就是数据中心规模扩大,系统越来越复杂,对人员的要求越来越高,数据中心面临的问题超过8层是人员的失误的问题,这也是我们IT管理者和数据中心管理者最头疼的事情。事实上对于我们在座的IT从业者,我们面临的很多的很具体的问题其实我们很难在这里一一列出来,我们可以概括一句话就是特别是对我们IT运维管理者来讲,我们24小时都没有一个安心的时刻,一年365天都没有一个安心的一天,成天的为我们的系统是不是会影响业务很操劳。

  这些困难与挑战的根本原因就是因为现在社会的信息化成为越来越高,IT系统越来越复杂,因此复杂度的提高,使得我们需要去更精细化的我们的系统,我们需要具有更高的能力和水平的人员来管理我们的系统,这不是一件简单的事,这确实不是一件简单的事,因为他涉及的管业门类非常的多,每一个专业门类又有相当的深度,所以我们有这样的结论,随着数据中心的可用性的要求的提高,运维成本越来越高,所以我们要想办法解决这个问题。

  事实上业界面临这些苦难与挑战,不断的在探索方法,应该说我们传统上服务的外包,运行维护的外包是一种方法。但是这种驻点的运维服务外包,确实解决了我们技术壁垒的问题,但是没有解决成本的问题。甚至可能他的费用更高。另外一方面,这几年我们也认识到仅仅只是监控是不足以解决我们IT管理的问题的。近几年在管理上面做系统。但是在客户的信息系统的管理工作,也只是解决了这一个单位或者这一个数据中心的运维的效率的问题。从一定程度上节省了成本,提高了可用性,但还不是最好的办法。现在的云技术已经可以让我们找到更好的解决办法,那就是云运维。

  什么是云?其实我们用非常通俗的话来讲,云就是一个资源池。云的目标就是资源池的资源有效利用和调配。这是云的实质的概念,虚拟化只是实现云的实质的技术手段和方法。我们共济科技的运维在云有两个含义,一层含义是技术的云,一层含义是体系的云。

  技术的云是我们的云平台能够支撑一个无所不在的运用,能够接入客户的系统,多用户的使用。另一个云,也是非常关键的,就是云体系,另外一个资源池叫人力资源池,怎么样把社会的资源整合在一个云体系下使用这个云平台为客户进行服务,这是我们提高专家经验知识,或者说提高高级人才知识服用率一个概念。我们的云的方案就是由一个云体系,包括共济科技的团队,包括任何第三方服务供应商和客户自己的管理团队,一起工程的云体系通过云平台,实现客户的运行,维护,管理的目标。

  下面我来具体的说说我们的云运维的定位。共济科技在云平台上有三个云服务模块,或者叫三朵服务云,是针对不同的客户量身打造的客户,第一朵云是监控云,我们用了一个动漫的形象作为监控云的形象代言人,火眼金睛,第二个云是维护云,猪八戒和唐僧,勤勤恳恳的帮助唐僧达到目标的意思,第三个云是管理云是唐僧,这是一个团结的团队,实现最终目标的团队。同时因为这三朵云前面都是M,所有我们注册的是3MC。

  我们来说说监控云,是怎么样服务我们的专家,通过监控云我们可以把客户的系统,不是业务活动,接到我们的云上,通过云,通过我们的服务团队,通过我们的监控中心的团队,可以为众多的客户提供定时的远程巡检,提供数据统计分析报告等等服务。这样的话,我们的一个团队,就可以为无数的客户来服务。这个时候,我们的成本下降了。利润提高了,客户觉得成本下降了,他不是每一家都是要请一个团队来做自己的值班,或者请一个五脏具全的团队来做,现在我是一个团队不用挪地的就能够为众多的客户做这件事,所以社会资源得到了非常高效的服务。

  第二个云,维护云,在这个维护云上我们能做什么呢?我们前面的梁总也谈到服务外包的管理由谁来管,客户需要对外包的服务进行过程的跟踪和结果的控制,也就是所谓的SLA的实现,以往我们都是人工的粉饰来实现,究竟这个条款是不是很好的实现了,我们是很难清楚的,凭个人的感觉而已。

  现在我们自己的客户有自己的工作牌,他能跟踪他所有的服务的事件的整个过程。能够对服务的结果,包括服务报告的确认。统计报告的获取,都是在云上进行的,所以整个的过程得到跟踪,结果得到控制,对于服务团队而言,利用这个云,可以有效的支持他们,做好服务的工作,因为在云上有它工作的要求,有它工作赖以需要的知识库的知识,所以他能够很好的做好这件事,或者帮助它做好这件事。

  另外,就是我们说的KPI,有一个KPI对我们的运维人员的约束,促使他做好这件事,通过云使得外包维护的工作能够保质保量的对客户的SLA的承诺。

  第三管理云。本质上就是saaS,就是我们在自己的平台上做的众多的管理,我们原有客户放到客户运行的管理软件,那是他买过去作为自己的工具在使用,那么现在你可以不买,你只是来租用所有的这些管理模块,就可以了,这样尤其对于中小的数据中心而言,他不用去管理这个软件,只要上云就可以做这件事。

  举一个实际应用的例子。现在联网的机房无论是政府的也好,还是一个大型企业的也好,它的数据中心到处都是,各地的数据中心又有各种各样的服务商做服务,空调的,网络的,服务器的,甚至数据库的,所有的服务商对于他们的这些服务,最传统的就是纸质的,什么时候该做维护,所有的这些过程,包括最后的报告,到年终一大堆,堆在那里,有了这个云,作为客户而言,所有的服务商,你就是一个团队,就是一个虚拟团队,我面对的是一个平台来为你们服务,来管理你们队伍提供的服务,所有的服务的过程,可以跟踪,结果可以控制,这是其中的一个。

  希望大家能够记住,共济科技的云平台的三朵云,3MC,监控云、维护云、管理云。

  目前接到我们云平台的机房已经有400多家,用云平台进行服务的已经有几千家了,这里面讲一个案例,这是一个小数据中心,我们通过系统的监控,专家组提供一个服务报告,每年节省电费大概9万块,原来是监控系统有报告,但是他看不懂,我的专家团队可以看懂这个系统是什么原因导致了电费的消耗。这个案子里面是一组空调在长时间的制冷,一天超过15个小时。另外一种空调,常年的加热,一天超过15小时,不断的制冷。常年的运用,通过这个监控的专家组织分析,结果发现这个问题,给他一个报告,我们事实上只收到几万块,他省的光电费就9万。

  我最后把本次议题的关键词串起来,作为结束语。共济,一个是brother,共济科技愿意联合所有的服务商和客户一起来通过我们的云平台,为我们的客户提供云服务,让我们数据中心的老板们省钱,让我们的数据中心的老总们管理怎么省心,让我们的和我一样的工程师们省事,让数据中心的用人管理真正的轻松起来,谢谢大家!

1
3