吴静涛:云计算开启下一代电信级数据中心的大门人物专访
演讲嘉宾
F5中国区技术总监 吴静涛
嘉宾简历
1999年开始进入应用交付的前身——负载均衡领域,2002年加入F5公司,历任北区技术经理、中国区技术经理、中国区技术总监;对电信、金融、政府等行业都有一定了解,涉及技术包括应用高可用技术,优化技术和应用安全防护技术等,并且和各大网站相关技术人员保持紧密联系,对互联网的新技术有深入了解
演讲全文
大家早上好,我是F5的吴静涛,我在F5待了七年多,从F5成立到现在,我算是老一代的人。我给大家带来的题目是“云计算开启下一代电信级数据中心的大门”。云计算是下一代电信级数据发展的一个浪潮。
内容比较简单,电信数据中心的演变、完美展现—云计算、云的实现。
从我们根客户的沟通角度上讲,很多人都在想,看起来云很好,可是怎么落地,一直没有一个很好的想法,今天我不但给大家带来云的想法,而且包括云如何落地,都讲清楚。
这个是最传统的很久很久以前的电信数据中心,交换机,机柜,空间,制冷,这绝对是不符合现在要求的。之后我们发现了这种情况,这张图是在1999年还是2000年,当时电信和网通还没有拆分的时候,中国电信是第一家承建这种电信业务级的机房,当时我们是帮他们做了增值业务。在机柜、带宽之外,现在开始有增值业务了,比如虚拟主机、主机托管、防火墙等技术开始上来了,同样的机柜,同样的带宽,我可以多挣一些钱,而且客户也可以多一些服务。比较形象地讲,多穿了一件衣服,更漂亮一些。从IDC开始往EDC转移,之前我们在设计IDC的时候,更多着眼于网络,如何构建一个很坚固、很可靠的网络系统,其实还是机柜、还是带宽,后来我们考虑到一些企业客户的需求,企业客户需要什么东西,现在企业客户并不关心基础设施,关心的是业务。当时我们为了配合这种企业业务的需求业务是需要交付的,而数据中心是交付的一个载体,所以我们为企业的应用提供了这种应用级的安全、优化、高可用等一些解决方案,来做应用方面的增值服务。
从电信数据中心发展而言,已经从简单的交换机、路由器到增值服务,到面向企业客户的业务级的增值服务,就是从最早期的交换机、路由器到后来的IDC,到EDC,下一块是云计算的模式,云计算的模式是怎么开始的呢?我们来看到底云的实施会带来什么好处?
看这张图,如果就一个企业客户,要想部署一个新的业务,到数据中心去租空间,空间租好了之后有带宽,然后开始设计自己的网络、自己的计算能力、自己的存储,然后买软件,一级一级往上走,不用非常大的业务,一百台的服务器,连调,最后一两个月时间就搞完。现在企业业务最重要的是什么?是快速。前几天,我在深圳去访问QQ,不要认为MSN进中国,QQ就一定会怕,因为QQ的每一个用户MSN都可以抢去,但是它抢不走QQ群。QQ最先建了QQ群,MSN抢不去。作为一个IT系统来讲,快速很重要,还没有发布业务,就已经花去了两个月的时间,这可接受吗?不可接受。
交换机、路由器、防火墙、存储不用买,租就可以了,但是要买完整的操作流程,半个小时之内做完了。开发平台都不用去管,因为可以形成一个一整套的服务。所以半天之内只要形成了业务流程,就可以部署业务。更何况,这个变化会带来更多的东西,因为之前的系统做出来之后,是需要自己的公司运维,可是以云的方式做的时候,不需要运维,因为这个云是以服务点为保证的,不需要运维人员,而且随着我的服务能力扩大,可以随意地扩大,没有任何的投入成本。大家想象一下,任何一个业务来讲,没有投入成本意味着什么?我可以接受任何一种失败,以中国移动的计算来讲,10个增值业务里面,可能9个会失败,只有一个会成功,可是做初期投入都是一样的。如果以云的方式来部署这样一个电信的业务会意味着什么?失败就失败了,没有成本,这是它最大的价值所在。以云的方式去部署,时间得到了,成本节约了,更何况它的运维是全智能化的,这样一个模式来对电信自己用,或者出租给其他人用,或者建成这种数据中心来用,都是非常好的模式。
云真的成为了一个未来,而云可以怎样去做呢?如果你作为一个用户,你的操作流程是什么?先询价,然后签合同、付款、开通,然后一点点开始往里面搬机器,大概是这样的流程。需要一个项目经理来操作。大家看一下,我们换一种方式,这个是比较有名的云的运营商,如果大家愿意的话,你们可以随时登录、注册,早期登录是免费的,而且能送你50万美金的信用,你可以拿50万美金做自己的运营。它卖的东西是什么呢?不卖机柜空间,不卖带宽,卖的东西是这个,一个CPU、500兆内存、30G硬盘,租金每小时是1毛钱美金。这就是它卖的东西,如果想买贵一点,有,一个超级的CPU、2G内存、120G硬盘,是3毛8一小时。50块钱可以用好久,大家可以注册试一试。现在需要做的就是用账户名登录,登录之后全部确认好了之后,一百台服务器,IP地址应该是什么,配置结束之后就完成了。这就是云计算的数据中心可以为我们用户带来的东西,在半个小时之内后面有三四万台服务器,你说我现在需要一千台服务器,半个小时也可以搞完。意味着什么?那两个月的时间根本不用了,就是半个小时,也根本不需要项目经理,自己坐在电脑前敲几下就可以了。
我们遇到的实际案例是这样的,《纽约日报》想把11000万份报纸转成TPF文档保存,就在计算得多少CPU、多少项目等等,三个月之后做得非常漂亮。租了很多台机器,跑了一个软件,一个星期之后所有转换都已经完成了。花了多少钱呢?一台机器租一个小时不到一毛钱,就这样的成本,很快就结束了。这样一个完美的未来的数据中心对我们的企业客户来讲意味着什么?如果你登录进去之后想修改怎么办呢?不需要接触到服务器,也不需要接触到F5,就是这样一个图形化的管理界面,包括阿帕奇的管理界面等等,都不需要太复杂。所有的电信增值服务都是免费的,因为已经统一付过费的,你要什么都给你,免费的。大家想象一下,这样一个服务对于电信的数据中心来讲意味着什么,对于用这个数据中心的用户来讲意味着什么?真的不愧是它能成为下一代数据中心的运营模式,对大家都有利。
我不知道有多少用户会用多大存储,那我应该构建多大存储的服务能力呢?这也是一个云的概念和技术的问题,待会儿我会跟大家说如何实现。
下面开始落地了,刚才我讲得很好,如果单独看这个技术非常完美,但是落地非常困难,我几乎访问了每一个客户,都会问我这句话,你说得太好了,到底怎么做呀?很空。下面的时间我给大家讲如何落地。
首先要落地第一条必须实现,以前的交换机、服务器都是物理存在的,它的扩容都会意味着新的投入,意味着新的设备,所以如何能够按需扩展成为云,实现的第一个步骤,如何实现随时可以扩展。这是一个云的运营商,叫做bluelock,它利用主机虚拟化的技术跟F5技术相结合,可以达到几乎完美的效果。当然可以用微软的f5和VMWare。F5多发一些实际流量,给更多的服务器,扩大自己的服务能力,就这么简单。全自动的完成了一个业务的服务能力扩容,而且对用户是完全透明。到了下午两点压力会大,到了早上五点压力会下去了,服务器的压力下来了,我们可以主动把一些机器关电,关电可以吗?如果服务器压力下来了,关电是不可以的,因为再小的压力,每个服务器上还是有些用户的,你不能武断地说,那里只有三个用户,给它关电,那是不可以的。慢当的状态,新的流量在那一台服务器,旧有的流量是可以维持的。把压力往那边迁移,什么叫绿色IT?什么叫绿色?什么叫节能?意味着你只能跑30%,证明70%的电力是损耗的。30%是峰值流量,最小的可能是它的1/10,只有3%而已。如果把97%的电全部关机,这意味着什么?刚才看电能损耗那张图,实际上IT设备的电能损耗是最大的,比制冷还要大一些。如果在不用到这些服务能力的时候,干脆把电关了,节能减排是完全能够实现的。
我们去拜访了一个移动的客户,很高的楼,让我们爬上去,不开电梯,为什么?到月底了,节能减排必须做到,说这个月没完成怎么办?就把电梯关了,节能减排,一直到满足那个指标为止。如果按照这种模式去做,97%的电能能够被节约下来,90%节约了意味着什么?意味着下一次我去移动做业务的时候,终于可以坐电梯上去了。
存储也是有虚拟化的技术,可以把所有对存储的指向都指向到一个虚拟的IP地址上去,由它去管理着下面这些虚拟的存储池,如果一个大的存储说不上有多少存储需求的话,可以先买一个小存储,需要了再加一个,可以加100个存储,构成一个足够大的服务能力。如果再想扩大怎么办?就再加,完全透明。这种存储的云的服务也是可以实现的。云计算所需要的基础技术已经完全具备了,实际上可以非常容易落地,利用服务器虚拟化的技术跟F5技术相结合,可以实现的是服务器的无限扩展,APP服务器的无限扩展,存储的扩展,而跟外边的广域的均衡技术相结合,可以实现的是数据中心级别的扩展、链路的扩展。
我现在F5所有大客户都是按照这个思路在部署自己的业务,就是说如果有一天它的压力特别大的时候,它可以在不停用户、不停系统的情况下,可以任意随着需求扩展。链路可以更加透明,完全是一个云的方式在做自己的业务,一步一步往云过渡。大家可以想象一下,这种基础设施级别的云的基础已经完整了,它的需求是什么?如果想把这种服务落地,很简单,服务器、服务器虚拟化的软件、F5的相关技术加上一套管理系统,就完整了。再下面,如果只在一个数据中心去实现云,是不够的,就像我们刚才谈到的,从IDC过渡到EDC,在下面寻找超级IDC,超级IDC不是一个,是多个,在多个IDC之间如何调度呢?有一个前提条件,要有边缘感应系统,就是我必须知道在某个数据中心里面压力有多大。
这个是没有非常有名的云的运营商,ATNT的架构,超级数据中心,它的数据中心是部署在不同的城市,甚至部署在不同的大洲,有安全的地方,如果有战争也是非常大的风险,就按照不同的洲来部署不同的数据中心,而在不同的数据中心之间流量是如何做调度呢?根据很多因素来,其中很重要的一点,底下每一台设备的实际压力是多少。我问大家一个问题,如果这个地方服务能力是10个G,10G的流量跑满了,我现在把流量切到一个别的地方去,是不是一个很完美的选择?你们第一反应肯定是很好,我告诉大家是错误的,为什么?跑完10个G,这10个G的当前用户会受影响,所以设计是10G,差不多到9G的时候就要开始做切换动作了,这样才能保证当前客户使用的完美。所以边缘感应系统,至关重要的是在多IDC的切换当中。如果达到边缘的压力,下面就是实施调度环节了,如何做调度呢?由一小片云、再一小片云,很多片云组成了更大的云,就是在多片云当中的调度系统,需要考虑哪些东西呢?一点也不复杂,用我和一个专业技术人员做交流,需要三个小时才能讲清楚。他要考虑延迟、带宽占用率、当前用户数、实际服务能力,还有用户的就近性等等,有这么多东西要考虑,才能决定到哪个点是最佳选择。
大家想象一下,作为一个更大的云的调度来讲,实际上是非常复杂的,如果云多了,云与云之间需不需要加密通讯,当然需要了,实际上也是必要的,在云与云之间做调度之外,还有一些数据,这些数据需要加密。在云与云之间需不需要安全呢?实际上云最担心的就是安全,而且它所担心的不是什么DOS、DDS这种简单的网络攻击,这太容易了。现在你打新浪打得死吗,打QQ打得死吗,他们都是用多服务中心来做的,打一个根本没有用。云最担心的是应用安全,因为时间问题不多说了,主要是以业务为主的应用级别的安全防护。
云的落地实际上已经给大家考虑了很多,作为一个数据中心来讲,以云的方式做部署,再提供增值服务的时候完全是不一样的概念,全部是非物理设备服务中心的东西。我们可以实现的是,第一个后台的存储,存储做成一个服务,每个人有10T、有个人有100T,无所谓,甚至有一天冒出来1000T。整个数据中心就是以云的服务为主。以这样的方式去部署下一代的数据中心,会带来什么好处呢?第一,提高单位空间产出,1U的服务器可以跑四核或八核,一小时一毛钱,一天是两块四,一年是多少?几百块美金,就是几千块人民币。翻过来算,今天中国电信、中国网通能提供什么样的数据中心?1U的服务器的空间超不过五千块人民币,而一个CPU就需要五千块人民币,1U的服务器就能跑4个数据中心,同样的空间多挣四倍的钱,而电能损耗没增加,反而降低了,扩大了用户群体,又降低了管理成本,以前一般一个数据中心要多少个运维人员,都是全自动的,找个人监控就好了,不用了就关电,90%的电都节约下来了。
F5在这里面可以做什么呢?首先第一个F5可以是云的末梢感应系统,云的每一片压力多大,这是有嘉宾汇报过的内容,同时云与云之间要有实时调度,如果做调度,是我们的中枢神经系统,云的存储是我们的神经元系统,这些东西要传输吗?云与云之间要加密传输吗?需要,就是脑袋,还有安全,还有DNA的复制,对云的扩展,只有F5才能实现。在前十大的运营商里面,绝大多数人都选择F5来最快速地构建云服务,在中国也准备开始这方面的一些业务,配合电信公司等大企业客户来做这方面内容。
今天非常感谢大家F5为你提供快速敏捷的IT架构,来配合你的实际业务,以云的方式来构建下一代数据中心,谢谢大家。