当前位置:首页 > 人物专访 > 正文

叶郁辉:揭秘最绿的存储

2009-06-07 比特网

  虚拟是一个科技、是一个手段,绿色是我们的目标。所以,今天我给大家介绍一下,IBM在绿色存储方案方面的一些最新的构造,当然很重要一部分,是虚拟化的技术。”

    “当我接到说要谈一个绿色存储方案的时候,我觉得虚拟跟绿色还是差了一个词,所以我请教我的领导跟同事,想跟大家分享其中一个联系。虚拟是一个科技、是一个手段,绿色是我们的目标。所以,今天我给大家介绍一下,IBM在绿色存储方案方面的一些最新的构造,当然很重要一部分,是虚拟化的技术。”

  究竟什么是数据中心设施方面最大的问题?据调查,CIO目前所面对的问题,不是采购的问题,也不是一个人员开销的问题,最大的问题,是能耗的问题。大家看左下方这个图,黄色的部分是我们服务器采购所支出的一些成本,然后它是以年来统计,还有一个预测。绿色那部分,是采购了服务器之后,带来的每年能耗的开销。这里面,大家看到我们2007年的话,服务器所带来的能耗的开销,基本上跟服务器的采购的成本是持平的,那么未来几年,这个能耗上升的趋势越来越明显。甚至是远超于我们购买服务器的成本。这里面其实很好理解,因为服务器的性能、性价比是越来越好的。所以,你采购的同样架构的服务器,性价比越好,性能越好的话,它需要的功耗越大。

  那么在服务器的支出持平的情况下,它的性能和能耗,是飞速地发展。所以,如果是一个CIO要申请每年的经费的话,其实它相当一部分是放在了供电局跟冷却这些能耗的开销方面。所以,我们看到谈了那么多,怎么能帮我们的用户达成一个绿色数据中心的要求呢?绿色数据中心其实主要有5个方面的角度来看,第一个是说建设。建设的话,我们必须是一个从节能型或者是高效型的数据中心来进行一个规划和建设。然后,是在设备本身,我们实现一个虚拟化,所以我们今天大会里面安排一个讲绿色数据中心的联系也在这里。虚拟化是实现绿色数据中心一个非常非常关键的手段。还有冷却,冷却的技术我们已经发展了几十年,但是我们今天觉得还有很大的提高的余地。那么另外有效地管理跟评估,这也是每一个数据中心管理里面的一个基本的要求。最后,如果有问题发生,或者是说我们进一步地精益求精的话,我们需要很好的诊断的技术,来帮助我们在能耗方面取得更进一步的效率的提高。

  所以,我们很多的客户,已经是采用了这5个理念来建设绿色数据中心。然后,实现了包括减低了40%以上的电耗跟冷却的开销。另外,还有服务器跟存储的使用率,平均提高了20%以上。然后,还有现在这个房地产和地皮是很贵的,所以有一些用户甚至是机房的占地面积省掉了80%。

  我们刚才谈了整个的数据中心,那么数据中心包括很多的设备,作为非常重要的,甚至比服务器还要重要的一个部分,就是存储设备。能耗的增长,目前我们看来还不是太快。大家看到,这里有几条曲线,是随着我们1992年开始,到2014年,这么20多年的预测跟统计,每年的服务器和存储还有一些刀片、通信设备能耗的开销,我们看到其实最高的那条红色的线,是能耗的大户,就是一些非常密集型的通信设备,比如说交换机和SAN的一些设备等等。

  我们看到使得存储环境变绿的解决方案,主要有三个方面我们要考量。第一个,更有效地制冷的手段。大家看到,我们是针对这个饼图里面超过50%的份量冷却的方式。另外一个选取更有效率的、能效比更高的存储产品。第三个,是通过虚拟化的技术和一些更新的方案,获得了更高的存储利用率。

  这里面,我觉得是技术的含量,或者是需要一个公司所投入的力量和资源是一步步往上涨的。所以,我们先看到在冷却系统方面我们是怎么样先投入技术力量。那么在冷却系统方面,其实我们最需要控制机房的热点和利用新的冷却技术。那么新的冷却技术,包括现在我们重新改进过的水冷的技术,也包括我们通过一些红外的分析,去除机房的热点,进一步地可以带来大概是10度方面的改善。整个机房的空调的效率,可以得到2.5倍的提高。

  可能这里面,是一个机房设计方面的问题,但是其实也涉及到了存储设备方面的设计方面新的理念和IBM所带来的新的技术优势。我们具体看了一下,IBM的系统存储里面究竟有什么冷却方面绿色的设计?大家看到,传统的机房里面,我们都一排排机柜放在里面,那么如果采用我们比较常见的风冷的系统,红色这一块,是一个风的流向,一般每个机柜都是从前面吸冷风进来,然后从后面把这个热风排出去。但是,这种排风的冷却方式有什么问题呢?如果我们在机房里面一排排罗列这些设备,很容易前面设备的热风,又被后面这台系统的吸风口所吸进来。所以,导致了最后一排设备的冷却效率是大大降低,有可能形成一个热点。

  那么我们想一下,从机房的布置来说,我们可不可以这样来理解,把两排设备的出风口给靠近,就是把它转一个180度,这两台设备都从外面吸风,然后背靠背地从他们的背面把热风排出来。其实这样的设计是挺合理的设计,但是问题是说,我们今天的机房里面,很多的用户都有一个很好的机房管理的条例,基本上是一个大玻璃的房子,平常人是没有什么事情不允许进机房的。所以,我们必须把一些设备的面板都靠着玻璃,让我们比较好的观察。所以,一般来说,我们要进行一个背靠背的设备的放置的话,是需要一定的管理的变更和机房方面设计大的改动。

  我们看一下DS8000的设计,已经充分考虑到了这一点,我们是有一个前后散热的模式,本身在单台的设备里面就是前后吸风,从中间排出热风的设计。所以,这里面提高空调的效率是非常明显。然后也能够很直接地降低设备之间的冷却的影响。这里面,是集成了IBM这么多年来一些技术的研究成果,还有我们设计方面最新的技术。

  所以,我们可以看到从设备本身怎么这个能耗?如果大家分析是能耗的大户,就是磁盘设备里面,单个磁盘产生的热量,有一个存储驱动器能耗的柱状图的分析。右边这个图是每个单位存储容量产生的能耗,不同的颜色代表不同容量和不同转数的磁盘驱动器。所以,大家看到黄色这一块能耗是最低的,那么这种磁盘是什么磁盘呢?目前这种磁盘是7200转/分钟,500G的磁盘。所以,这种通用型的磁盘,我们说在比较适用的情况下,也尽量采用这种磁盘,是向大家推荐的方案。

  但是,磁盘还不是最绿色的,因为磁盘还是它在不停地在旋转,产生了热量和能耗。所以,我们可以看到,即便是最绿色的磁盘的能耗,也比不上我们磁带。磁带的设备这里面有一个柱状图,这里面是大家几乎看不到的灰色这部分,是我们的磁带设备。所以说,我们把磁盘的数据放到磁带上面,单位容量所产生的能耗或者是散热的话呢,我们大概是25:1,就是25倍这么一个差别。所以,我们就看,我们能不能更好地把一些数据进行放置方面的管理。

  我们经过了大概10年的总体拥有成本TCO的分析,看到在存储250TB容量的情况下,我们如果单纯采用SATA磁盘和单纯采用磁带设备,所产生的TCO是差别很大的。那么具体的数字是左上面这个表格。所以我们看到,磁带是非常非常绿的,它大概只会产生1/20到1/25的能耗。但是,我们看到还是磁带跟磁盘两个都不能少,所以最好的方案是我们把磁带跟磁盘通过管理的手段,通过存储的软件,把它智能化地进行一个放置方面的管理。也就是说,不同的设备存储不同价值的数据达到最优化。所以大家看到,左下方这个图最右边的柱状图,使得它既比单纯采用磁盘的能量开销低很多,同时它也能满足一些高速查找,还有平常的一些在线的数据的管理和访问。所以,我们的磁盘跟磁带,还是看到在一个非常绿色的数据中心里面一个必然的选择。

  另外,我们还看到如果单纯设备本身,一定要选择高端的磁盘,那一定要选择同等容量的磁盘,这样比的话,我们做一个横向的比较。大家看到,某个友商的产品举例,能耗的开销还是会低30%。因为刚刚提到一DS8000有一个前后散热的机制,而且它磁盘的设备还有后台的管理,更加合理。所以,这里面以后我相信大家的很多的采购的方案里面,会要求一个绿色的指标,就是一个能耗还有一个冷却的开销。所以,这几个给的参考是说,在绿色的设备本身的话,我们是怎么去考虑这个方案,然后把这个合理地设备的组合,把它放到一个方案里面去。

  下一步,如果有了这个设备以后,我们提高它的利用率?平常的话,虚拟化的技术我们也探讨过,如果没有采用虚拟化之前的话,大概一个磁盘的综合利用率,假设40%的话,我们通过采用SVC这种虚拟化的引擎,然后把很多的这些低利用率的厂商把它放到一块,组成一个综合的存储资源池,综合利用率可以增加1倍,达到80%。同时,可以减少很多碎片空间的分配,提高利用率。然后,接

  虚拟化的技术手段所带来的一个好处,就是瘦供给,那么瘦供给这个概念可能一时不是太好理解。我们看到IBM的移动办公室,这个图是早在10多年前,IBM已经采用了流动办公的做法。就是说,每一个员工在公司里面,没有一个固定的座位,如果你回到公司的办公室里面,你要坐下来一个座位,首先必须到一个系统里面进行一个登录,把这个位置自己先分配好。当然总体来说,假设某一个IBM的办公室只有100个员工的IBM分公司,但是这个IBM的办公室大概只会留70个座位给员工。那么这里面,一方面是节省成本、节省地皮、节省办公室租用的租金,但是其实是让我们的员工更好地面对客户,不希望我们的员工每天都坐在办公室里面。所以,每天至少有30%的员工是跟客户或者是我们的业务伙伴在一块做方案、做维护、做服务和增值方面的咨询。所以,这里面的话,大家看到,100个员工大概只要70个位置就够了。甚至,有的时候可以出现这种情况,大家都跑去见客户了,然后办公室就像这么一个比较空空荡荡的状态。

  所以,瘦供给的策略也是一样的,从存储的容量来说,我们并不需要每个应用都需要多少的存储容量,我们就必须物理地分给他。因为每个应用对于存储空间的利用率总是参差不齐。但是,从每个企业的不同应用和数据库的需求来说,他是有一定的利用率。总体来说,我们这个利用率把它提高到80%、90%是非常高的,如果是20%、30%是比较低的。所以,如果没有存储虚拟化之前,我们要按照应用来分配存储空间是很浪费空间的,因为每个应用都需要分配很多个预留的空间给它。但是,经过了存储虚拟化以后,我们可以把企业的资源进行统一的、综合的分析和管理。使得我们存储的利用率,可以从整体的角度把握。这里面举个例子,如果我们有100台服务器,每台要1个T,以前是要100个T的预留的空间,那如果采用虚拟和化的话,我们只要30T的空间就可以了。这里面,也意味着有70%的节能。

  那利用虚拟化实现瘦供给,我们可以通过几个手段实现。一个是在存储阵列里面实现。那么存储阵列里面实现,包括IBM的Nseries存储系统,这种Nseries的功能可以把不同的功能整合起来用。那么IBM的存储阵列里面实现,在整个的业界也是非常领先的,效率也是非常高的。但是,如果有一些用户说,我这里面还有别的厂家的磁盘阵列,那不一定是能够提供这种功能,怎么办呢?我们可以通过SAN里面来实现。就是你采用在SAN里面的存储区域网,加入IBM的SVC的虚拟引擎。然后把不同厂商之间的存储整合起来,所以就可以实现自动的资源的供给。另外,在磁盘系统方面,我们还有最新在上个月系统发布的磁盘快照的功能,这已经不是太新鲜的事情,因为在10多年前IBM业提供这种功能。但是,现在没有多少厂家,能够做到这个功能里面是可以节省空间的。因为,按照传统的功能来说的话,左边有一个图,假设我们测试的数据要两份,要从生产数据里面快速拷贝出两份数据给测试用,还需要另外一份数据给开发用,接着还需要一份数据给QA用,我们需要4份数据。那么这4份数据在别的实施方案里面是需要预留同样足够的空间做数据的拷贝。所以,拷一个T的数据,我们需要4个T另外的空间。如果我们采用了SpaceEfficientCopy这种功能之后的话,我们就不需要预留这么多的数量了。只需要实际拷贝的内容,只是更改的内容,所以更改的内容,就是在生产里面更改的内容,大家看到可能只是几十K,所以我们总体来说,给预留的空间,如果按照几十K,大概就是100多K,就可以解决两份测试,一份开发及一份QA容量的要求。

  那么这里面,它采用了就是我们在存储系统里面最新的软件的功能。如果大家以后要采用IBMDS8000的数据,千万不要忘记配置这个SpaceEfficientCopy功能。

  刚才谈到了一些存储设备本身,或者是磁盘、磁带的基础架构。那么基础架构之外还需要一些软件的配合,才能够更好地发挥我们IBM整体解决方案的优势。这里面涉及到了信息生命周期管理,那我们谈了很多年,也有很多的客户采用了这种策略,这种策略是通过不同数据的要求,把数据自动化地迁移到最佳成本效益的存储。包括磁盘、磁带、光盘,还有磁带分在线跟离线等等。

  那么进一步地,我们还需要从另外一个角度考量,怎么通过自动化的管理,把它放到一个能源效益也是同样好的存储设备里面去。那这里面IBM的方案里面就提供了DFSMS,也包括一个打包的整体方案叫做D2550的方案,还有我们的实施服务。所以,我们进一步地细化的话,这个IOM里面,怎么样能够实现我们的通过管理工具把管理效率提高呢?举一个例子,我们可以识别和清除这些重复的数据。大家平常可能都用邮件系统,大家可能有感觉,如果有一个附件是很大的,一个PPT是几兆的话,那么这个人发过来,你再转发去拷贝给一些人,这些人要回答你,那么你的邮箱最后是充满了好几兆的PPT。

  那么通过我们的自动化的管理工具,比如说归档工具,它会自动识别PPT是同一份文件,他会把这些PPT进行归档,只保留一份,同时你需要的话,再帮你进行一个压缩。所以,你的数据库的容量就得到了有效地控制。同时,你可以触发一个自动化的流程,回收这些存储空间。这是一个个人系统的举例,其实在企业级的存储里面我们有更好的方案,就是TPC这个工具。它能够帮助大家在企业级的范围里面,进行一个文件的自动化的重复文件的识别跟删除。

  刚才谈到了IBM经典数据的产品有TBC,有Tivoli的StorageManagement还有A-SIS,也包括了我们谈到了虚拟磁带的设备,把这些数据进一步放到一个非常绿色的虚拟磁带上面去,达成一个经典数据的目的。然后,把这些文件在合适的地点和合适的时间被访问、储存,直到它最后被删除和处理。

大家都爱看
查看更多热点新闻