用虚拟化技术保护图书馆存储设备原有投资
2009-08-31 比特网
虚拟存储实现前后对比实例
数字图书馆的发展经历了十几年的风风雨雨,到今天可以说已经是初见成效。近年来,很多走在信息化前列的高校一直是在摸着石头过河,只能靠自己的调查研究和借鉴国外学校的先进经验来建设本校的数字图书馆,而其他学校则紧随其后,唯它们马首是瞻。但是从全国高校的数字图书馆建设情况来看,发展状况仍然是良莠不齐。
图书馆面临新问题
学校数字图书馆的发展一直处于不断探索之中,数字图书馆的建设一般包括初期建设和后期补充投资。学校的存储设备是分期分批采购的,既有磁带机、光盘库,又有磁盘阵列,因此在存储设备的采购方面一般只会考虑到解决现存的问题和成本限制,在设备采购方面缺乏长远的规划和前瞻性。数字图书馆建设初期,学校采购的存储设备大都是建立在DAS架构上的,但是现在数字图书馆已经“改朝换代”,开始采用SAN架构,原有的很多设备已经不能满足新架构的需要。由于这些设备的灵活性差、难以扩展,成了数字图书馆的“鸡肋”,面临着被淘汰出局的压力。从学校来讲,既要跟上新技术发展的步伐,让数字图书馆向着易管理、易维护的方向发展,也要保护学校的原有投资,让这些异构的存储设备发挥的作用最大化。基于此,学校不得不整合现有存储设备以保护原有投资。
此外,这些异构的存储设备之间不可避免地存在兼容性等问题,其中主要包括存储容量分离、不同的存储设备智能程度不同、每个存储系统单独管理接口、各个存储厂商容灾软件无法通用等等,这些问题的存在将加速原有设备的淘汰。
现在,如何让这些异构设备统一起来,屏蔽各个存储设备的差异性,并且针对数据的生命周期实现分级存储,成为长期以来摆在数字图书馆面前的一个问题。虚拟化技术应用于存储之中,为这一问题的解决带来福音。
虚拟化技术走向存储
要想让各个厂商的不同类型的设备实现异构共存,就要建立一个统一的存储平台,而存储平台的统一可以通过存储的虚拟化来完成。存储虚拟化就把存储环境的复杂性隐藏起来,把可存储数据的空间充分利用起来,让越来越难以管理的数据轻松管理起来的存储技术。管理员看到的不再是单独的存储设备,而是一个整体的存储池,用户可以不用考虑存储设备的容量、性能而直接存储,并且可以统一管理和控制。针对虚拟化给存储带来的好处,IBM系统存储部大中华区存储解决方案总监张英伟告诉记者,虚拟化不但可以让不同类型不同品牌的存储产品形成统一存储池,提高存储利用率,减少系统TCO,还可以实现在不同厂商存储设备之间在线数据迁移以及跨越不同厂商存储设备的容灾,同时也能为教育的文献数据共享,集中管理等提供优势。
在目前数字图书馆应用较多的SAN的环境中,虚拟化存储可分为基于主机、基于存储设备和基于网络三种。存储界流行的一个比喻可以很形象地理解这三种虚拟化的方式:存储虚拟化就像有演讲者与听众的会场,演讲者是主机,听众是存储设备,但演讲者和听众说不同的语言,相互间不能直接交流。而虚拟化存储就像是一台翻译器,基于主机的虚拟化存储就像把翻译器安在演讲者身上;基于存储设备的虚拟化存储就像把翻译器装在听众身上;基于网络的虚拟化存储就像会场内的同传设备。装上了翻译器,演讲者与听众间就可以顺畅交流,而翻译器装在不同的位置也就构成了在不同层面上的虚拟化存储。
基于网络的虚拟化成为主流
基于主机的存储虚拟化要求每台设备都要安装价格不菲的软件,因此不利于降低总拥有成本(TCO),管理和升级也比较复杂,并且占有主机CPU;基于存储层的虚拟化的致命弱点是不开放,硬件和软件的存储设备只能采用同一厂家的产品,兼容性差,缺乏统一的管理控制能力。虽然这两种方式都已经发展的比较成熟,但是从存储的发展趋势来看,基于网络的虚拟化因其更具灵活性而日益成为发展的潮流。
根据控制和数据路径的不同,基于网络的存储虚拟化分为对称(或叫带内in-band)与不对称(或叫带外out-of-band)两种方式。“带内”虚拟技术是在数据读写的过程中,在主机到存储设备的路径上实现虚拟存储;而“带外”虚拟技术是在数据读写之前,就已经做好了虚拟工作,而且实现虚拟的部分并不在主机到存储设备的访问路径上。说形象些,我们去游乐场玩,“带内”的玩法就是不买通票,想玩哪个的时候再买票,而“带外”,就是提前买通票。
以IBM的SVC(SAN Volume Controller)为例,它在提高存储基础设施的灵活性方面优势明显。张英伟告诉我们,SVC具有较好的存储和主机连接性,可以兼容目前用户现有的存储设备,而且最重要的是,对用户采用SVC的虚拟设备,不需要必须购买特定的高端磁盘或交换机,区别于基于存储的控制器本身或交换机的虚拟存储设备。所以原来的存储都可以形成统一存储池。
从博弈中寻找平衡
图书馆利用虚拟化存储来改善数据管理将带来的最大的好处就是更有效地提高资源利用率,将不同的存储设备统一管理、各尽其才,保护了学校的原有投资。
存储虚拟化技术虽然有很多优点,但仍有很多缺点有待改善,比如它需要专门的元数据管理和资源管理设备,这些设备需要通过冗余保证其可用性,这会增加系统的复杂性;同时,不同性能、不同结构的存储设备位于同一个存储池,不能充分发挥各自的优势,性能较差的部件反而会制约整个系统的性能。
任何技术都是不断发展的,不可能达到尽善尽美,虚拟化存储也是一样。因此我们只能趋利避害,扬长避短,充分结合本校图书馆的实际情况,从应用角度和功能性出发,对新技术和旧设备进行博弈,发挥存储虚拟化的优势,避免虚拟化技术带来的不便。