文件虚拟化:破解数据爆炸性增涨存储困境解决方案
前言:在当今信息爆炸的时代,上百GB甚至TB、PB的数据资料量已不稀奇。特别是视频、音频、图片等大量非结构化数据的爆炸性增涨,使得如何有效解决企业资料的存储与安全成为企业管理者所必须重视的问题,我们该如何办?
非结构化数据的存储困境
首先就要了解我们需要存储的数据对象。就目前而言,企业需要存储的数据主要分为两个部分:一是基于数据块的结构化数据,二是基于文件型的非结构化数据。
据IDC数据统计显示:在过去三年中,企业部署的应用类型发生了很大的变化。基于更以文件为中心的存储基础架构而运行的一组新型应用(例如Web服务器、电子邮件、电子记录和数字媒体)在公司的企业数据中正占据越来越高的比例。
对于爆炸性增涨的非结构化数据,如何有效地存储管理数据,如何有效地节省存储成本,这成为非常重要的问题。
我们可以从一个具体的例子可以看出,在国内一家移动通讯公司的通信业务里,每打一个电话会有四个文件的存储,这样一个月会出现200亿个新的文件。另外,中国政府的规定是所有的文件必须保存三年,如果这些数据都被存储在一级存储中太贵了,企业负担不起,而最终导致的结果可能是谁都不能再打电话了。
在这种情况下,我们应该怎么办?针对这个问题,F5中国北方区技术经理杨明非给出了这样的解决办法:将文件三个月之后会被自动的存储到二级文件存储里,实现一级存储与二级存储的组合应用,这样,就可以有效的解决存储高成本问题。
文件存储虚拟化:有效的非结构化数据解决办法
其实,针对非结构化数据,有专门的解决办法,这就是文件虚拟化解决方案,安全不同于传统数据存储管理产品的方案。
在NAS存储环境下,前端应用服务器与后端存储介质的存储访问关系非常复杂,管理效率低,容易出错。应用服务器直接访问存储介质,不能对存储介质进行有效管理。(如下图)
在NAS模式下,如果我们当前的NAS存储容量不够了,需要增加新的NAS,那只能是配置好新的NAS,然后再通知所有的客户端,添加一个新的网络存储节点,然后把新的文件放到新的NAS上。这中间可能还会存在很多问题,比如目录的完整性需要保持,用户需要在不同的存储节点中去找数据等。
在这种情况下,我们就可以在前端应用服务器与后端存储介质之间,虚拟化一个文件管理系统出来,这就是"文件虚拟化"。
通过文件虚拟化平台,将后端存储介质虚拟化成一个存储池,此时,只需要在ARX上通过配置添加一个新的NAS文件系统,ARX就可以自动的将所有用户的新文件都存放到新的NAS上,但对于客户端来说,他看到的目录仍然是完整的一个目录下的多个文件,但实际上这些文件是物理存储在不同的NAS上,从而实现对存储的有效访问。
未虚拟化的NAS存储网络
通过文件虚拟化后的NAS存储网络
通过文件虚拟化,让NAS存储更加开化了,存储成本更低了。例如,在前文的移动通讯公司案例中,通过文件虚拟化平台,可以将存储成本更低的磁带等设备加入这个存储池,系统还可以自动将三个月以后的数据,自动保存到二线存储介质,从而提高一线存储介质的高效性,从而降低存储成本。
F5 ARX:领军虚拟化存储市场
由上的分析可见,文件虚拟化系统可能给当前的存储系统带来革命性的变化,这是一个潜在的庞大的市场。因此,不少厂商介入了这个领域。
介入文件虚拟化领域的厂商主要分为两类:一类是原本为存储设备的供应商,例如博科等,另一类就是F5、思科等网络设备供应商。基本上,这些大的厂商都是通过收购获得这种技术的,EMC 收购的Ranfinity,博科收购了NuView,思科收购了另一家文件虚拟化厂商:NeoPath。经过一段时间的推进,F5在这个市场逐渐成为了领导者。
自从F5收购了Acopia以后,在文件虚拟化市场进一步加大了研发力度,并将Acopia文件虚拟化产品与F5原有的BIG-IP产品有效结合,形成了ARX数据存储管理产品。通过ARX所建立的文件虚拟化平台,F5解决方案可扩充后台的存储能力,同时能够管理多个路径同时并发的读写NAS系统,为系统设计最佳读写路径,从而提高文件读写的效率。
F5的ARX通过独有的运算加速芯片实现路径快速查找,极好的保证了文件访问和读取性能,此外,由于F5采用了基于硬件的文件虚拟化方案,对于扩展性方面仅受硬件处理能力的限制,提供"近乎无限"的扩展性。目前采用F5解决方案的性能已经达到了只有在高性能计算中的大型并行文件系统才能提供的性能指标,而F5可以实现更低的投资成本、运维成本和最优化的系统性能。
到目前为止,F5已经推出了ARX500、ARX1000、2000、4000等多个系列的产品。其中,全新的ARX2000 专为满足中到大型存储环境的可扩展性和性能需求而设计,使企业可以在更加高效地应对快速攀升的数据增长的同时,降低数据管理的成本和复杂度。
同时,F5 还推出了新版本的数据管理操作系统,该软件可针对 ARX 解决方案提供增强的 Microsoft/CIFS 存储环境支持,并帮助第 2 层重复数据删除平台实现更强大的扩展能力。此外,新版 F5® Data Manager 软件管理工具帮助众多F5合作伙伴更轻松地对客户的存储环境进行评估。
我们可以举一个实际例子,来说明F5 ARX的作用。随着高清视频和多媒体文件量的不断增长,文件服务器负担越来越重,这使全球领先的互动娱乐厂商世嘉公司面临日趋严峻的数据管理挑战。每周的备份工作要耗费 40 个小时才能完成。为此,世嘉公司部署了 ARX 文件虚拟化解决方案,实施了自动化存储分级策略,灵活地分配存储资源,将非关键数据存储在低成本、大容量的设备上,并为经常使用的数据释放出更多的主存储系统空间。这一举措帮助公司减少所需的主存储系统数量,并大幅减少备份工作所需的时间。通过最大限度地利用现有存储硬件集中服务器存储资源,而不再采用之前的独立运行方式。目前,世嘉公司可利用成本较低的 SATA 磁盘来存储文件。这减少了三分之二的整体存储成本,并显著降低了日常备份的文件量。存储分级战略让世嘉公司的数据备份时间减少了40%。
其实,ARX只是F5虚拟化战略的一部分,如果加上f5的应用交付平台,F5为企业用户打造了面向数据中心的整体虚拟化战略,这将大家节省更多的成本。