分层存储是最好的解决方案吗?存储与灾备
在IBM发起的一个tweetchat上,我半开玩笑地问,本周IT行业被称作“存储分层”,并在技术术语含义中加入了倾向性含义。当一个参与者问“你认为那是什么意思?”时,我感到有些惊愕。
我说,传统的分层包含不同介质之间的数据移动,主要基于数据的重复使用率和存储介质的价格。这是严格意义上的存储分配而不是归档,归档会涉及更细粒度的数据理解和它的业务背景,并且目标是存储利用率。一个参与者认同并提出分层是“匹配的数据和设备特征以最小的成本取得最大的性能”。另一位说“决定分层的指标有:性能、可用性、共享能力、购买成本、管理成本及服务。”这听起来像IBM几年前在计算机制造学校的口号:so far,so good。
让我吃惊的是,参与讨论的人一致认为闪存SSD改变了一切;它创建了一个新的层级并且很快替代高性能/低容量磁盘作为数据写入的首要目标。我认为,将基于内存的存储放到传统模式中并不能改变传统的分层结构。老前辈们应该都懂我说的:以往的DFSMS/DFHSM框架存储范例用内存作为第一存储层。我们被告知将数据从内存(一种昂贵并稀缺的资源)快速移出并存入DASD(“千禧一代”,是磁盘阵列的另一个名字)。最后,我们要将数据输出到磁带(再次,对于初学者,它是一种由流聚酯薄膜组成的存储介质,提供高容量/低成本。)这种分层模式拥有40年的历史,闪存SSD真的能够改变任何形式的游戏规则吗?
“是的”一位参与者说。闪存 SSD 被用来做为第一层,提供快速响应。很明显,我们都需要快速访问数据,尤其是像微博上说的数据卡在“服务器管理程序的I/O搅拌器”。供应商认识到从闪存SSD获得更高的利润与此无关,我这么说并没有调侃。
一位参与者说,我们需要创建庞大的存储系统,闪存SSD、快速磁盘和大容量磁盘全部放在该系统中来简化自动化分层结构。假设智能控制器能够检测到数据需要移动并自动执行此功能,那么这种方法可以节约人工成本。他们认为,存储管理者可以节约大量时间。
那时我想到了一些结论:如果典型的存储模式是过于依赖人工,并且需要一个整体解决方案,这可以解释我所见过的一些大厂商售旗舰产品的融合架构。但是,不论是从设计还是经济效率的立场来看,这是否真的是最好的方法呢?
很多厂商一直以来都是将闪存SSD与两层磁盘阵列组合在一起,放在一个盘柜中。然后,他们在阵列控制器上添加“智能”分层软件,在内存、快速磁盘和大容量磁盘间进行数据迁移。这些自动分层阵列以降低人工成本,节约存储管理员时间为卖点销售出去。
对于厂商来说,在同一机箱中放入不同的性能和容量:他们在性能和容量磁盘以及软件许可方面收取了更多的费用,以弥补他们在预集成和智能分层存储上的努力。我还没有看到一份ROI的分析,比较这种自动分层方式和手工数据移动之间的成本节约。
绝大多数的整体的分层存储解决方案也是有缺失的,那就是不支持传统的磁带介质。本次讨论中有一个对磁带的简短讨论,主要是IBM希望用线性磁带文件系统(LTFS)重新复兴磁带。我碰巧对在TapeNAS中配置的LTFS感兴趣,但我担心那些融合架构推动者恐怕要花上几年时间才能将这项技术融合进去。很显然,融合架构的强大体系,一个LTFS TapeNAS头,已经指明了方向。
最后,我提出了我的问题,“我们设法通过自动分层存储的手段在闪存、磁盘,甚至有一天能够在磁带中自动迁移数据,究竟是为了解决什么问题呢?”如果它只是分配容量,那么像去重和压缩,它只是在与数据增长和保留的斗争中保持作用,那么我们注定失败。存储层倒不如说是“存储层泪水”的配方。