企业存储分层——两层就足够存储与灾备

2013-07-05    来源:TechTarget中国    编辑:孙少忆
今天正在考虑存储分层或者已经正在做存储分层的用户,绝大多数是以人工方式在做。但自动化分层更有意义。

  多年以来,存储行业已经给企业IT部门留下一个深刻的印象:存储需要通过分层来降低成本,获取成本效率。

  然而,自从2008年1月EMC公司推出了第一款企业级闪存盘(EFD)之后,人们不禁要质疑存储分层的持续需求。有粗略的统计表明,一个活动的数据集中只有大约3-10%的数据是“热的”(具体数字依赖于行业以及企业规模)。

  许多公司已经弥补了磁性机械旋转硬盘驱动器(HDDs)的相对较低的性能问题——与非易失性存储相比——利用硬盘驱动器阵列和跨硬盘条带化数据(使用一种被称为“短击”的做法)。但是这种做法在很多方面都带来了昂贵的成本,不单是因为造成的容量使用浪费,也包括硬盘驱动器耗电时产生的热量。

  硬盘驱动器走了,SATA驱动器来了

  企业级闪存盘或者叫固态硬盘(SSDs)能实现单位性能成本降低高达100倍。所以,引入少量固态硬盘能让企业重获由于“短击”造成的容量使用损失。

  但更重要的是,CIO应该考虑完全放弃购买高性能驱动器。

  这个想法并没有多激进,参考前面提出的意见——3-10%的活动数据是“热的”——逻辑上讲,剩余的数据(至少)不是热的。对于那些绝大部分,这种“不热”的数据(尽管不必一定是冷数据),在应用中是以参照的方式进行使用。换句话说,对这些数据的读取明显比写操作要多。

  此外,应用通常要在这些“不热”的大块数据组中读取数据。一个典型的例子就是报告应用程序,该应用从一整天的交易的数据库中读取数据,生成当天的报告。今天绝大多数磁盘驱动器都具备了超级的预读取能力,RAID算法通常把数据放在磁盘驱动器上,这些读取多数看起来很可能是连续的。

  所以,大量的连续读取,少量的写操作导致走向了低成本的SATA驱动器。这就再次带回到我们的论点,如果我有少量的“热”数据能够用最少量的固态硬盘处理(一个中等规模的固态硬盘能够实现每IOPS最低成本),剩余的数据用SATA驱动器处理(一个中等规模的SATA能实现每G比特最低成本),向前进一步,我们理所当然得出一个结论:一个企业只需要拥有两层存储。

  聚焦在服务水平上,而不是具体的存储技术

  今天正在考虑存储分层或者已经正在做存储分层的用户,绝大多数是以人工方式在做。但自动化分层更有意义。根据上面的分析,只有非常小的比例的数据是真正适合用企业级闪盘或者固态硬盘,虽然有非常有效的理由“寄希望”或坚持在闪存(或者主要是随机存储)中保存一个完整的数据集,所有存储行业的领导厂商都提供某种形式的自动化分层。

  归根到底,企业IT部门需要聚焦在他们正在交付的服务水平上,而不是任何具体的技术。IT部门也需要认识到他们今天部署的不管是什么分层策略,明天很可能还是要更改。

  考虑到移动、社交、云计算和大数据的影响,远程访问文件数据是否会扭曲分层算法?整合的云数据(无论是社交数据还是大数据)是否会被分层影响?

  在每一个案例中,KISS(保持简单,傻瓜!)原则都是你最好的朋友。就像大多数的技术一样,分层增加了复杂的程度。最根本的问题是你的企业是否需要这种复杂,这种复杂将带来什么收益?如果只是有点边际收益,可能不值得为此付出努力。

1
3