一个云就绪的分布式存储基础设施规划存储与灾备
许多企业正在利用更大、更全面的存储阵列,以帮助他们分配他们的环境。在本文中,我们将为您介绍您在利用存储阵列进行环境分配的过程中需要重点考虑的重要组成部分,在许多情况下,存储平台已经成为了云解决方案的核心。智能复制和存储控制机制现在允许云组件的分布。这包括用户信息、工作量复制,当然还包括大数据。
IT经理们已经看到,通过使用智能存储平台,可以帮助他们在保持灵活性的同时,继续运营相关的业务,其可以是一个现场的站点,甚至是存储控制器。这个想法是创建一个具有弹性的分配存储基础设施,其可以支持用户群、工作负载、以及不断增长的业务。在创造这样一个环境的过程中,工程师们需要知道几个涉及到建立一个成功的存储解决方案有关的概念。
考虑带宽。
一种分布式存储环境将需要彻底的进行带宽规划。其规模将完全依赖于以下几个方面:
数据需要传输的距离(hop数目)。
复制设置。
故障转移的要求。
正在传输的数据量。
同时访问数据的用户数。
当然可能还会有其他方面的相关要求。在某些情况下,被复制的某些类型的数据库或应用程序在存储系统之间会有其自己的资源需求。请务必要找出其中的数据信息将被传输到何处,并创建一套复制策略。带宽大小不当可能导致严重的性能问题(通常由于带宽过小);而过多的带宽可能会导致企业在服务中花冤枉钱。在某些情况下,使用广域网优化是一个好主意。
挑选合适的存储平台
虽然这可能看起来更像是一个常识性的问题——为分布式环境选择合适的存储平台的过程中是非常重要的。在某些情况下,某些企业忘了重要的规划步骤,其所选择存储系统仅仅只是当下,及未来很短的一段时间内适合于他们。因此,企业在选择适当类型的平台,请参考如下几点建议:
利用情况:你企业对于存储平台的利用情况是怎样的,这既包括企业当下对于存储平台的利用情况,还包括您的企业在三年后、五年后乃至存储平台的使用寿命结束时的使用情况?同时,您还需要考虑控制器能够处理高峰期的能力?其是否符合IOPS要求?
迁移:一旦您企业的发展超出了你当前的需求或需要升级时,数据迁移工作是否会很容易?
数据管理:系统是否有颗粒数据控制机制?是否进行重复数据、文件或块删除?
管理策略:确保你所选择的系统具备较好的与您企业内部系统整合的能力,能够支持您企业的相关存储管理策略。
对于大型部署,许多供应商将非常乐意为控制器提供一个POC或试点项目。虽然这样的有可能需要花费一些部署成本,但长远来看,这种部署成本可能是值得的。通过建立工作负载、应用程序和数据将驻留的一个分布式存储系统,管理员可以更好地预测他们的需求,并花费更少的时间(和金钱)解决一个小的环境。
数据流量控制。分布式存储系统中需要特别注意信息通过广域网。正如前面所提到的,广域网优化对于帮助支持一个更强大的数据传输方法来说可能是一种非常有效的举措。此外,对其他存储控制器的控制可以真正有效的帮助缩小带宽要求。通过在数据中心之间设置专用链路,并使用QoS以方便适量的带宽,管理员可以控制数据流的过程,而管道仍然有很大的空间来执行其他的功能。基本上,在如何存储流量以及如何有效的到达目的地方面,需要有一致的能见度。
使用智能存储(自动精简配置/重复数据删除)。今天的企业存储解决方案都是围绕着直接提升企业的效率进行的。数据控制、存储规模优化、智能重复数据删除都有助于控制数据流和管理过程。通过减少重复存储项目的数量,管理员可以快速回收他们的系统空间。此外,寻求控制器虚拟化就绪。这意味着环境中部署诸如VDI、应用程序虚拟化技术、甚至简单的服务器虚拟化应该寻找系统智能提供空间,而不会造成不必要的重复。
分布式存储作为灾难恢复存储基础设施在分布式环境下可用于多种用途。数据的弹性具备更好的性能,或只是将存储设置在距离用户更近的位置,都将是非常好的业务用例。在某些情况下,企业需要专门针对灾难恢复所使用的存储进行特殊的考虑。我们建议企业首先进行进行业务影响分析(BIA),以建立起一些重要的指标。这包括隔离系统、平台和其他被视为关键的数据点。然后,企业可以确定恢复时间,并建立各种工作负载规模的重要性。一旦确定之后,选择一个分布式存储系统以满足相关的需求就变得容易多了。
设计一个好的存储平台造价会非常昂贵,且相当快。特别是当规划和架构过程通常被直接跳过的情况下。尽管现代的存储阵列可能非常昂贵,但他们是围绕这直接帮助提升企业的效率的。具备物理控制器的逻辑段的能力、消除重复数据和归档信息的功能,以帮助更好的控制存储环境。当了一款存储平台部署到位之后,企业就可以从良好的性能和灵活性中受益了,而且更为重要的是:确保了企业的正常运行时间。