今天来挖一挖:分布式融合存储正在革谁的命? 存储与灾备

2015-05-14    来源:搜狐    编辑::阿明
5月,是一个特别的月份,阿明已知的有关存储的大型发布活动就涉及好几个厂商。5月5日,当华为与EMC在高端存储领域进行了一场前所未有的撕逼大战,华为这场“就是要治各种不服”

  5月,是一个特别的月份,阿明已知的有关存储的大型发布活动就涉及好几个厂商。5月5日,当华为与EMC在高端存储领域进行了一场前所未有的撕逼大战,华为这场“就是要治各种不服”的高端存储宣言引发了存储业界的热论,之后,世界似乎也没有改变,因为EMC依然还是EMC,华为还是华为。

  但是,令业界意想不到的是,有一种比高端存储更有实际意义的方式正在悄然兴起,并悄悄地为用户的存储应用带来新的革命。

  事实上,一直以来,存储这个行业似乎都始终保持着它独有的活力与青春,活力在于技术的革新,青春在于分分合合的更替。

  大家都知道高端存储之所以牛掰,在于其高性能、高可靠、高可用等特点,但价格也高啊。如何将这种高大上的高端存储以一种创新的方式来替代,一直是许多用户面临的挑战也是最大的渴望。

  用户永远都是现实主义者,便宜又好的存储没人不喜欢。用户需求所在,就是用户痛点所在。于是,业界有人提出了超融合的概念,也有人很早提出了分布式存储的概念,然而这两种方式还是不能满足用户对存储的扩展性、可用性、可靠性与价格之间的平衡。

  就在这个当头,有人设想将Hyper-Converged超融合与Scale-out存储架构相结合,没有想到这样的设想很快变成了现实。一种创新的模式已经诞生,阿明暂且称呼它为分布式融合存储。但这种创新存储引发了业界的许多争议,有人说这种方式没有传统集中存储那样更利于企业级用户管理,有人说这样的方式更利于提高存储效能……实属不易的是,就在大家众说纷纭之下,分布式融合存储打破厂商限制的僵局,已经找到了政府、电信运营商、医疗、教育等多个领域用户的成功应用。

  那么,为什么分布式融合存储能够如此快地获得许多成功应用?它正在革谁的命呢?

  闪存真的在加速“去中心化”吗?

 不管你承认与否,存储领域一切似乎照常,一切又都在变化。因为存储创新不断,技术更新不断,变化不断,但唯一照常不变的就是最大化地提高存储效率与价值。

  近些年来,用户追求存储速度与性能是前所未有的,随着闪存这种新介质的诞生,确实带给了许多企业级用户的福音。我们可以从闪存卡、SSD盘、全闪存阵列与混合阵列的逐渐铺开得到验证,闪存以一种前所未有的革新速度正在改变着存储行业的格局。

 闪存存储介质变化引发了一场存储更新,成为不争的事实。

  实际上,在闪存领域应用最为广泛的就是闪存卡和SSD盘,闪存也加速了分布式应用的推进,为什么这么说呢?大家都清楚最早应用在互联网领域的分布式架构,以其灵活扩展、价格可选、性能优越、可控可用的特点备受企业级用户的关注,但是要将分布式架构特别是分布式存储应用到企业级用户领域,虽然不难,但也不容易。

  随着x86成为企业级用户行业的新主流,由x86架构带来的分布式部署成为一种大趋势,但是在分布式部署过程中,用户依然面临存储性能提升的问题。用户不可能再回去采用高大上的高端存储,那么如何在分布式存储方案中实现性能的提升呢?

  最简单最快捷的方式就是应用闪存,包括闪存卡和SSD盘,特别是闪存卡与服务器的结合,一方面满足了用户对于存储性能的需求,另一方面也满足了用户对于x86灵活的分布式扩展。在闪存这种快速提升服务器性能的应用带动下,必然也加快了用户“去中心化”的发展。由此,闪存与服务器有效结合下,不仅很快提升了存储性能,也扩大了用户对于分布式存储的应用前景。

  也因为这股势力最初来自互联网领域用户去中心化的应用,因而闪存卡也最先在互联网领域应用开来。但是,当“去IOE”这样的思路从阿里诞生以来,就逐渐将这种“去中心化”的影响,从互联网扩展到了企业级用户领域,为此“去中心化”、“去IOE”也就成为了焦点。其间,分布式成为了实现“去中心化”打破原厂限制的最佳途径,可是又必须结合企业级用户自身的关键业务应用的特殊性,那么就必然需要一种新的创新与改变。

  分布式融合存储能否“挑大梁”?

  谈到“去中心化”,我们可能会想到传统的统一存储,它虽然能够实现设备的整合,但牺牲了性能和效率,对于x86成为用户主流选择的趋势下,需要一种更新的架构来改变这一切。

  之前,阿明的好朋友、业界资深存储专家董唯元认为,在存储技术领域,以及其它分布式、虚拟化、软件定义等技术领域中,已经存在从“分”到“合”的总体趋势。当然这种融合不是消灭新技术,而是纵向整合系统的软硬件功能层次,同时增加横向扩展联通能力,藉此令系统基础架构保持丰富内涵的同时,极大简化建设交付和使用维护的复杂程度,最终目的还是为用户业务逻辑腾出更大空间,而不是听凭本该静默的基础架构喧宾夺主。

  那么,基于董唯元的思路,就必须创新一个新的方式,可以更好互联,可以充分利用闪存性能,并且必须基于x86计算架构,采用分布式存储方式,可以通过软硬件配合紧密耦合的计算和存储资源池化,并提供高性能数据库访问。这种方式的诞生势必会改变现有传统的IOE在用户中的地位,当然,这种方式的实现,最先去掉的应该是E的高端存储。

  似乎在前段时间,阿明看到有企业级用户包括某些运营商用户开始采用这种方式,在很大程度上做到使用分布式融合存储来替换了高端存储的工作。既然可以实现,并且有了成功案例,那么我们不妨来挖挖这个方面的情况。

  超融合给scale-out分布式存储带来了什么?

  前段时间,有一个一体机国产厂商曾经干败了数据库一体机大佬,采用的创新架构就是分布式融合存储。一旦超融合与scale-out分布式存储有机结合起来,对于用户的需求满足也是前所未有的,一种性能与价格兼顾、一种扩展与可靠兼顾、一种可用与可控兼顾的解决方案必然赢得更多的市场回应。

  这里阿明不得不提一下来自天玑数据的数据库一体机产品PBData。它的最大特点在于高性能X86服务器与高速Infiniband互联技术以及闪存技术的高度融合,通过软硬件配合形成紧密耦合的计算和存储资源池化的高性能数据库云平台,具备分布式存储的扩展优势,也具备高端存储的性能特点。从近几次用户现场测试情况来看,这是一个可以落地的、在不改变原有应用的前提下实现UNIX平台向X86平台业务平滑迁移的有效解决方案之一。并且,PBData是国产化X86产品,从性价比以及技术自主可控方面都具备较大的优势。

  不过,分布式融合要达到用户对于高端存储的需求效果,就不得不突出高可用。当然,高可用不是随便说说而已,在某运营商的测试结果中,足以说明PBData数据库一体机所具备的技术优势是其他友商现有产品现阶段所难以具备或本就没有的,比如PBData一体机的所有节点均为冗余设计,不会因为单硬盘故障、单个计算节点和存储节点故障、单台交换机故障导致业务停顿或者数据丢失,能够满足企业级环境下的高可用需求。

  PBData架构设计可以满足在数据库场景下的大吞吐、高并发以及低时延的性能要求。首先需要指出的是其Cache机制,PBData通过SSD磁盘作为存储的smart cache,每个节点可以配置12个 或 20个SSD盘。

  对于OLTP系统,命中率要求在90%以上。Cache命中率非常关键,在业务数据无热度时延时较达30ms,IOPS较低不足8000,是传统存储的1/3。在预热后命中率达90%以上后,只有不到1ms的延时,IOPS高达7W以上,是传统存储的3倍以上。

  针对OLAP系统,强调大并发的场景下的存储带宽。而PBData融合架构中采用了互联机制,要知道InfiniBand本身拥有高吞吐的特性,可以把分布式存储集群的高并发能力提升到极致。不仅如此,因为融合架构的节点还融合了计算与存储,使交互与处理在最大限度上保留在节点内完成,无需通过网络传输,自然也提高了处理效率。

  特别需要说一下互联机制,它不仅通过HCA卡和高速Infiniband交换机进行互联,具有高吞吐,其主流卡达到40Gb/S,适应OLAP高并发场景。通过RDMA协议等实现的信息交互,延时短,释放CPU负荷,降低延迟,用于优化OLTP场景。

  其次就是存储冗余机制,PBData( Oracle)一体机通过ASM来实现存储冗余,在计算节点,OS指标中写的IOPS和吞吐为有效IOPS和吞吐的2倍。对磁盘失败引起的问题,通过ASM层面进行处理。

  为此,我们基本明了PBData数据库一体机的技术架构,由于PBData采用SAS磁盘和SSD磁盘混合的存储,同时兼容闪存卡,并使用了Infiniband的互联机制。对于高吞吐MBPS,主要取决于带宽和磁盘的吞吐。对于高IOPS,则取决于smart cache的命中率。为此, 基于企业级用户不同的业务场景特点,PBData需要进行优化配置,这样可以带来用户实际部署与应用的更好结果,达到用户在高性能、低延迟、高可用和自主可控的完美目标。

  不仅如此,PBData也对产品做了细致规划,分为全冗余全闪存、重点优化OLTP的E系列;同构节点便捷扩展、重点优化OLAP的H系列;节点分工资源独立、OLTP/OLAP混合负载的V系列。每个系列针对用户的需求也细分出不同的型号,有针对性的面对用户不同规模和场景的需求,很大程度上可以满足更大范伟企业级用户应用更细分的需求。

  分布式存储为什么不能单打独斗?

  分布式融合存储正在革谁的命?相信大家都明了了,但闪存在其中的价值也体现了出来,不过这种架构不是一个单一的方式,既然强调融合,因此分布式融合存储必须基于高性能X86服务器,并且借助高速Infiniband互联技术和闪存技术,才能发挥出真本事,从而可以实现高性能数据库云平台的功能。

  分布式存储为什么不能单打独斗,答案自然见分晓。

  同时,因为分布式融合存储也可以更好地实现“去中心化”,彻底打破原创限制,所以,未来它必然可以为用户提供更加灵活高效、利于扩展的存储解决之道。

1
3