超融合的下一站是什么?超级融合!行业资讯
作为一半职业生涯是在技术研究领域度过的未来学家,我想试图对未来作一番预测,为此既回顾了超融合的历史,又分析了几个新兴的技术。
一、超融合方面的背景
第一代IT基础设施是“孤岛式”架构,计算、存储和网络由客户单独选择和购买。客户需要确保这三种产品协同运行。从2007年开始,市面上出现了第二代融合基础设施(CI)系统,它们捆绑了现有的服务器、存储和网络产品,并辅以管理软件。这种方法将客户购买后运行第一个应用软件所花费的时间由几个月缩短至几周,因为厂商预先测试并预先集成了这三种产品。在孤岛式架构和融合架构中,存储区域网络(SAN)都被用于存储(为了让本文简单化,我避免讨论NAS)。2012年出现了超融合(HCI)系统――这些是紧密耦合的计算和存储硬件,不需要SAN。融合基础设施其实是三种预先测试的产品,只不过一起销售;不像整合基础设施,超融合才是真正的单一产品,采用统一管理。HCI系统就好比是第三代融合。
据451 Research针对IT买家的最新季度《企业之声》调查报告声称,超融合基础设施目前应用于40%的企业组织;451 Research的分析师预计这个数字在今后两年会大幅提升。
作为一半职业生涯是在技术研究领域度过的未来学家,我想试图对未来作一番预测,为此既回顾了超融合的历史,又分析了几个新兴的技术。
先来介绍一下历史。
二. SAN时代 — — 1994年–2012年
存储区域网络(SAN)是一种网络,它让用户可以通过数据中心的多台服务器访问共享块存储,比如磁盘阵列。它让用户能够在整个园区合并高吞吐量存储。
串行光纤通道(FC)网络标准在1994年出现、1 Gbps光纤通道在1997年面市后,SAN变得流行起来。直接连接存储(DAS)是当时的一项替代技术,但是它不支持存储共享,导致存储资源的利用率很低。
SAN通过使用一组共同的存储功能(数据中心中的所有服务器都可以享用这些功能),提高了存储资源的利用率,提高了可靠性,确保高性能存储共享,还简化了存储管理。此外,SAN让用户可以独自扩展存储和计算资源,因而可以运行各种各样的存储及计算需求大不一样的工作负载。
光纤通道SAN网络的性能继续不断提升。2000年初,光纤通道SAN的成本和复杂性大大下降,因而得到了更广泛的采用,可以部署在大企业环境和中小企业环境。诸多新功能迅速被引入到共享式SAN存储中,它们常常是DAS存储所没有的,比如快照、克隆、压缩、重复数据删除、存储分层和远程拷贝等功能。后来出现了作为光纤通道SAN替代技术的iSCSI SAN和FCoE(基于以太网的光纤通道)。它们让以太网得以用于存储,因而通过消除专门用于存储的第二种类型的网络,简化了管理。由于这几个发展动向,共享式SAN存储变得非常流行,DAS存储却日渐式微,大概2012之前就是这个样子。
三. DAS和超融合时代 — — 2012年–2016+
然而近几年,由于SAN存在下列四大问题,钟摆又开始摆回来摆向DAS。
1. 由于出现速度越来越快的存储设备(闪存、SSD等),通过SAN网络访问这些存储设备在网络协议和软件方面的开销开始在总的响应时间中占大头。DAS的访问时间只有SAN访问时间的一半至三分之一。
2. SAN阵列中的存储设备其价格比DAS存储中的存储设备贵得多,即便使用的存储设备一模一样。
3. 除了少数几个例外,SAN存储通常是专有的,无法横向扩展。添加更多的存储(超过一定的范围)常常需要更复杂的升级流程。
4. SAN管理起来复杂。基于光纤通道标准的SAN需要独特的主机总线适配器(HBA)、独特的交换机、独特的电缆、逻辑单元号(LUN)分区、LUN掩码和新的多路径驱动程序。虽然基于以太网的SAN(比如iSCSI SAN)不需要一种不同类型的网络用于存储,但管理起来仍有点复杂。SAN方面的复杂性主要来自虚拟机等应用程序概念和LUN等存储概念之间的脱节,以及计算和存储的分开管理。
由于SAN的这些问题,市面上出现了新的存储软件,名为虚拟SAN或vSAN软件。
超融合或HCI系统是紧密耦合的计算和存储节点,因而不需要普通的存储区域网络(SAN),它使用vSAN软件来获得同等的功能,并利用现有服务器来满足网络和DAS存储需求。应用服务器上的DAS存储和vSAN软件这对组合现在的价格低于SAN存储,但提供大致相当的功能。存储功能通过服务器节点中的软件来提供,还可添加可选功能,比如备份、恢复、复制、重复数据删除和压缩。典型的HCI系统包括:Nutanix、Simplivity、思科Hyperflex、 Gridstore、Pivot3和Scale Computing。
相比光纤通道SAN,HCI系统不需要新的HBA、电缆或交换机。但是,与所有SAN一样,HCI系统确实需要通过网络访问远程存储。某个应用程序读取数据时,数据可能存储在本地DAS上,也可能存储在一个或多个远程节点上。在后一种情况下,需要通过网络从一个或多个远程存储设备读取数据。类似的是,某个应用程序写入数据时,本地副本可能写入到本地DAS,然而第二个副本必须始终经由网络,写入到另外某个节点上的远程存储设备。HCI系统试图通过把数据放在最有可能访问该数据的服务器的DAS存储上来提升性能――这项技术名为数据本地化(data locality)。
HCI系统通过这两种方法来简化存储管理:一是提供以应用为中心的存储管理功能(虚拟机快照而不是LUN快照),二是提供计算和存储的综合管理。
四. 存储和SAN协议方面的新动向
在本章节,不妨看看存储和SAN协议方面最近的三大动向。
1. NVMe over Fabrics取代SCSI
1986年,小型计算机系统接口(SCSI)成为用于连接以及主机和目标块存储设备或系统之间传输数据的一种标准,当时硬盘驱动器(HDD)和磁带还是主要的存储介质。NVMe是一种比较新的SCSI替代方案,它旨在与更快速的介质结合使用,比如固态硬盘(SSD)和基于后闪存的技术。
NVMe提供了经过简化的寄存器接口和命令集,减少输入/输出堆栈的处理器开销。基于NVMe的存储设备有诸多好处,包括延迟较低、增强了并行处理能力、提升了性能。
NVMe原先是为通过计算机的PCIe主线来本地使用而设计的。NVMe over Fabrics(NVMeoF)让用户能够使用替代传统方法,这些替代方法延长了NVMe主机设备和NVMe存储设备或子系统可以连接的距离。NVMeoF的设计目的是,让远程存储设备的延迟在本地连接的NVMe存储设备的延迟的10微秒之内。
SAN网络传统上使用基于光纤通道传输的SCSI协议。NVMeoF规范在2016年6月发布后,未来的SAN将使用基于结合RDMA的以太网(iWARP或RoCE)等传输方法的NVMeoF协议。Mangstor已宣布提供使用NVMeoF的NX系列闪存阵列,支持300万IOPS和不到100微秒的延迟。Mellanox和Qlogic也在2016年8月的英特尔开发者论坛上展示了NVMeoF解决方案。
这些新兴的SAN,SAN和DAS之间的性能差异实际上会消失。
2. 标准x86服务器上出现颇有竞争力的网络存储
在过去,与SAN连接的共享块存储控制器往往是专有的。它们是用特殊主板、有时甚至用特殊ASIC来制造的,3Par的产品就是这样。
共享块存储日益使用标准x86服务器来制造,这种系统在成本、性能和可扩展性方面与用专有硬件来制造的共享块存储相比颇有竞争力。用标准硬件来制造的共享块存储的几个例子包括:EMC ScaleIO、Formation Data和Hedvig等,这类软件定义存储阵列有很多。
3. 网络共享存储中出现以应用为中心的存储管理
过去的SAN存储提供了以LUN为中心的存储管理。网络SAN存储厂商(比如Tintri5)现在提供以应用为中心的存储管理。
4. 小结
这三大动向表明,未来的网络块存储可以:
·用标准服务器硬件来制造
·拥有简单的以应用为中心的管理中心
·使用NVMeoF协议,拥有高性能
在我看来,这三大动向会给未来的存储和融合架构带来重大影响。
五. 下一代存储网络时代 — — 2016年 — ?
不妨回过头来分析钟摆远离SAN、摆向DAS和超融合的四大原因。
1. DAS访问时间只有SAN访问时间的一半至三分之一。NVMeoF问世后,这个说法不再成立。
2. SAN存储设备比DAS存储设备昂贵。现在许多SAN阵列只是在拥有标准以太网网络和存储设备的标准x86服务器上运行的软件。这常常被称为软件定义存储(SDS)。由于这些是标准x86服务器,与它们相连接的存储设备不再比DAS中所用的那些存储设备昂贵。所以,这个观点不再适用。
3. SAN存储是专有的。就上面描述的软件定义存储而言,基于标准x86服务器而建的SAN存储不再是专有的。
4. SAN管理起来复杂。对未来的网络块存储而言,不再是这样。现在可以使用标准x86服务器作为由高性能以太网连接至计算服务器的存储控制器来建造网络块存储;可以使用虚拟网络,因而不需要LUN分区和掩码;可以使用标准的Linux MPIO驱动程序,对共享存储实现高可用性访问。此外,这类存储很容易提供以应用为中心的存储管理,Tintri及其他厂商证明了这一点。这类存储还可以与支持综合管理计算和存储的融合解决方案中的计算服务器集成起来。
总之,未来的网络块存储将使用RDMA网络的以太网(而不是光纤通道),使用NVMeoF协议(而不是SCSI),使用虚拟网络来消除分区和LUN掩码。
由于SAN这个词在许多人的头脑中常常与光纤通道联系起来,还与分区和LUN掩码等概念联系起来,我不会使用SAN这个词来称呼未来的网络块存储。
六. 下一代融合时代 — — 2016年 — ?
如前所述,超融合或HCI系统在2012年出现,作为第三代融合。
在我看来,会出现利用我们在前一节描述的下一代存储网络的第四代融合。我们将这类系统称为超级融合或SCI系统,它将集成服务器和存储,并使用下一代存储网络来连接。与HCI一样,SCI也将作为单一产品来制造和交付,采用单一管理控制台。同样的RDMA以太网网络将用于把计算服务器彼此连接起来,并将计算服务器与基于x86的存储服务器连接起来。不像在超融合系统中,用户可以选择SCI中的存储服务器,确保针对存储功能经过了优化(在可用的DRAM、网卡的数量和速度、x86核心的数量等方面),SCI的存储服务器可能不同于计算服务器。与超融合系统一样,存储系统也将以应用为中心,单一控制台将提供综合管理计算、网络和存储的功能。
从上述分析来看,很显然,未来的超级融合系统与超融合系统相比不再有缺陷。恰恰相反,使用DAS的超融合系统比使用共享块存储的超级融合系统会存在下列缺陷。
1. 基于DAS的超融合系统以耦合的方式扩展计算和存储。新节点通常以不同的比率添加存储资源和计算资源。超级融合系统可以单独扩展存储资源和计算资源。这样可以更精确地分配资源,以满足应用需求。结果是,超级融合系统可支持更多样化的工作负载。
2. 基于DAS的超融合系统使用闪存缓存和数据本地化来提升性能。对未来的横向扩展型工作负载而言,数据本地化很难维持,这是由于它们的数据访问模式无法预测,又由于一些数据可能从多个节点来共享和访问。此外,工作负载从一个节点迁移到另一个节点时,超融合系统需要把数据从原始节点迁移到新节点,确保性能良好。这对使用高性能NVMeoF的超级融合系统来说没有必要,因为存储性能从任何节点来看都将一样。此外,主机闪存缓存在超级融合系统中毫无必要,因为主机闪存访问和网络闪存访问之间的延迟差异可以忽略不计。开发缓存和数据本地化软件的复杂性,以及任何随之而来的编程错误在超级融合系统中都被消除了。
3. 不像HCI,SCI系统可以选择针对运行存储功能经过了优化的存储服务器,从而优化存储性能。
4. HCI系统以一种低效的方式提供了高可用性存储。所有现有的HCI系统不是使用复制(相比RAID很昂贵),就是使用纠删码(性能通常比同等实施的RAID略为逊色,因为相比RAID采用的简单奇偶校验,采用了计算开销更高、内存更密集的功能)。超级融合系统可以实施高性能RAID,提供高效的高可用性存储。
5. HCI系统通常很难保证应用性能,因为运行客户应用软件所需的计算资源势必会与在同一组节点上运行vSAN软件所需的计算资源相竞争,而且性能高度依赖数据本地化。
由于这些原因,我得出结论:未来的超级融合系统可能会比基于DAS的超融合系统更胜一筹。
七. 小结和结论
SAN存在的问题导致超融合系统问世。由于最近的技术发展,比如NVMeoF、软件定义存储和以应用为中心的存储管理,我认为,在不远的将来出现的共享块存储系统不再面临原来的SAN缺陷。此外,包括这些下一代存储系统的未来集成系统(名为超级融合系统)消除了超融合系统的几个局限性,比如耦合扩展、需要迁移数据以保持数据本地化、存储冗余低效、性能不一致,等等。
我的结论是,未来的最佳基础设施将是基于使用NVMeoF的新兴存储网络的超级融合系统。超融合系统会继续占有一席之地,尤其是作为中小企业客户的入门级系统;对中小企业来说,易用性至关重要,可扩展性不是很要紧的问题,但是我们很可能在炒作周期(hype cycle)上看到超融合系统达到顶峰(暗指此后日渐没落)。