全闪存阵列重回SAN大家庭前景美好?存储与灾备
作为SAN领域的“孤儿”角色,通常运行在现有SAN基础设施之外的全闪存阵列SAN方案在数据服务层面渡过了相当长的一段困难时期。面对这样的状况,我们不禁要问:将其引入现有SAN体系而非游离于主体之外难道不更有利于发挥其卓越性能表现吗?
现有企业级SAN阵列堪称极为强大、可靠且具备极高成熟度的产品方案,与之配套的数据服务软件在经过一系列版本更替之后也拥有了提供丰富数据保护及管理功能的能力,具体包括:
• 备份生产/运营集成
• 快照
• 异步及同步复制
• 克隆
• 利用经过重复数据删除处理的精简配置实现数据还原
• 配置
• 资源使用趋势
• 一般性管理
来自戴尔、EMC、HDS、惠普、IBM以及NetApp等老牌厂商的SAN阵列都属于这一类别,且能够提供一整套数据管理服务集合,使用这些阵列产品的IT部门在日常工作中则对其产生了高度依赖。
但这些阵列通常以磁盘驱动器为基础,这意味着其无法摆脱此类存储介质所固有的延迟水平劣势——所谓延迟,是指此类阵列从接收到IO请求到磁盘读取/写入磁头开始将数据向/由碟片轨道进行移动之间的时间间隔。固态硬盘(即SSD)则不需要负担由寻道时间所造成的延迟与等待,因此能够带来比传统阵列更为出色的速度表现。
不过一般来说SAN阵列当中都配备有一套控制器软件堆栈,并以前往或者来自磁盘的IO操作为控制依据。再次强调,传统磁盘阵列已经属于成熟且强大的产品,在经过长时间的更新换代之后已经拥有极为出色的故障概率水平以及良好的可靠性与执行效率; 而实际效率的高低则由其所控制的存储介质转速、也就是磁盘驱动器转速所决定。
全闪存阵列方案的崛起
当初全闪存阵列刚刚由新晋初创企业的设想转化为实际产品之时,这些年轻的存储方案根本无法使用作为专有控制机制的现有阵列软件。为了解决这一问题,初创企业们只能亲自动手编写自己的替代方案。虽然费时费力,但这也带来了由内而外的重要优势,即他们能够全力发挥NAND闪存的低延迟优势、而非受制于控制器软件层的低下效率而迫使闪存本身作出速度上的妥协。
这些初创企业将这些从零开始设计而成的软件作为专为闪存阵列打造的方案加以推广,这就使得全闪存阵列不仅拥有天然高速的存储介质、其控制器软件堆栈也极具速度优势。有鉴于此,Pure Software、SolidFire或者XtremIO等公司可能会理所当然地强调,他们的技术既拥有速度远高于传统磁盘的闪存介质、又具备超越SAN磁盘阵列的软件配合方案,因此其速度表现比使用磁盘驱动器的SAN阵列要高出两到三个数量级。
然而闪存存储资源的使用成本要远高于磁盘介质。为了解决这一难题,厂商为其引入了重复数据删除与数据压缩机制,从而保证了闪存阵列的实际每GB使用成本能够与基于磁盘的SAN持平甚至比后者更低。
如果存储体系无法提供理想的速度表现,那么服务器就只能处于闲置状态以等待IO提交,这意味着全闪存阵列对于那些高度强调速度水平的应用程序——例如金融交易应用或者在线商务应用——而言极具吸引力。运营者很可能愿意将数U单位的机架由原有短行程磁盘更换为闪存存储阵列。此类阵列足以取代原本由多块磁盘共同承载、从而实现快速访问效果并为应用程序提供必要速度表现的传统存储方案。
将这一领域作为滩头阵地,全闪存阵列开始向企业数据中心发起全面冲击并以主要数据存储介质作为市场营销定位,其已经准备好将所有需要15000转磁盘驱动器支持的SAN阵列数据存储任务牢牢把握在自己手中。
全闪存阵列的隐性成本
但使用闪存存储方案会带来另一种成本,一种几乎难以察觉的隐性成本,即存储在全闪存阵列当中的数据无法通过与原有SAN相同的方式加以管理。这部分数据必须使用自己的管理接口、自己的支持机制以及自己的数据服务。这种在具体操作与管理机制层面的差别往往限制了全闪存阵列与现有SAN阵列之间的对接与功能过渡。
这就意味着企业最好是将需要保护并管理的低重要性数据保存在原有主流SAN当中,而更为重要或者说“热门”的数据则交由速度更快的新型全闪存阵列来打理。举例来说,闪存阵列不适合处理那些需要进行复制或者异步操作的数据。作为数据持有者,如果企业需要在闪存阵列当中实现与传统SAN阵列相对等的数据安全功能,则必须采取其它手段方能如愿。
使用全闪存阵列的实际收益取决于企业现有SAN阵列数据服务能够在新型闪存体系中拥有何种程度的支持效果。不过通常而言,这种支持往往无法实现。有鉴于此,以Pure Storage、SolidFire以及Violin为代表的独立闪存阵列供应商都拥有自己的差异性数据服务方案。EMC公司买下了闪存阵列初创企业XtremIO并将其作为游离于现有VMAX与VNX SAN阵列以及Isilon归档产品之外的独立产品线。
VMAX所配备的特定数据服务并不适用于XtremIO,而VMAX与VNX用户长久以来所喜爱的非破坏性软件升级机制也基本上或者说完全不适用于XtremIO。
NetApp拥有三款全闪存阵列产品:其速度最快的EF系列、其全闪存FAS阵列以及最新推出但仅配备单一控制器的内部开发Flash Ray。NetApp的主要精力仍然放在其FAS Data ONTAP产品线身上,但即使已经拥有ONTAP数据服务组合,NetApp方面也已经意识到有必要另外开发两款其它全闪存阵列产品;由此诞生的EF系列与FlashRay虽然未能继承ONTAP数据服务的优良传统,但二者都能为需要调整闪存介质作为支持的应用程序提供超越ONTAP水平的性能表现与/或性价比。
阵列控制器软件
目前只有两家SAN阵列供应商在其数据服务堆栈当中提供新的全闪存阵列性能水准,它们分别是HDS与惠普。为什么这二位能够完成戴尔、EMC、IBM、NetApp以及其它各厂商无法实现的目标?
HDS自行设计硬件方案,即其日立加速闪存(简称HAF)托架,其能够接入到现有高端VSP阵列以及中端HUS阵列当中。
HDS专为其VSP阵列打造的日立加速闪存模块
根据该公司的说法,HDS所打造的2U托架能够容纳最高38.4TB闪存容量,而其硬件外壳设计方案能够一举将闪存设备的IOPS性能提高到现有企业级固态硬盘(即SSD)的5倍。虽然无需在速度方面做出任何妥协,但这些日立加速闪存需要在全套VSP及HUS数据服务的依托之下实现运行。举例来说,外部主机阵列的起效方式类似于外部虚拟化资源,与原有方案保持一致。
有趣的是,这款产品还配备ASIC以提供额外的速度优势,而这又为我们引出了惠普及其3PAR产品线。
HDS加速闪存ASIC示意图
惠普为其StoreServ(即3PAR)7450产品打造出一套全闪存版本,基本上讲其ASIC硬件加速与细度增强功能负责实现自适应缓存优化等功能,也就是说其StoreServ软件能够保证它与其它任何全闪存阵列初创企业的方案拥有对等的全闪存配置与执行效率、同时又不会迫使客户放弃其熟悉并喜爱的StoreServ数据服务。
自从2013年正式公布以来,这套方案已经经历过一系列更新——举例来说,其于2013年年末进行的软件升级将4K随机读取IOPS速率由原本的55万提升到90万。重复数据删除机制公布于2014年6月,精简克隆功能也在此期间一同亮相。惠普公司表示,目前该产品的实际每GB使用成本在2美元左右。
惠普与HDS都希望能够拿出与其它无法顺利融入传统主流SAN数据服务体系的全闪存阵列基本对等甚至更为出色的性能表现与存储效率水平,只有这样才足以推动客户放弃其它全闪存阵列初创企业或者来自其它供应商的孤立性全闪存阵列产品、继续选择由二者精心构建的现有SAN阵列软件环境。
下面做出进一步思考。随着面向特定应用程序的专有资源库规模的不断扩大——例如Hadoop类大数据与分析存储场景——存储资源自身也必然随之持续拓展,在这种情况下尽可能缩减孤立体系的数量显然能够大大降低管理员的日常工作负担。
在可能的情况下将孤立闪存阵列纳入主流SAN阵营当中不仅能够显著降低行政层面的成本负担,同时也可以保证我们在SAN与全闪存阵列两类存储环境中使用相同的管理、保护以及支持机制。大家有什么理由拒绝这样的美好前景呢?