内部存储云里有什么?
2010-09-20 网界网
摘要:关于内部存储云的定义,业界存在太多的版本。众多厂商都在推销某种云存储或服务,下文将揭密什么构成了内部存储云。
尽管公共云存储厂商Nirvanix公司咨询主管Stephen Foskett对外宣传:“当今不存在像内部存储云这样的东西。”但这并没有妨碍美国总务署(GSA)在今年8月初向乍看起来像是内部存储云的技术发出报价请求(RFQ)。
但是,美国总务署认为是私有或内部存储云的东西可能与多数企业认为是内部云的东西存在很大的不同。正如美国总务署在RFQ中所说:“届时,美国总务署将拥有一个云计算‘网店’来提供这些IaaS(基础架构即服务),政府机构的采购者通过网络以信用卡或其他支付方式来购买这些服务,该云计算‘网店’将由美国总务署负责管理维护。”
鉴于目前没有被广泛认可的内部存储云的定义,美国总务署的RFQ似乎描述了一些完全不同的东西。看上去,美国总务署不是在询问公共或私有的存储云,而是在询问他们称之为私有云计算‘网店’的东西:一个面向美国总务署内部政府机构的提供云存储服务的门户或网关。对此,甚至准备答复RFQ的Nirvanix公司的Foskett似乎都感到了困惑。
美国总务署的另一个看法是对的,即不管你如何定义内部存储云,它们都应能保证减少存储成本和简化存储过程。美国总务署如此描述云计算:“通过利用基于服务器、数据库和应用的虚拟化商业技术来实现资本费用的节省,云计算具有减少IT基础设施成本的能力……”美国总务署的项目包括云存储和计算云。
内部存储云的问题不在于它们不存在,而是内部存储云的定义存在太多的版本。美国明尼苏达州Stillwater市StorageIO公司创始人兼高级分析师Greg Schulz说:“云指的是一个抽象层。几乎任何存储产品都可以被配置为私有存储云的一部分——这取决于存储云的定义,而厂商会把存储云定义为利于其销售的任何产品。”
虽然没有被广泛认可的私有存储云的定义,但业界分析师一直在试图确认内部存储云所需要的元素,以及向公众解释这些元素如何能够拼接起来。新汉普什尔州Nashua市Illuminata公司主要IT顾问John Webster认为,虽然云看起来比较神秘,但“任何人都可以部署云,内部云存储并非脑外科手术” 。
尽管内部存储云目前还很稀少,但它们具有的吸引力却是显而易见的。Ocarina Networks公司产品副总裁Carter George说:“吸引力在于性价比。内部存储云关注减少成本。”相比之下,由复杂的存储阵列、存储区域网(SAN)、高性能硬盘和精心配置的备份与恢复构成的常规存储则关注性能和数据保护。
不过,在俄勒冈州Bend市独立存储咨询师Abbott Schindler看来,低成本不一定是主要关注目标。Schindler说,由于“多人在采纳云存储时想到的是档案存储或数据保护,因此他们把它设计成廉价和低速的东西。但是,云存储概念中没有与生俱来的东西说它不能适宜交易数据。”
定义内部存储云
你可能会说内部存储云同公共存储云没什么区别——除了内部存储云的组件处在防火墙后面――它们都是通过网络提供存储服务器。但是,这种看法也不完全准确。例如,公共存储云提供者可以预留一部分存储专供某位用客户使用,从而使它成为私有存储云,尽管它对于这位客户来说并不是内部的。
业界分析师和咨询师更愿意描述内部存储云的属性而不是明确地给它下定义。
例如,内部存储云的关注点显然放在低成本和易伸缩性上。CommVault公司产品开发副总裁Anand Prahlad说:“云存储具有重要的财务因素。人们不仅期望它低成本,而且希望只为你使用的东西付钱。”简单地说,人们期望内部存储云提供廉价的存储。
然而,它不仅是廉价存储,也是速度缓慢的存储。不过,Schindler等咨询师并不认为内部存储云就不可能具备把更好的性能或服务水平。
可管理性是另一个属性。存储公司i365首席技术官David Allen说:“人们希望通过内部存储云消除存储的复杂性。”因此,内部存储云应当更容易管理,一名管理员就可以轻松管理数百个节点和数PT字节的存储。
此外,存储云如何被访问也是一个关键因素。HTTP将成为主要访问协议。北达科他州Fargo市SentryBlue公司CTO Ken Satkunam认为:“你所需要的一切只是HTTP或HTTPS协议,以及一个Web浏览器。”
Nirvanix'的Foskett说:“内部存储云的一个很大的不同点是它可以通过API而不是协议来访问。它就像网站一样将有一个可编程的API,也许使用REST over HTTP。”与光纤通道相反,表述状态转移(REST)是一种包括每个通信存储状态的无状态协议。REST利用HTTP提供对Web服务的访问,对于存储云来说,REST用于访问作为服务的存储资源。
被甲骨文收购的Sun公司曾在一份白皮书中强调了存储云的这种可编程性。“开发人员规定虚拟组件如何配置和互联,虚拟机镜像和应用数据如何存储以及如何从存储云取回,而不是去实际部署服务器、存储和网络资源来支持应用。”
但StorageIO Group公司的Schulz指出,业界并没有在云API上实现标准化,每一个云提供者都提供自己的API。不过7月底,Rackspace Hosting根据“Creative Commons 3.0 Attribution”许可证开放其公共云服务器和云文件的API规范。这可能最终为未来的内部存储云开发者提供一个的开放API。
要定义存储云,还有一个重要的特性——多用户。CommVault的Prahlad说:“多用户是存储云乃至内部存储云的重要的部分。”在使用内部存储云时,多用户将根据需要划分部门、项目和工作组。
那么,什么是内部存储云呢?多数人的定义似乎是为公司所拥有或至少控制的私有存储容量,或以通过HTTP连接可编程访问,可以提供低成本、高可伸缩的存储并且具有易于管理的多用户性。ParaScale公司补充说,内部存储云可以很小(少到两三个节点),但是仍具有云存储的经济性,以及与云相关的易管理性和易扩展性。
内部存储云的选择
如果内部存储云看起来类似,是因为它们的确类似。咨询师Schindler说:“存储网格演变成了私有存储云。”在存储网格之前,公用计算(utility computing)将计算与存储资源打包构成一个计费的服务。两个概念是类似的,虽然技术和架构不同。Schindler补充说,“它们都为了实现存储的最高目标,即在您需要数据的时候,在任何位置,以你希望的成本,访问你需要的数据,并且无需考虑实际的存储设备是什么或处在网络什么位置。”
内部存储云也与网络连接存储(NAS)集群类似,但有一些需要注意的地方。CommVault的Prahlad说:“我不知道集群NAS是否能扩展到真正的存储云的规模。”虽然内部存储云可以从很小的规模开始,但公司会希望通过添加更多的设备来扩展它。
在谈到内部存储云产品时,当前的选择可能很窄,也可能很宽,这取决于你如何定义内部存储云。在实际产品方面,EMC公司提供Atmos。该公司将Atmos描述为一种信息存储与分发产品。利用Atmos,EMC通过其全球网络根据你需要的服务水平来存储和复制数据。它利用业务策略驱动的自动化和元数据在这个庞大的云中管理公司的数据,并承诺高运行效率、更低的管理复杂性和费用节省。
尽管AT&T是EMC在作为私有存储云的Atmos的典型客户。但AT&T并没有作为私有云使用Atmos。相反,它通过Atmos向它自己的客户提供包括存储的服务,因此它更像是一家公共云转销商。
与普遍的想法相反,Atmos的后面没有巨大的EMC存储阵列。Nirvanix的Foskett说:“巨大的EMC存储阵列将过于昂贵。”相反,Atmos的可伸缩容量是作为JBOD提供的。在使用Atmos时,你通过API和NAS接口得到相当于在你的数据中心中的一台存储设备。或者你可以将一部分公共Atmos存储云用作私有云。
ParaScale提供专用于建立和管理内部存储云的软件。与云服务提供商不同,它只销售使公司可以建设自己的存储云的工具。该公司的软件运行在基于x86架构的标准Linux服务器上,将多台服务器上的直接连接硬盘汇集到一个具有单一名称空间的PT字节规模文件存储中。
除Atmos和ParaScale外,商用内部存储云产品还很少。Foskett说:“除这两个产品外,任何自称内部存储云的产品实际上都不是云。实际上,他们可能提供具有某种水平的虚拟化的存储产品,但给它们贴上‘云’的标签。”同样,几乎所有NAS集群都可以被打扮得像是内部存储云。
建设内部存储云
咨询师Schindler说:“在内部云上,DIY是件大事。”自己动手很流行,因为,正如Illuminata的Webster指出的那样,建设私有存储云并不那么困难(参阅链接:“内部存储云的基本组件”)。
有许多设计和建设内部存储云的途径。i365的Allen说,最简单的途径可能是“从NAS群集开始,最好是个全局文件系统,并建立云Web前端。”
内部存储云背后的实际存储多种多样。私有云中可能没有存储阵列。Nirvanix的Foskett说:“多数人将使用商用服务器,并在硬盘插槽中安上低成本硬盘。”
CommVault的Prahlad说,建设可伸缩的内部存储云的关键“是从很多的小机器开始,然后通过添加更多的机器来扩展”。人们可通过将数据复制到许多节点的冗余性获得数据保护。为取得服务质量,不同的节点可以具有不同的服务性能属性。
Prahlad指出,将所有这些结合在一起的“胶水”是“提供单一名称空间的全局文件系统”。这可能还需要虚拟化和元数据层。
管理内部存储云应当很简单。Ocarina Networks的George解释说:“为确定你的模型,你必须研究像Amazon和Facebook这样的网站。你需要HTTP上的文件存储。”为取得简单性,你的文件管理选项限制在创建、读取、更新、删除和移动/拷贝上。
内部存储云并不取代企业的1级存储。生产数据依然运行在数据得到备份和保护的高性能光纤通道SAN或主iSCSI SAN上。相反,内部云将用于占用主硬盘空间和造成备份与恢复战略复杂化的数据,用于保存电子邮件、存档、媒体和遵从性数据的基本文件。这类数据仍处于活跃状态,被广泛使用和修改,必须得以保存和共享,但不需要为其支出与1级生产存储相同的费用、性能和服务水平。
来自纽约TheInfoPro的最新《Wave》研究(2009年1月到2009年5月)调查了人们对云的兴趣。TheInfoPro存储研究经理Robert Stevenson在报告里说:“兴趣水平比较低,可能在12%到15%。多数回答者没有使用云的计划。”大公司目前显然对内部存储云或云计算有着更急切的要求。
不过,当他们将带有连接硬盘的虚拟化服务器放到网上时,他们可能已经在模仿内部存储云但只是没有意识到这点。这是迈向实际的内部存储云的一小步。
云存储的分类
公共存储云:
公共存储云服务提供商对公众提供大容量文件存储,Amazon的简单存储服务(S3)和Nirvanix的存储提交网都是公共存储云。云存储服务提供商可应保持每位用户的存储和应用的隔离和专有。公共存储云的一些部分可以被划分出来创建相当于私有存储云的产品。
私有存储云:
私有存储云可以部署在企业数据中心或场地共用设施中,由企业用户所拥有或控制着,并自行将应用部署在云基础设施上。私有存储云可以由公司自己的IT部门来建设管理,或由服务提供商来建设管理。
内部存储云:
这种存储云类似于私有存储云,除了它处在企业用户的防火墙内。企业可以在咨询机构或集成商的帮助下建设,但可以由企业自己的IT部门来管理维护。
混合存储云:
混合存储云集公共与私有/内部云的属性于一体。它主要用于临时按需访问外部提供的存储容量。利用来自公共云的存储容量扩展私有或内部云的能力,可以帮助公司在面临快速的工作负载波动或计划的工作负载激增时保持服务水平。但是,跨公共和私有云分布的应用给混合云的管理带来了复杂性。
DIY内部存储云的基本组件清单
全局或集群文件(NAS)系统(包括虚拟化和管理能力)
商用服务器和低成本存储(SAS DAS、JBOD、PCIe RAID)
高性价比网络带宽服务
基于应用需要的云个性化接口(NFS、SMTP/POP、HTTP、DICOM、REST、SOAP、 XML)
对象或元数据管理层,包括适用的数据保护和安全工具。