LTFS能使磁带起死回生吗?存储与灾备

2013-12-09    来源:TechTarget中国    编辑:佚名
线性磁带文件系统(LTFS)使得磁带看上去像一个文件系统,其所支持的拖放操作和NAS共享系统十分类似。LTFS技术目前已经在归档应用中产生了积极的影响,并且我们将会很快看到其应用在

  线性磁带文件系统(LTFS)使得磁带看上去像一个文件系统,其所支持的拖放操作和NAS共享系统十分类似。LTFS技术目前已经在归档应用中产生了积极的影响,并且我们将会很快看到其应用在更多更广泛的领域中。

  LTFS伴随着线性磁带开放协议(LTO)驱动第五代发布,迄今面市已有三年之久。作为文件系统,LTFS业已成熟,并且现已支持诸如Windows、Linux和Macintosh等核心操作系统。而目前,兼容LTFS的LTO-6将会把磁带重新打造成主数据中心的存储设备,并可能将磁带的应用延伸至其原来的备份和归档以外。

  什么是LTFS?

  LTFS旨在简化终端用户和磁带设备间的交互方式。LTFS的设计者希望将磁带变得像USB闪存那样易于使用:插入就可以写入数据。不过考虑到磁带的容量,数据会以TB为单位计算而非USB闪存GB的数量级。在很大程度上,LTFS达到了这一目标。终端用户在LTO-5或LTO-6磁带驱动器中简单地插入一块LTFS格式的磁带,一分钟后LTFS的可用容量就会显示在用户的桌面上。从而其可以像外部的磁盘驱动器或闪存那样提供浏览,只是速率会略慢一些。

  LTFS依托于前一代LTO的两项变化。首先是在磁带上创建分区,LTFS使用其中一个来存储写入磁带的各种文件的目录信息。其次是在上述主流操作系统上一系列的驱动器。

  当安装驱动器并将磁带插入磁带驱动器时,驱动器读取日志分区并展示一个类似用户浏览磁盘或USB驱动器的文件夹结构。文件可以在磁带空间中像磁盘驱动器一样进行拖拽,并且驱动器会更新目录并将数据存储在磁带上。

  外部存储为什么如此重要?

  在当今的数据中心里,备份和复制全天近乎实时在运行。这也使得数据几乎零丢失以及应用可用性变得相对容易。但虽有强大的数据中心管理,创建近乎实时副本的能力仍具有一定风险。因此对于外部存储仍有特定需求,而磁带,尤其是LTFS的磁带正在这一领域和其它外部存储技术激烈地竞争着。

  首先,由于不断重复的存储备份和复制,数据的错误修改或损坏可能会立即传播到整个基础架构中,这使得“最后一次正确的副本”几乎无处可寻。甚至有可能在意外删除后,数据从整个系统环境中就彻底清除了。同样,病毒的感染也可能会复制到拷贝数据集,这些都引发了对无关离线数据拷贝的需求,可以对上述情况完全免疫。

  第二种应用场景是由于数据增长速度已超过可用的广域网(WAN)带宽。虽然带宽已经得以提升,并且目前能够依赖增量复制确保二级站点和主站点之间秒级的同步,但有时仍需将完整的数据集传输至另一站点。例如在云存储设备上部署基准数据,在协同企业内共享大型项目,或在电子发现过程中传输法律文件。在这类情况下联邦快递的卡车一整晚所传递的带宽量远胜于目前最快的城域网互联。在这种潮流下,也就需要一种可以方便传输的存储设备。

  最后还要在财务现实性角度考虑在数年中存储如此多的副本数据。除了磁盘容量本身的物理成本,数据中心的占地空间成本、电力及制冷同样代价高昂。随着走向大数据的实时分析,更需要确保更多的在线数据。不过同样还有其它的数据集合是用于已知的恢复节点或是同一文件的副本,无需保持在线。当理解这种场景后,将非分析数据尽可能多地迁移到外部、离线和密集型设备上的策略就显得很有意义。例如,数据库备份在进行了两三次甚至更多次的备份后,鲜有在线保存的意义,不必要将大量的副本放置在磁盘或可用于立刻恢复的介质上。

  LTFS优势

  LTFS格式的磁带相较于其它外部存储设备有着诸多优势。首先,磁带设计之初就定位于离线设备,并且可以放置于托架上。而外部存储则无法断电并在托架上保存数年之久。在安装合适的LTFS驱动器后,磁带可以插入到任意的LTO-5或LTO-6驱动器中读取。而不需要特定的应用程序,这也消除了磁带长期以来一块巨大的短板,即需要在读取相应格式应用程序的所有位置上运行特定的软件。

  一块LTFS格式的LTO-6磁带可以存储2.5TB的非压缩数据,而压缩数据可存储6TB。这意味着许多数据中心可以将其所有的数据都存放到联邦快递的一个小包裹中。同时,磁带能承受颠簸,较其它移动存储更适合运输。同样,LTFS使得发送和接受方的数据中心不再需要运行同样的应用程序来访问磁带上的数据。

  虽然重复数据删除技术可以通过消除磁盘上的冗余拷贝,使得存储更为高效,但这种技术很少会部署在主存储上。通常一份单独的文件会保存在主存储、二级存储和备份存储上,每一份都必须运行其单独的重复删除程序。磁带可以确保一份清洁的、不用存储在任何形式磁盘而只需要保存的数据。磁带的成本和容量都使得这些“以防万一”的副本存储不会代价高昂。

  使用LTFS的归档

  之前所引用的LTFS应用案例都不需要任何额外的软件,只要使用免费的LTFS驱动程序。归档应用程序供应商已经快速采用了LTFS相关的协议以使其产品更具吸引力。其中的大部分整合所选择的磁盘系统中,和磁带库一同工作,自动化地迁移在磁盘和磁带中的数据。

  从用户界面角度看,归档就像用户网络上额外的一个NFS或CIFS挂载点。数据会基于策略自动拷贝到某盘或数盘磁带上,并同时在磁盘上保存用于更快地存取。随着磁盘内的数据饱和,数据会再次基于策略从磁盘上移除,并只保留在磁带上。

  将磁盘和磁带整合为单一挂载点的技术由来已久。虽然磁盘和磁带匹配的归档产品只是在一些细分市场中获得成功,但更广泛的应用很大程度上受阻于归档产品本身将数据写入磁带的方式。这意味着应用程序需要运行数十年之久,虽然很少有产品会有这么长的生命周期。

  LTFS则完全消除了这种担忧。如果归档应用程序将数据输出为LTFS格式,其可以在应用程序中自由迁移,或发送到某个没有应用程序的站点。这项功能允许用户基于环境改变选择不同的应用程序。其同时迫使归档应用程序供应商从开发角度上保持竞争力,而且允许不同企业之间不用安装相同的应用程序就可以迁移项目数据。

  LTFS的未来

  LTFS备份。LTFS下一步是让备份应用程序供应商来制定标准。这将使得数据可移植性在备份应用中和其在归档应用中同样得以保证。数据中心在决定更换备份应用时,其都要考虑使用旧的应用程序运行单个副本的成本,即便是备份到磁盘,因为绝大多数备份供应商都会使用专用的格式再写入磁盘和磁带。而LTFS允许用户能够简单地在磁带上保存历史备份,并在需要时直接导入到新的应用程序中。

  整合LTFS的NAS。存储管理员面临的一项最大挑战就是要跟上不断增长的非结构化数据的节奏。很多这种数据并不需要高性能的硬件。一种理想的解决方案是集成磁带的NAS,从本质上讲这其实可看作上述归档案例中的主存储版本,不过有更快的速度和更大的磁盘缓存。这样数据可以被自动地保护并最终从主存储迁出。你可以想象下一款高速而高性价比的固态驱动器作为主存储层,而之前的数据会迁出保存在LTFS磁带,而无需IT人员的手动干预。

  直接执行。LTFS的最终演进是在磁带设备上直接执行数据操作,甚至直接修改。这意味着数据在恢复之前无需重新存储回磁盘区域。举例来说,对一项视频文件的流化处理,而不用先移动到磁盘上面。在理想情况下,需要从归档中查找信息而不用恢复。数据库应用直接访问LTFS就可以实现这点,将其数据库扩展到磁带,并支持直接在磁带上检索旧的记录或文档。另一项实例是应用Microsoft sharePoint的Remote BLOB存储特性来迁移旧的文档或文档副本到基于磁带的存储区域。

  LTFS的真相

  LTFS或许会改变数据中心使用磁带的方式以及对磁带的定义。在过去,LTO和其它磁带格式代表着笨拙、缓慢和难以处理。而现在通过LTFS,能够很简易地和磁带进行互操作,就像其它存储设备那样。其直接应用于数据传输量大而带宽缓慢的场景。同时也能广泛使用在备份和归档流程,以及可能用于数据库和文件系统访问数据。

1
3