当前位置:首页 > 设备硬件 > 正文

认识磁带机的备份容量与数据压缩

2010-10-08 论坛

  一 什么是磁带机的备份容量:

  谈到容量,一般要引用两个数字:本机容量和压缩容量。本机容量是磁带的"真实"容量,或者说是磁带不进行任何压缩能够保存的数据量。本机容量是最终用户不使用任何压缩时预期应当获得的容量,也是使用数据压缩时应当预期的最小容量。压缩容量是在假定压缩比为2:1(相同的空间存储两倍量的信息)的情况下,本机容量乘以2。需要记住的是,绝对没有保证压缩比就是2:1,由于每台计算机上的数据都不相同,它可能达到3:1也可以是1.1:1。2:1的标准是根据"平均"数据四舍五入到最接近的整数。

  二 数据如何压缩:

  数据压缩就是观察大量的数据,了解其中有多少重复,对所有重复的部分通过速记方法减少总体的数据量。人类始终都是这么做的,甚至无需考虑。

 

  例如,上图中您不会说:"点1是橙色,点2是橙色,点3是橙色,点4是橙色,点5是橙色,点6是蓝色,"而是说:"点1-5是橙色,点6是蓝色。"第二个句子大约是第一个句子的三分之一大小,如果按照这样的比例,您可以在同样的空间中存储3倍的数据;因此,压缩比就是3:1。这个数据的可压缩性非常高。

  现在,假设您遇到这种情况:点1是红色,点2是橙色,点3是红色,点4是蓝色,点5是黑色,点6是黄色。在这种情况下要缩短句子,我们只能说:"点1和3是红色,点2是橙色,点4是蓝色,点5是黑色,点6是黄色。"在这个例子中,数据就没有非常多的重复,因此我们就无法大幅度缩短句子,甚至达不到2:1的压缩比率。同样的事情出现在DLT驱动器压缩数据时,部分数据可压缩性很大,部分数据根本不能压缩。

  三 备份时,对于已压缩的数据,应避免启用硬件/软件压缩:

  数据被压缩之后,任何试图进一步对其进行压缩的尝试都是徒劳无用的。除非数据是使用很差的压缩算法压缩的。由于当今的大部分压缩算法都具有相同的效率,因此重新压缩已压缩的数据不是一个好主意。说重新压缩数据不好有两个原因:(1) 重新压缩浪费时间和处理器能力,(2) 事实上有可能使最终结果变得更大而不是减小。压缩需要少量的开销,这意味着,如果重新压缩操作根本不能压缩数据,最终结果的大小就是不可压缩数据的大小加上压缩开销的大小。这样做得到数据量大小实际上就大于未压缩的数据量大小。

  备份已压缩的数据时的指导原则:

  · 不要同时打开硬件和软件压缩。

  · 如果备份的主要是ZIP或其它压缩文件,则不要打开硬件或软件压缩。

  · 除非您确定压缩卷已关闭,否则如果备份Novell 4.x或以上版本上的数据,不要打开硬件或软件压缩。注:NOVELL

  4.x及以上版本在安装过程中默认使用压缩卷。

大家都爱看
查看更多热点新闻