重复数据删除不该忽视弱点

2008-8-18  选择字号:  | |
打印本文章

  重复数据删除是目前存储行业最热门的技术之一,不过“一俊遮百丑”,重复数据删除虽然好处很多,弱点也存在不少,只是被大家暂时忽略罢了。虽然话有点重,但就像奥运会夺取金牌的运动员,人们只关注了他成功的一面,而没有看到此前运动员在技术细节上作出的一次次改进。重复数据删除技术也一样,不指出问题,反而不利于进步,甚至会成为昙花一现。

  重复数据删除技术的弱点,最近被一位国外专业存储网站的资深撰稿人Henry Newman指了出来。这位在高性能计算和存储行业从事了27年的顾问毫不客气的说道:“跟以前一样,我不打算对比不同厂商的产品或者技术,我只想谈谈企业在考虑购买重复数据删除软件或硬件时,必须向厂商咨询一个重要问题,就是‘数据损坏’的问题。有人可能会想,重复数据删除与数据损坏有什么关系呢?为了对这一译文做出解答,我将从通用硬件和软件的角度来分析。”Henry Newman这里提到的“数据损坏”,正是在重复数据删除技术热潮过后,最近被很对业内人士关注的焦点。

  如果对备份的数据进行一下对比就会发现,正确的数据和损坏后的数据的ASCII码可能会发生很大变化,大部分字节都损坏了。这就是为什么现在要讨论“数据损坏”,辛苦保存的数据,有可能再不能被读取,即便备份技术再先进,但是在“数据损坏”面前将一无是处。

  Henry Newman在博文里谈道,“数据不定期损坏并非一定会发生,即使是发生数据损坏事故的概率远低于廉价SATA的高端企业光纤信道驱动器也不能例外。 另外,发生问题的部件不一定是驱动器或者控制器,也可能是内存、CPU或者别的什么部件。归结为一点就是,数字世界中的数字资料肯定有可能会损坏。 虽然发生数据损坏事故的情况跟使用的操作系统、硬件和软件都有关系,即使是运行在基于MVS多重虚拟存储系统的IBM大型机上也可能发生数据损坏事故,只是概率要比系统低很多。”

  数据损坏到底跟重复数据删除有什么关系?其实很好理解,如果你打算删除重复的数据,你就必须保证你拥有的那些数据是完好的。比如,如果数据从一开始就出错,在磁盘上就已经受损了怎么办?重复数据是在内存中创建的,是好的,但是磁盘上的数据却是坏的。 也就是说,用一个好的重复数据建立了数据,但是一旦从磁盘读取数据,数据就变成坏的了。那么在进行数据对比时会怎么样? 如果再次读取,可能就能够得到正确的数据。但是如果数据被写入磁盘时的日期出错,你是否还能读取那些文件呢?这个问题其实非常可怕。

原文出处:http://www.cnw.com.cn/cnw07/ServerStorage/Backup/htm2008/20080814_57702.shtml
来源:网界网    作者:王琨玥    
重复数据删除产品越来越受用户关注的同时,其功能作用也被一些厂商过分的放大,成为厂商推销其产品的卖点和噱头。所以,用户在选择重复数据删除产品时还需要谨慎……
提高存储高效性并不适用于主存储。没有人会把这么重要的事情搞砸,在二级存储上有很大的备份文件。通过压缩和重复数据删除技术来减少主存储……
据TechValidate的最新研究发现,最终用户所关注的对象逐渐由性能和数据压缩率转向数据完整性、可恢复性和易用性等问题……
目前,重复数据删除技术十分流行,而我们见证其成长的Lempel-Ziv (LZ)压缩技术虽然略显陈旧,却依然性能良好。
随着市场的推广,国内用户对重复数据删除技术的接受程度也得到快速提升。那么重复数据删除在实施过程中要注意哪些问题呢?
几年前持续数据保护(CDP)出现时,人们都认为这种产品能够取代传统的备份软件。当时CDP供应商预测IT管理人员都会放弃原来的备份软件,因为它们需要每周一次完全备份、每天一次增量备份……
公司要采购各种各样的设备,在采购的过程中会有很多的技巧。了解这些技巧对我们来说是非常重要的,必要时可以起到事半功倍的效果。
交换机在应用中会出现很多问题,为了在网络中能够满足更多的存储平台或主机服务器,交换机需要定期扩展或替换。交换机通过升级可以达到更好的性能,增强网络的有效性,限制网络流量并提供智能化功能,比如对网络的虚拟化。
最新更新
专家答疑
技巧
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……
Greg Schulz
我们有两个负载均衡网络服务器,都是可用的,正在尽力访问SAN上的相同的LUN。我们在操作系统和EMC SAN上用Windows2003标准版本。我们如何实现并行写入SAN……