CAS和重复数据删除:归档双雄

2008-3-14  选择字号:  | |
打印本文章
【TechTarget中国原创】本文将深入探讨CAS和重复数据删除,讨论它们的用途并总结这两种技术的优缺点。

  在存储领域,归档已经引起了人们越来越广泛的关注。法规遵循的的要求也推动用户去部署一些归档产品,同时为了处理日益增加的数据量以便为公司节省开支,也引发了业界寻找新办法来解决这一难题的广泛兴趣。数据缩减看起来是一个解决办法,而固定内容寻址存储(content-addressed storage,简称CAS)和重复数据删除(data deduplication)已经运用于处理日益庞大的数据增长。虽然它们有时会被混淆,但CAS和重复数据删除是两种不同的技术。虽然它们都应用在数据归档中,但是,CAS可能包括,也可能不包括通常理解为旨在减少存储数据量的重复数据删除。

【TechTarget中国原创】本文将深入探讨CAS和重复数据删除,讨论它们的用途并总结这两种技术的优缺点。

  在存储领域,归档已经引起了人们越来越广泛的关注。法规遵循的的要求也推动用户去部署一些归档产品,同时为了处理日益增加的数据量以便为公司节省开支,也引发了业界寻找新办法来解决这一难题的广泛兴趣。数据缩减看起来是一个解决办法,而固定内容寻址存储(content-addressed storage,简称CAS)和重复数据删除(data deduplication)已经运用于处理日益庞大的数据增长。虽然它们有时会被混淆,但CAS和重复数据删除是两种不同的技术。虽然它们都应用在数据归档中,但是,CAS可能包括,也可能不包括通常理解为旨在减少存储数据量的重复数据删除。

  CAS已经是一类独特的产品,但重复数据删除还根本算不上一种产品。它经常作为很多非CAS产品的一大特点而出现。许多文件管理的应用软件,尤其是对电子邮件的管理就使用了重复数据删除技术,例如:Mimosa System公司的针对Microsoft Exchange的NearPoint归档软件。另外很多非CAS的软硬件产品也采用了该技术,例如某些虚拟磁带库(VTLs),比方说FalconStor,以及一些远程备份软体公司,如Asigra公司等。

  重复数据删除通过在块等级上寻找重复块以检验要保存的数据。一旦它找到了重复块就会用一个指向原始备份块的指针将其代替。至于能节省多大的存储空间,这取决于被存储的数据性质来决定。在某些情况下,例如电子邮件,它的压缩比可以达到20:1,甚至更高。

  对重复删除的主要质疑来自于对其费用的忧虑。很显然,通过与已存储的每一个数据块进行比较的方式来检验每一块要存储的数据,是既花费时间又耗费能源的一件事。厂商为了提高重复数据删除的处理速度花费了大量的时间和精力。在大多数基本的情况下,它们一般采用散列准则来确定每一个唯一的数据块,但很多厂商也使用更精确的算法。因此,使用数据重复删除的备份和归档系统的数据吞吐量一直在节节攀升。Diligent Technologies公司日前宣称,使用其最新版本的基于磁盘备份ProtecTier产品的一个客户,达到了400MBps的吞吐量。

  CAS是一个比重复数据删除更宽泛的概念。按目前的使用情况,它是指通过基于内容本身的独一无二的标识符来寻址的系统,而不是基于存储的位置。

  当一个诸如文档的目标存储于CAS系统中,它的内容将被扫描辨别,并产生诸如散列值的一些标识符。这些标识符将用于取回我们所需要的目标文档。对于两个完全相同的目标,比方说同一份文档的重复备份,将会产生同样的标识符,只有一个拷贝会被存储起来。这就是这两个名词最主要令人混淆的地方。在节省存储空间方面,单一实例不如块级的重复数据删除有效。当很多人谈论数据重复删除时,他们所指的是块级重复数据删除。

  CAS最具吸引力的环节之一是因为每一个目标的标识符都是基于其内容的,它很容易确认取检索的目标自保存后没有被更改。这使得CAS在与法规遵从相关的存储具有吸引力。

  当然,这也意味着在CAS系统中,目标的任何改变都会导致一个全新的目标被独立存储起来。这就是为什么CAS适于那些一旦被保存就不会改变的数据资料。另外一个原因就是开销。将一个目标存储在CAS系统中比存储在传统的文件系统中需要更多的时间和更多的机算能源。检索受到的影响则小得多。

  即便与重复数据删除相比,CAS仍是目前很热门的一项备份及归档技术。CAS系统的厂商至少一打以上,包括像EMC和惠普这样的大公司,也有诸如PermaBit这样的小公司,它提供Dynamic Information Services产品。

  此外,在实现途径、架构、容量、吞吐量和价格方面,CAS系统千差万别,甚至多于重复数据删除。那些正在考虑购买CAS系统的存储管理员们必须认真考虑他们的需要,并认真研究备选产品,以便为他们的企业找到最匹配的方案。


重复数据删除
 重复数据删除技术在数据保护过程中有何作用
 重复数据删除的八大评估标准
 结合重复数据删除的虚拟化容灾方案
 选择正确的重复数据删除解决方案
 利用重复数据删除技术进行灾难恢复时需要考虑的四大策略
 有关重复数据删除技术的五大误区
 重复数据删除和VMware DR结合节约成本
 如何评估基于硬件的重复数据删除产品
 重复数据删除技术如何缓解存储需求
 重复数据删除in-band VS out-of-band
 CAS和重复数据删除:归档双雄
 如何通过重复数据删除降低存储成本
 重复数据删除是如何工作的?
 压缩、重复数据删除和加密的区别
 确保重复数据删除系统的高可用性
 如何评估基于软件的重复数据删除产品
 重复数据删除技术的安全性如何?
 重复数据删除技术对备份的作用
 重复数据删除技术的实现方式分析
 技术对比:重复数据删除技术、数据压缩技术和单一实例存储技术
 专访Hifn:重复数据删除是存储发展的必然选择
 重复数据删除:能否由次级存储转移到主存储?
 重复数据删除将走进主存储系统
 专访飞康:重复数据删除更应考虑数据安全问题
 压缩技术对重复数据删除技术造成压力

还没有登录? 阅读全文请先登录或注册
用户名:(请填写您的E-mail做为登录账号)
  • 获取最新的IT业界资讯、市场动态、行业趋势等独家原创内容。
  • 分享国内外技术专业人士提供的技巧经验。
  • 利用专注IT的技术资源中心,不断更新专业知识。
  • 享受白皮书、Webcast等系列特色增值服务。
  • 免费参加TT中国举办的各种会员活动。
  • 更多的精彩服务,在不断开发中……
用户名:(请填写您的E-mail)
密 码:
 永久登录
请输入您的登录email:
提高存储高效性并不适用于主存储。没有人会把这么重要的事情搞砸,在二级存储上有很大的备份文件。通过压缩和重复数据删除技术来减少主存储……
据TechValidate的最新研究发现,最终用户所关注的对象逐渐由性能和数据压缩率转向数据完整性、可恢复性和易用性等问题……
目前,重复数据删除技术十分流行,而我们见证其成长的Lempel-Ziv (LZ)压缩技术虽然略显陈旧,却依然性能良好。
随着市场的推广,国内用户对重复数据删除技术的接受程度也得到快速提升。那么重复数据删除在实施过程中要注意哪些问题呢?
主存储将会是重复数据删除技术的下一个前进领域,但是这却也可能成为我们在如何更好的优化存储空间这个问题上遇到的最大的分歧点……
几年前持续数据保护(CDP)出现时,人们都认为这种产品能够取代传统的备份软件。当时CDP供应商预测IT管理人员都会放弃原来的备份软件,因为它们需要每周一次完全备份、每天一次增量备份……
公司要采购各种各样的设备,在采购的过程中会有很多的技巧。了解这些技巧对我们来说是非常重要的,必要时可以起到事半功倍的效果。
交换机在应用中会出现很多问题,为了在网络中能够满足更多的存储平台或主机服务器,交换机需要定期扩展或替换。交换机通过升级可以达到更好的性能,增强网络的有效性,限制网络流量并提供智能化功能,比如对网络的虚拟化。
最新更新
专家答疑
技巧
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……
Greg Schulz
我们有两个负载均衡网络服务器,都是可用的,正在尽力访问SAN上的相同的LUN。我们在操作系统和EMC SAN上用Windows2003标准版本。我们如何实现并行写入SAN……