备份中重复数据删除应用状况(下)

日期: 2011-11-28 作者:Lauren Whitehouse翻译:张瀚文 来源:TechTarget中国 英文

重复数据删除技术发展的痛点 随着重复数据删除技术的日趋成熟,用户已经逐步经历了不少应用中的痛点。数据量的不断增长使备份和恢复对性能和扩展性有越来越高的要求,这进而使得重复数据删除技术的横向扩展解决方案越受关注。而在远端或分支机构中取代磁带设备的应用方式形成了优化站点之间的复制,以及在备份目录中跟踪这些复制卷的要求。 在ESG最近一次数据保护趋势调查报告中,其调查了最终用户在采购重复数据删除技术时最为关注的标准和成本。

一些会影响成本的因素列举如下: ? 一些备份软件供应商在其产品中免费添加重复数据删除功能(比如CA和IBM的TSM),而其它的则要收费。 ? 有一些隐性成本,比……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

重复数据删除技术发展的痛点

随着重复数据删除技术的日趋成熟,用户已经逐步经历了不少应用中的痛点。数据量的不断增长使备份和恢复对性能和扩展性有越来越高的要求,这进而使得重复数据删除技术的横向扩展解决方案越受关注。而在远端或分支机构中取代磁带设备的应用方式形成了优化站点之间的复制,以及在备份目录中跟踪这些复制卷的要求。

在ESG最近一次数据保护趋势调查报告中,其调查了最终用户在采购重复数据删除技术时最为关注的标准和成本。一些会影响成本的因素列举如下:

? 一些备份软件供应商在其产品中免费添加重复数据删除功能(比如CA和IBM的TSM),而其它的则要收费。

? 有一些隐性成本,比如在重复数据删除系统之间激活复制功能可能会额外收费。以及备份站点需要和生产站点一样(或至少近似)建立这一系统,这使得成本翻倍。当然也有例外,比如Symantec 5000系列产品,其免费包含了设备到设备之间的复制功能。Symantec同时给予前端被保护的数据容量收取许可证费用,而非根据后端数据存储的容量进行收费,因此对复制拷贝并不产生额外成本。

? 目标重复数据删除系统供应商将软件捆绑在其存储硬件上,因此当更新硬件平台时你就重复购买了软件部分。同样,Symantec采用一种不同的方式,对软件和硬件分别收费。

用户驱动的新去重技术的发展

Arkeia的高级重复数据删除方式只是一个例子而已,其他公司都在推动重复数据删除技术。CommVault在物理磁带媒介上进行重复数据删除可以作为另一个例子。尽管目前的宣传都集中在基于磁盘的数据保护并暗示磁带可能走向消亡,对于很多企业而言,事实是对于数据的长期保存,磁带仍是一种低成本的方式。重复数据删除技术被认为是针对磁盘的技术,因为需要重复数据删除的目录,以及所有的唯一性数据在其存储媒介上可以重新组成并被访问。这意味着将重复删除后的数据从磁盘拷贝或移动至磁带时,必须被重新构建,这和数据降低这一最终目的相抵触。不过CommVault Simpana软件能够使得重复删除后的数据拷贝出来归档,而不需重新构建,从而降低了磁带媒介的容量要求。更重要的是,数据可以从磁带媒介上进行恢复而无需先将整盘磁带恢复到磁盘上。

源端的重复数据删除方式正在逐步流行起来,其最大优势在于端到端的高效备份更接近于数据源(提供内容无关,网络带宽节省以及更快速地备份),以及将重复数据删除的处理流程分布在整个环境中(而和目标端重复数据删除系统那样容易产生瓶颈)。以上两种优势在HP的StoreOnce和EMC的Data Domain重复删除产品中充分体现。

虽然HP的Data Protector备份体系架构中在今天还没有内置重复数据删除功能,但用户可以通过StoreOnce重复数据删除产品获取该项功能。StoreOnce是一个模块化的部件,可以在文件系统中作为一项服务运行。其可以和HP的Data Protector备份软件和HP横向扩展文件系统集成,或植入HP的体系架构组件之中。StoreOnce的运算包含两个步骤:采集大量数据序列(约10MB)来判定数据重复的可能性,将其排序成重复数据删除的最佳节点,然后通过一次哈希算法来比较更小的数据块。HP的重复数据删除策略比较特别,其可移植,可扩展并且是全局化的。这也意味着重复数据删除的部署可以通过局域网或城域网扩展到整个存储系统中,而无需在重复数据删除层之前转化数据。

EMC的Data Domain Boost选项可以激活Data Domain在NetBackup和Backup Exec OST环境的媒介服务器以及和EMC NetWorker站点中实现重复数据删除的预处理操作。Data Domain软件组件安装在媒介服务器上。通过将重复数据删除工作负载分布式进行,这项操作可以改善性能并提升媒介服务器和Data Domain目标重复数据删除系统之间的网络效率。

重复数据删除技术的未来

基于磁盘的数据保护解决了备份窗口的问题,而重复数据删除技术解决了备份配置中硬盘的成本问题。不过最新的一些技术,比如基于阵列的快照技术,正逐步融合在现有技术中以满足那些要求零备份窗口或很短下线时间要求的企业的高性能需求。在许多情况下,数据块级别增量备份技术和重复数据删除组合在新的快照产品之中。NetApp的Integrated Data Protection产品(SnapVault、SnapMirror和SnapProtect),配合NetApp基于FAS产品线的重复数据删除技术,可以消除在备份软件中重复删除或目标重复数据删除的需要。

类似的,Actifio VirtualData Pipeline (VDP)可以进行全镜像级别的备份和之后持续的数据块级别的增量备份,并通过重复数据删除和压缩技术,因此无需为降低数据量购置额外的第三方产品。Nimble Storage公司也采用类似的方式。其在单一解决方案中组合了主存储和次存储,利用快照和复制类型的数据保护,并采用容量优化来降低所需备份的数据。这种方式正在逐步取代传统的备份方式,以及传统的重复数据删除技术。

相关链接1:应用程序接口和开放标准

Symantec公司的OpenStorage Technology (OST)是用于NetBackup(6.5及以上版本)和Backup Exec 2010的应用程序接口。目标重复数据删除系统供应商利用该应用程序接口将软件插件模块写入,安装在备份媒介服务器上来和存储设备沟通,这在备份软件和目标存储之间创建了更紧密的集成。这样就可以使用诸如智能容量管理,媒介服务器负载均衡,报告和生命周期策略等功能。这同时提供更优化的复制——更高效的网络复制和直接磁盘到磁带的复制,在此过程中可以被备份软件监控和记录。EMC公司在其NetWorker中提供类似的功能;不过到目前为止,该功能只能适用于EMC Data Domain重复删除系统。

应用程序接口促进了互操作性,不过业内是否可以此进一步促进重复删除技术的标准?就像是现在的压缩技术,重复删除技术是否也会出现标准算法,或许开源软件将会是驱动其发展的动力。促成这种标准的动力还包括无缝、高效并快速在磁盘和磁带间迁移数据的需要(除了那些不需要重复删除技术或数据重组的部分),以及对于改善恢复的操作。任何添加在开源备份应用上的重复删除技术,比如Bacula和Amanda,以及开源的ZFS和SDFS文件系统在某天可能成为标准。

相关链接2:全局重复数据删除技术

全局化是相对重复删除中比较的区域而言的。识别重复有两种方式。在单区域中,备份数据通过一个单个系统时会和之前通过该系统的数据进行比较。在跨区域的重复删除技术中,备份数据通过单个系统时和之前通过该系统以及区域内其它系统的数据进行比较。全局重复数据删除可以实现更高的重复删除率因为其比较了更多的对象,从而发现更多重复数据。

相关链接3:线性磁带文件系统

IBM所引入的线性磁带文件系统(LTFS)提供了一种数据格式,可以提供存储在LTO 5磁带媒介上的数据一个文件系统接口,磁带从而可以和外部磁盘设备这样使用。通过LTFS,数据不在必须用磁带的格式进行写入,因此数据的写操作对应用程序来说更为独立。对于非压缩的数据类型,这更适合于数据的长期存储,比如医疗影像和影音文件。LTFS对于重复删除厂商而言是否也是一个机会,将磁带作为长期数据存储层并进行重复数据删除。目前还尚无定论,就看是否会有厂商这样做了。

本文选自存储经理人2011年8月刊:备份中重复数据删除的应用状况,请下载阅读PDF版本。

更多重复数据删除技巧请参考:

存储大讲堂:重复数据删除

重复数据删除技术详解手册(升级版)

相关推荐

  • 简单可靠的平面备份技术

    在过去,很少有人认为平面数据备份可以成为传统备份方式的靠谱的替代者。而到了现在,随着快照技术的不断增强,趋势正在改变。

  • 专家答疑:重复数据删除在云中是如何工作的?

    重复数据删除过程减少了存储系统中的数据量,但云中的重复数据删除可能比客户对云提供者更有价值。

  • 全闪数据中心的数据缩减攻略

    全闪存数据中心的概念之所以很吸引人,是因为它可以消除耗时的系统调优。它使数据中心得以支持最大的虚拟机密度,它的存储响应时间让大多数应用程序提供者都感到满意。

  • 存储采购并非易事

    硬盘市场的下滑并没有带来相应的固态存储市场的蓬勃发展,但固态存储将最终取代机械硬盘,在这一路上也会不断有惊喜。