热点备份技术现状分析:重复数据删除

日期: 2010-04-22 作者:W. Curtis Preston翻译:郭镭 来源:TechTarget中国 英文

如今,新一代备份技术的成熟度已经达到可以大规模普及的程度了,而且这些技术的发展不仅仅是为了满足少数敢于“尝鲜”的用户。那些早期的使用者对新技术的发展起到了推波助澜的作用,因为他们乐于购买那些还在起步阶段的产品,并且毫不犹豫的进行尝试,他们也不会顾忌自己第一个“吃螃蟹“。不过,敢于尝鲜的客户通常只是一个小的群体,大多数潜在使用者会采用观望态度。所以,新产品通常是“叫好不叫座”,即使它们获得了技术上的好评,也几乎不可能在市场整体表现上有所作为。

  但是,近期事态的发展加速了备份新技术的成熟和普及。大厂商在不断的收购那些小公司,简化部署这些新产品的使能技术也已经出现了。   下面我们就来看看5项关……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

如今,新一代备份技术的成熟度已经达到可以大规模普及的程度了,而且这些技术的发展不仅仅是为了满足少数敢于“尝鲜”的用户。那些早期的使用者对新技术的发展起到了推波助澜的作用,因为他们乐于购买那些还在起步阶段的产品,并且毫不犹豫的进行尝试,他们也不会顾忌自己第一个“吃螃蟹“。不过,敢于尝鲜的客户通常只是一个小的群体,大多数潜在使用者会采用观望态度。所以,新产品通常是“叫好不叫座”,即使它们获得了技术上的好评,也几乎不可能在市场整体表现上有所作为。

  但是,近期事态的发展加速了备份新技术的成熟和普及。大厂商在不断的收购那些小公司,简化部署这些新产品的使能技术也已经出现了。

  下面我们就来看看5项关注度最高的关键备份技术的发展:

  • 重复数据删除
  • 数据保护管理
  • 持续数据保护
  • 合成备份
  • 虚拟服务器备份

  我们将为您解释这些技术对备份应用所产生的影响,并介绍备份软件四大领导厂商CommVault、EMC、IBM和Symantec公司是如何在他们的产品中部署这些新技术的。这里并不是说其他的备份厂商还没有提供这些新功能,只是因为这四家公司是公认的备份软件市场领导者,用户对他们的产品关注更多而已。

  重复数据删除:改变了磁盘备份游戏规则的技术

  在今天的备份系统中,我们很难不去强调重复数据删除的重要性。该技术可能是自15年前网络备份系统出现以来,影响力最大的技术变革。它的流行取决于若干因素,首先它能提高备份系统的磁盘利用率。在备份介质领域,磁带的单位价格一直以来明显低于磁盘,虽然过去几年磁盘的价格大幅降低,但成本方面仍然不能跟磁带相比。因此,磁盘通常用作磁带前端的临时高速缓存,而不作为长期的备份或归档介质使用。

  重复数据删除技术从根本上改变了这一切。由于磁盘具有随机读写的特性,所以重复数据删除系统能够消除冗余的数据块,并用指针代替删除的部分,同时对数据恢复也不会有太大的影响(虽然恢复性能稍有下降,但仍然大大高于磁带的恢复速度。)。

  尽管重复数据删除的优点毋庸置疑,很多用户却仍然在保持观望。他们等待的原因是想看看这种目前应用于去重硬件设备中的技术最终是否会引入到备份软件领域,因为很多人并不希望使用那些专用的硬件装置。虽然多数专家认为硬件去重设备仍然是必要的,但重复数据删除技术实际上已经切入了主流备份软件市场。

  EMC和Symantec是第一批将去重技术纳入产品线的主要备份软件厂商,他们都是通过收购方式获得相关产品。EMC收购了Avamar Technologies,而Symantec的PureDisk产品线则来自于对Datacenter Technologies公司的收购活动。另外,像CommVault和IBM公司则选择了自主开发重复数据删除产品。

  从技术类型上说,EMC和Symantec的产品都属于源端重复数据删除技术,就是说我们需要在计算机上安装Avamar或PureDisk 的agent代理程序,这个客户端负责与备份服务器端通信,识别冗余数据,并在发送到网络上传输之前将其删除。由于在每次备份过程中只有变化的数据字节才被发送到服务器端,所以源端重复数据删除非常适合小型远程办公室和移动设备的备份。

  以上两家厂商提供的“源端重复数据删除”都是基于独立的产品,用户不必购买Symantec NetBackup或EMC NetWorker这种传统备份软件。因此,即使以前不是Symantec或EMC备份产品的用户,他们仍然能够享受重复数据删除技术带来的好处。不过,这也意味着如果用户想同时使用传统备份和重复数据删除,那就不得不购买且管理两个独立的产品。(即NetBackup和PureDisk,或者NetWorker和Avamar)。为此,Symantec率先做出了反应,在他的NetBackup 7.0中内建了源端去重功能,客户不需要再安装独立的PureDisk产品。EMC尚未实现产品的完全统一,虽然NetWorker和Avamar可以共享一个客户端,并且可以通过NetWorker来管理Avamar,但是Avamar仍然需要一个单独的服务器端程序。

  另一方面,备份软件厂商也可以提供“目标端重复数据删除”。又是Symantec最早发布了此类产品。NetBackup备份软件的用户可以先将数据以标准的方式备份到介质管理服务器,然后在介质管理端用PureDisk进行去重处理(随着NetBackup 7.0的发布,这个功能就不需要安装独立的PureDisk了。)。

  IBM也进入了重复数据删除市场,在Tivoli Storage Manager (TSM) 6.1中发布了基于后处理(post-process)方式的“目标端去重”功能,TSM主要对已经备份到磁盘上的数据进行处理。在IBM的基础产品线中,目前只有“目标端重复数据删除”产品,而且它所能达到的效果(去重比率)与我们能买到的其他产品相比也显得一般。

  CommVault公司的Simpana备份软件,在去重功能上比较特殊,我们很难界定它应该属于“目标端去重”还是“源端去重”。通常情况下备份软件执行去重处理需要4个步骤:(1)将需要备份的文件分割成“片段”;(2)为每个“片段”计算一个“哈希”值(通常使用SHA–1算法);(3)在已有的哈希值列表中查找,看看该“片段”是不是唯一的;(4)决定是否需要将这个“片段”发送到目标存储设备。“源端重复数据删除”产品在客户端执行全部以上四个步骤,而“目标端重复数据删除”装置则在备份设备或备份服务器上处理这四个过程。CommVault的设计是在客户端执行步骤1和2,步骤3和4在backup server端执行(backup server是CommVault的专用术语,相当于介质管理程序)。所以从这个角度看,我们很难说它到底属于哪个类型。

  如果我们把分类的标准界定为数据离开客户端时是否为去重的状态,那么CommVault的Simpana应该被算作“目标端去重“一类。另外,只有Simpana是在客户端处理前两个步骤,这也使得它具备其他“目标端去重”产品没有的功能:在客户端进行数据压缩。大多数目标端去重系统不能很好地处理经过客户端压缩的数据,因为压缩会削弱去重处理能力,影响正确的数据分片以及分配指纹标记。由于Simpana是在客户端进行数据分片和分配指纹的处理,因此它能在网络传输之前进行数据压缩,同时又对去重没有负面影响。压缩并不会比“源端去重”节约更多的带宽,但在某些环境下它是有益的。

作者

W. Curtis Preston
W. Curtis Preston

TechTarget存储执行编辑

相关推荐