RSS订阅
RSS订阅TT存储

专访NetApp:重复数据删除提高投资回报率

2008-10-17  选择字号:  | |
打印本文章

导读:文章讲述在国外,重复数据删除技术已经比较成熟,那么在我们国内的情况是重复数据删除也越来越多的被采用。

关键词:重复数据删除 Data ONTAP NetApp存储系统

正在加载数据...

【TechTarget中国原创】业务的不断增长致使存储管理员更加努力地处理日益激增的数据,文本、声频、视频、图像,不断增加的大容量邮件附件等都在加重企业数据备份的负担。为了解决这个问题,企业越来越多的转向重复数据删除技术,很多企业也都相继推出支持重复数据删除的产品。在国外,重复数据删除技术已经比较成熟,那么在我们国内的情况是怎样的呢?带着这个问题,我们TechTarget中国采访了存储和数据管理解决方案提供商NetApp公司的大中华区总经理柯志明先生。

  TechTarget中国:NetApp都有哪些重复数据删除技术?

柯志明:A-SIS是NetApp重复数据删除技术中的一种,另外两个技术是SnapVault for NetBackup和NearStore VTL Deduplication。

A-SIS可以用于包括NetApp aka、FAS、R和V(7.3 及以上)系列的磁盘主存储或次存储系统。NetApp与赛门铁克合作开发了适用于NBU的SV,为NBU副本提供块级重复数据删除。而NetApp NearStore VTL Deduplication可以同内置硬件整合,删除虚拟磁带和虚拟磁带库中的冗余数据。

  这三大技术为已有或潜在客户提供了一种简单易用的方法。比如,A-SIS作为一个认证的重复数据删除技术,可以免费部署在NetApp存储系统中。不同于其他厂商,NetApp 不需要凭借软件升级或任何代理网关实现重复数据删除功能。这一过程可以根据客户自身的需求,灵活选择。

  TechTarget中国:NetApp重复数据删除如何运作?

  柯志明:在卷上启用重复数据删除时,会创建一个数字指纹列表代表所有正在使用的块。这些指纹已经是Data ONTAP元数据的一部分,因此不必为每个块创建新指纹。通过比较这些指纹,可以比较容易地确定哪些块是重复的。然后,只需利用簿记更改参考指针并清除副本。

  指纹只用于确定重复块;而不用于查询或访问数据。因此,数据访问仍然很快,不会因为数据重复删除过程而造成数据损毁。

  另外,此基本流程与使用过十几年的Snapshot技术流程相同:使用一个“物理”数据块表示多个“逻辑”数据块。在用户需要回收存储空间的时候,可以定期对卷执行重复数据删除进程。因为此过程开销很低,NetApp重复数据删除可以在多种工作负荷下使用。

  TechTarget中国:有的用户对重复数据删除的理解是:把重复的数据删除掉,保留一份完整的数据。那么当数据只有一个副本时,一旦副本坏掉,那么是否所有数据都没有了?这种情况下如何进行数据恢复?重复数据删除对数据安全有什么影响?

  柯志明:大多数其他供应商提供的重复数据删除仅用于备份,而我们却支持用于主存储和二级存储的重复数据删除,因此我们格外注重数据安全性。

  首先,从识别并消除重复数据所用的算法来讲,NetApp重复数据删除技术结合使用指纹和数据块逐个字节的比较,从而不会由于哈希冲突而误删任何唯一的数据块。

  其次,从软硬件的可靠性来说,凭借NetApp存储,重复数据删除已是Data ONTAP运行环境中不可或缺的一部分,贯穿整个产品系列。此外,为了保护提交到磁盘的数据的可靠性,NetApp还开发了高性能的RAID-DP,这是一个具有双奇偶校验的RAID 6实施,可以在不牺牲写入性能的情况防范双磁盘故障。

  经过重复数据删除处理的数据存储在NetApp存储系统中,多年的实践证明该系统采用的硬件和软件不仅可靠而且富有弹性。因此可以在恢复数据的同时取回已备份的数据。

  TechTarget中国:请问国内的客户对重复数据删除的接受程度如何?

  柯志明:中国的客户现在变得越来越成熟,他们开始考虑把磁带改成磁盘的备份,减少数据的重复,重复数据删除技术是一个很好的选择。重复数据删除跟容灾是两码事,不是说做了重复数据删除,就不用做容灾。而是做了重复数据删除,比做容灾更简单,所以重复数据删除必须做。以前10个数据,现在变成一个数据,是很危险的,但是以前10个的数据量,要做10个备份,现在把10个变成1个,只做一个备份,一个容灾就够了。这样不仅使可用性提高,而且使性能很多方面都加强了。所以对我们来讲,不只是用量减少,更重要就是前端的整个虚拟化的实施,怎么可以用得更好。

  TechTarget中国:NetApp重复数据删除技术与其他竞争厂商相比有哪些独特优势?

  柯志明:NetApp重复数据删除技术跟其他公司最大的不同,就是重复数据删除技术超越了单纯的数据备份,还包括归档、主数据的复制、一些虚拟化环境的应用。举个例子,在很多客户需要50/1节省空间的情况下,我们可以应用到VMware应用环境中。最近我们对运行大量基本相同系统的 VMware 客户进行了一次测试。在我们进行的测试中,我们看到通过重复数据删除节省了 95% 数据空间。但是,并不是说重复数据删除可以在所有地方都将数据减少 95%,但在特定的应用程序中确实可以通过重复数据删除节省大量的空间。

  NetApp重复数据删除的另一个独特优势是它可以使用任何NetApp精灵卷(FlexVol),并且可以重复删除现有数据卷。不管数据如何写入卷,都可方便地确定和清除该卷内的重复块。如果两个或更多块是相同的,我们清除重复块并更改数据指针,以便所有副本都重新指向单个数据块。块的内容是什么或块属于哪个应用程序都无关紧要;如果块相同,则副本会被清除。这与其他重复数据删除产品形成强烈对比,那些产品主要限制用于单应用程序,例如备份。用户可以对已经使用很长时间的卷执行重复数据删除,从而恢复大量的磁盘空间。

  TechTarget中国:您认为重复数据删除在中国的应用前景如何?

  柯志明:重复数据删除技术能最大发挥功用的应用环境首先第一点是数据备份,因为无论是Oracle、MS Exchange,还是Sybase的数据库,应用NetApp的重复数据删除技术,都可以得到很好的投资回报。第二点,邮件和文件归档,这一点也是重复数据删除技术方面很好的客户回报。第三,主节点的数据,尤其是共享文件的数据,也是非常重要的。

  重复数据删除技术不是一个独立的市场,而是今天客户需要具备的能力,尤其是客户要认识到这种重复数据删除技术的能力给他带来的价值。基于备份的重复数据删除,不是像大的项目,投资回报率需要六个月或更长时间。基于备份的重复数据删除技术,由于每天都在做重复性的数据备份,二十几天甚至更短就可以看到投资回报率。

作者:张艳丽    
回首2008,数据保护/数据备份见证了一些显著的趋势。企业都在关注高效,节省成本和环境可持续性。IT企业面临的问题包括……
虽然存储的售价一直都在不停的下降,但也远远赶不上公司内需要保存和备份的数据量的攀升速度。那么,是否有这样一种解决方案,它能够压缩大量的已有数据……
人们对二级存储市场的关注主要集中在磁盘备份模式中的重复数据删除技术。重复数据删除具有许多优点。你不仅可以将磁盘中的数据保留更长时间……
在VTL或备份设备上做重复数据删除怎么样?有什么性能影响吗?在性能方面有点不同的影响。基于备份的重复数据删除是你并不是减少传输到网络上的数据。
本文讨论的是数据不定期损坏的问题,并非一定会发生,即使是发生数据损坏事故的概率远低于廉价SATA的高端企业光纤信道驱动器也不能例外。

2009年对于备份来说是关键的一年。预算在减少,但是备份的数据总量却在增长。新趋势像重复数据删除使它更具有吸引力。在常见系统中,数据备份最多使用的是读写操作;通常,备份问题在影响日常操作之前,都会显现一定的征兆。因此我们总结了2008年最受欢迎的备份技巧,希望可以给大家一些帮助。

存储区域网络(SAN)和网络附属存储(NAS)在网络存储中的支柱作用毋庸置疑,但是直接附属存储(DAS)依然盛行,即使在企业中也是如此。TechTarget专家将深入DAS在企业中的应用以及在应用过程中遇到的问题。

对于整个存储解决方案来说,交换机固然是存储网络环节中极为重要的一部分,但是HBA卡也是其中不可或缺的一环,甚至可以说HBA卡性能的高低直接决定了网络的整体性能。所以什么是总机总线适配器呢,在购买时要注意什么问题呢,以及在升级的过程中该注意什么问题呢? TechTarget专家将深入给我们讲解总机总线适配器(HBA)。
最新更新
专家答疑
技巧
Randy Kerns
我有一个客户,他想把1TB左右的存储加在他们的网络上。我想用HP DL380和MSA30以及300GB的磁盘。网络中NAS和DAS的性能有什么不同呢?
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……