RSS订阅
RSS订阅TT存储

专访Hifn:重复数据删除是存储发展的必然选择

2008-11-11  选择字号:  | |
打印本文章

导读:TechTarget中国针对重复数据删除的特点,以及在备份,应用重复数据删除时应注意的问题对Hifn亚太区运营副总裁杨钦铭先生进行了采访。

关键词:重复数据删除 备份 压缩 加密 Hifn

正在加载数据... 【TechTarget中国原创】业务的不断增长,数据日益激增,文本、声频、视频、图像、大容量邮件附件等都在加重企业数据备份的负担。为了解决这个问题,企业越来越多地转向重复数据删除技术,很多厂商也都相继推出支持重复数据删除的产品。那么重复数除删除究竟具有什么特点呢,带着这个问题我们采访了Hifn亚太区运营副总裁杨钦铭先生。

  TechTarget中国:最近两年,大家较多地谈论重复数据删除技术,越来越多的产品也支持重复数据删除。那么,它对用户有什么影响呢?

杨钦铭:每年存储都以成倍的速度增长,在存储过程中就会产生很多问题:一个是管理问题,另一个是能耗问题。冷气、空调等管理的费用越来越高,空间问题,磁盘问题都需要管理。于是很多企业把备份放到磁带、磁盘里。由于磁带机的速度比较慢,于是越来越多的资讯被放在电脑、服务器、存储中。当资讯膨胀时,就产生了很多技术,一个是压缩,一个是重复数据删除。压缩可以把存储压缩两倍到三倍,对于大企业来说应用压缩后可以缩减成本,达到环保的目的。随着技术的延伸,于是出现了重复数据删除,重复数据删除最大可以帮助用户减少20倍的数据。对于企业来说,把压缩和重复数据删除结合起来,可以使节省空间的比例最大也最优化。

  TechTarget中国:您能具体介绍一下重复数据删除有几种方式可以实现,具有哪些特性吗?
  杨钦铭:重复数据删除的实现一种是In-line,一种是Post-processing。其中,In-Line技术对于系统性能提出了更高的要求,因而,基于硬件的Hifn重复数据删除产品可以充分满足这种要求。产品重复数据删除不是比较文件,而是比较编码。我们把数据进行我们把数据进行SHA1 Hash(哈希)计算, 之后变成一个摘要,再把摘要进行比较。如果两段数据的摘要值相同,则对后进入系统的数据进行删除。在整个空间,绝大部分文件用简单的数据即可代表它们,同时HIFN的产品针对没有删除的部分文件还可以做压缩,压缩比一般是一半,如果原始数据是40T,对于OA数据,重复删除比例大概为20:1,那么就是2T,再对这2T的数据进行压缩,这时40T就变成1TB。但是,并不是所有的都可以应用压缩,诸如MP3,Media等本身已经是压缩的,这时就不用再应用压缩,但是此时可以做删除,如果有完全相同的图片或文件时,系统会自动追寻并将其删除。

  TechTarget中国:请问和软件重复数据删除相比,硬件重复数据删除具有什么特点?
  杨钦铭:重复数据删除是基于Hash(哈希)+Hash table matching(哈希值匹配)的方法来计算的。如果用软件来进行重复数据删除,速度会很慢,这取决于CPU的处理能力,因为CPU在加密解密时还在跑其他应用,所以速度会非常慢。我们所看到的最快的CPU一般能够达到200-400MB/s的处理性能,所以我们所看到的多数厂商的重复数据删除一般是在做备份时应用。而在主存储上并没有用重复数据删除。 两年前,我们推出的高速处理板卡,可以提供600MB/s-1GB/s以上的带宽,来进行数据压缩。而现在我们推出的新的产品组合,以硬件和软件相结合的方式可以在非常快的速度下同时进行重复数据删除,压缩以及加密,应用了我们产品方案的系统的好处是不但不会影响主存储的性能,还充分保证了主存储的速度。

  TechTarget中国:您能介绍一下在应用重复数据删除设备时,用户一般要注意什么问题?
  杨钦铭:用户之所以暂时没有应用重复数据删除是因为用户会很担心软件的重复数据删除会影响主存储的速度。所以一般重复数据删除不用在主存储上,而是用在容灾方面。在应用重复数据删除产品时,如果把软件和硬件相结合,用户就可以直接启动重复数据删除,从而避免这个问题;用户在进行异地备份时也可以应用重复数据删除,重复数据删除可以很快实现增量备份,而不需要担心带宽的问题。所以随着技术的发展,重复数据删除是必然需要的,同时压缩给重复删除带来更大的比例,而加密保证了其安全。

  TechTarget中国:您能给我们介绍一下Hifn今后的市场策略和发展方向吗?
  杨钦铭:Hifn在接下来的时间里会着重的关注存储市场,我们会推广我们的存储软件硬件组合,另外还有Hifn的NAS和iSCSI应用套件,企业可以直接应用,我们产品的易用性可以保证我们的客户能够非常快的将我们的方案整合到他们的系统中。对于NAS产品,我们的产品甚至可以直接应用到NAS的主存储上,实现重复删除。我们的硬件已经投放市场并被其他厂商所应用,另外软件计划明年上半年会出来。今后,市场的竞争方向不是价格斗争,而是技术斗争,如何更好保证客户价值的竞争。

  TechTarget中国:您认为重复数据删除的前景如何?
  杨钦铭:重复数据删除是大家都需要的,尤其是这次金融危机的影响,厂商更会考虑节约成本。本身资讯没有减少,因此存储不会改变,这时越来越多的人就会考虑重复数据删除。重复数据删除是一个很好的技术,可以让用户实现节约成本以及绿色环保。


重复数据删除
 重复数据删除技术在数据保护过程中有何作用
 重复数据删除的八大评估标准
 结合重复数据删除的虚拟化容灾方案
 选择正确的重复数据删除解决方案
 利用重复数据删除技术进行灾难恢复时需要考虑的四大策略
 有关重复数据删除技术的五大误区
 重复数据删除和VMware DR结合节约成本
 如何评估基于硬件的重复数据删除产品
 重复数据删除技术如何缓解存储需求
 重复数据删除in-band VS out-of-band
 CAS和重复数据删除:归档双雄
 如何通过重复数据删除降低存储成本
 重复数据删除是如何工作的?
 压缩、重复数据删除和加密的区别
 确保重复数据删除系统的高可用性
 如何评估基于软件的重复数据删除产品
 重复数据删除技术的安全性如何?
 重复数据删除技术对备份的作用
 重复数据删除技术的实现方式分析
 技术对比:重复数据删除技术、数据压缩技术和单一实例存储技术
 专访Hifn:重复数据删除是存储发展的必然选择
 重复数据删除:能否由次级存储转移到主存储?
 重复数据删除将走进主存储系统
 专访飞康:重复数据删除更应考虑数据安全问题
 压缩技术对重复数据删除技术造成压力
 支持重复数据删除的虚拟磁带库有什么好处?
 重复数据删除技术:块级技术VS.字节级技术
 文件级和块级重复数据删除技术的优缺点
 在VTL或备份设备上运行重复数据删除对性能有影响吗

作者:张艳丽    
回首2008,数据保护/数据备份见证了一些显著的趋势。企业都在关注高效,节省成本和环境可持续性。IT企业面临的问题包括……
人们对二级存储市场的关注主要集中在磁盘备份模式中的重复数据删除技术。重复数据删除具有许多优点。你不仅可以将磁盘中的数据保留更长时间……
在VTL或备份设备上做重复数据删除怎么样?有什么性能影响吗?在性能方面有点不同的影响。基于备份的重复数据删除是你并不是减少传输到网络上的数据。
本文讨论的是数据不定期损坏的问题,并非一定会发生,即使是发生数据损坏事故的概率远低于廉价SATA的高端企业光纤信道驱动器也不能例外。
重复数据删除技术大大提升了基于磁盘的数据保护策略、基于WAN的远程分公司备份整合策略、以及灾难恢复策略的价值主张……

2009年对于备份来说是关键的一年。预算在减少,但是备份的数据总量却在增长。新趋势像重复数据删除使它更具有吸引力。在常见系统中,数据备份最多使用的是读写操作;通常,备份问题在影响日常操作之前,都会显现一定的征兆。因此我们总结了2008年最受欢迎的备份技巧,希望可以给大家一些帮助。

存储区域网络(SAN)和网络附属存储(NAS)在网络存储中的支柱作用毋庸置疑,但是直接附属存储(DAS)依然盛行,即使在企业中也是如此。TechTarget专家将深入DAS在企业中的应用以及在应用过程中遇到的问题。

对于整个存储解决方案来说,交换机固然是存储网络环节中极为重要的一部分,但是HBA卡也是其中不可或缺的一环,甚至可以说HBA卡性能的高低直接决定了网络的整体性能。所以什么是总机总线适配器呢,在购买时要注意什么问题呢,以及在升级的过程中该注意什么问题呢? TechTarget专家将深入给我们讲解总机总线适配器(HBA)。
最新更新
专家答疑
技巧
Randy Kerns
我有一个客户,他想把1TB左右的存储加在他们的网络上。我想用HP DL380和MSA30以及300GB的磁盘。网络中NAS和DAS的性能有什么不同呢?
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……