TechTarget中国网站推荐

虚拟磁带库的推动力

2008-9-2  选择字号:  | |
打印本文章

  市场正热的重复数据删除技术,将会改写存储行业的规则,虚拟磁带库是最大受益者。

  根据调研机构IDC的数据显示,“全球虚拟磁带库市场的总值,将在未来五年内翻一番,预计到2011年时达到14亿美元的市场规模,同期,市场的复合年增长率将达到47.4%”。

  众所周知,磁盘和磁带是在存储系统中用得最多的存储设备,然而近年来随着磁盘技术飞速发展,很多企业用户已经开始考虑基于磁盘的备份方式,磁带的生存空间似乎越来越小。

  VTL因“整合”全面管控

  以往企业用户存储,特别是一些高端行业用户使用磁带存储过程中,由于传统磁带备份的某些局限性,比如备份速度低、各种机械故障以及复杂的维护工作等通病,往往让用户有苦难言。

  VTL(Virtual Tape Library)即虚拟带库的概念由此而生。虚拟带库是通过软件将磁盘阵列虚拟成磁带库,在操作窗口上实现完全如物理磁带一样的操作。它本质上是磁盘阵列硬件设备,但是在软件功能上模拟磁带备份的形式,因此对于管理者来说就很方便。它就像是一个磁带库,对它的管理如同管理一个物理磁带库一模一样。

  前些年,传统机械磁带库厂家纷纷推出虚拟磁带库作为高端产品系列,包括IBM、HP、EMC等IT巨头纷纷介入这个领域。并且,越来越多系统整合厂商提倡VTL的解决方案。目前的VTL产品大都能够支持开放操作系统、备份软件、FC SAN架构、具备磁盘子系统的可靠性而且实施简单,可说是已经非常大众化了。

  虚拟磁带库兼容磁带备份管理软件以及传统的备份流程,这使得设备的可用性及备份性能得以提升。在企业应用中,虚拟磁带库用电子“机械手”和磁带驱动器,代替了机械磁带库中裸露、易损的系列机械装置。这样,设备的可用性得到提升。另外,自动报警和在线热恢复能力也是以前磁带库难以做到的。

  我们知道,磁带备份是最早的存储应用之一,但磁带库的可靠性远不像磁带库厂商宣传得那样好,平均无故障时间并不令用户满意,在实际应用中往往一两年就开始出现故障。而封闭式结构的磁盘介质本身的MTBF(平均无故障间隔)一般为开放式结构的磁带介质的5倍以上。从而将备份的可靠性较常规磁带备份提高了若干量级。当然,其恢复工作与磁盘备份速度一样。

  虚拟磁带库中,一般采用磁盘阵列作为后端存储设备。磁盘阵列采用的RAID技术来保证当盘阵中某一块磁盘出现故障时,盘阵上的数据仍然可以正常读写。当出现一块磁盘损坏时,RAID控制器可以自动隔离故障盘,并立即开始逻辑卷自动重建,实现自动在线热恢复。保证了设备的连续可用性。

  对于用户来说,虚拟磁带库是“整合”的,其在储存架构里可以扮演集中控管的角色,集中前端服务器传输的资料量,并衔接后端实体磁带柜,所以管理人员可以靠虚拟磁带柜的产品对前端与后端储存设备,进行全面控管。

  重复数据删除推动VTL

  虽然虚拟磁带库技术已经出现多年,但基于磁盘备份的高额成本,用户始终无法承受大规模的应用磁盘作为备份首选介质,形成目前很多用户仍然采用传统的磁带存储模式。不过,对VTL今后的发展产生较大影响的因素是重复数据删除(data de-duplication)技术的成熟与普及。IDC的分析师Robert Amatruda就曾说,“随着重复数据删除技术的出现,当今的虚拟磁带库经济可与磁带相比。”

  “重复数据删除”技术是根据“De-Duplication”翻译过来的,简单说就是消除副本。国外分析机构ESG将重复数据删除定义为删除或擦去冗余文件、字节或数据块的流程,确保只有“独有”的数据存储在磁盘上。

  举例来说,若某一份文件只更改了名称,然后再另存为新的文件,那么系统就会视其为不同的数据存放,若用全备份配合增量备份,用户若要检索数据时,就必须分别找出存储全备份和增量备份的磁带,这是一个复杂过程。

  如果要想很多地解决这个问题,就要利用重复数据删除技术,因为其数据比对可降至区块层级,所以比对的程度更加精密。对经常采用全备份的用户来说,重复数据删除技术还可解决全备份过度占空间的问题。

  目前,大量的重复数据删除工作都与备份和归档有关,而VTL正是用户备份和归档的重要后端设备与部分实现端。因此,重复数据删除技术也已成为大型企业在选择VTL时考虑的重点。因为,无论压缩还是重复数据删除,都能帮助企业使更多的数据在导出到磁带前在磁盘上保留更长时间。

  有分析家表示,目前市场正热的重复数据删除技术,将会改写存储行业的规则,存档的数据将会呈几何级别递减,大幅削减存储成本,借助于重复数据删除技术,用户的存档数据所占用的空间将会缩减为现在的5%,虚拟磁带库和重复数据删除技术的结合,也会引发存储市场的一轮变革。

  不过,尽管重复删除技术有种种优势,但是分析师还是提出,用户要谨慎对待这个技术。在应用重复数据删除技术之前,用户应该认真考虑自己的整体数据容量和到底需要这项技术来实现什么目标。

  另外,由于重复数据强调的是单实例存储,所以这会给用户带来安全问题。因为重复数据删除会将数据信息的多个副本都删除,最后只保留一个副本。最后,在VTL上整合重复数据删除功能,有些厂商视为标准配备,有些厂商则视为选购功能,缺少统一标准。这也是用户选择时需要考虑的方面。

  虚拟磁带库的三种主要实现方式

  目前市场上的虚拟磁带库可以分为三种类型:备份软件型(D2D)、应用服务器型(VTL Appliance)、智能化专用型(Intelligent High Preformance VTL)。

  第一代:备份软件型(D2D) 备份软件型将磁带库模拟软件直接安装在备份服务器上,把某些文件系统分区模拟成磁带库,使备份软件以磁带库方式使用磁盘文件系统。这种方案多由备份管理软件作为一个功能模块提供,价格比较低廉。但由于受制于文件系统,使其应用场合、I/O性能及数据安全性具有一定局限。

  第二代:应用服务器型(VTL Appliance)应用服务器型通过把虚拟磁带库管理软件安装在一台独立的专用服务器内,而将该服务器及所连接的磁盘存储设备模拟成磁带库。这种方式下,备份服务器或其它应用主机通过FC或SCSI与专用的服务器连接,此时专用服务器及所连接的磁盘存储系统一起体现为虚拟磁带库。

  此类方案下,虚拟磁带介质—磁盘逻辑卷,不再是操作系统格式化的扇区,而是和磁带一样的裸介质(“raw disk”);其上备份数据也是按顺序Byte到Byte存放的,在物理层上实现了磁盘读写的线性化,避免了文件系统的碎块问题,充分利用了磁盘设备的高速I/O性能。

  这种方案的不足是需要利用一台具有一定扩充能力的PC服务器作为虚拟磁带库管理器,系统优化性略低。另外控制器部分采用PC服务器结构,不够精简。第三,PC服务器以及其连接的磁盘阵列管理不统一,不是一体化结构,还容易产生PC服务器和后端存储的不兼容问题。

  第三代:智能化专用型(Intelligent High Preformance VTL) 基于ARM结构的嵌入式系统,统一化管理,成为智能化专用型虚拟磁带库IHPV的基本特征,它将磁带库模拟管理软件固化在特别设计的ARM结构、嵌入式实时系统中,就形成了专用的虚拟磁带库设备。这标志着虚拟磁带库技术终于突破了操作系统和PC服务器架构的限制,使虚拟磁带库真正成为了一种独立的外设,并且真正将虚拟磁带库控制系统和磁盘存储阵列统一管理起来,其使用方式更接近普通磁带库,而其优越性能也体现得更加充分。

原文出处:http://media.ccidnet.com/art/16159/20080701/1493657_1.html
来源:赛迪网    作者:黄昆    
不要为磁带何时消失编制时间表。十多年来,一直有人宣称磁带是过时技术,但是现在大大小小的组织仍然在继续使用磁带,并将磁带作为数据保护策略的核心之一。
最近几年似乎出现了很多的安全事故。虽然有些事故比如网络服务器和数据库被黑客攻破可以归因于黑客,但是如果采取了适当的预防措施,许多其他的事故本来是可以避免的……
今天你所创建的磁带可能在多年以后还会被读取。这不仅需要一定程度的前向兼容性,还增强了升级需求,避免替换价格不菲的磁带库。所有这些都需要在选择磁带库时加以考虑。
市场正热的重复数据删除技术,将会改写存储行业的规则,虚拟磁带库是最大受益者。根据调研机构IDC的数据显示,全球虚拟磁带库市场的总值,将在未来五年内翻一番……
相对于物理磁带库,虚拟磁带库(VTL:Virtual Tape Library)使用了兼容磁带备份管理软件和传统备份作业流程……
交换机在应用中会出现很多问题,为了在网络中能够满足更多的存储平台或主机服务器,交换机需要定期扩展或替换。交换机通过升级可以达到更好的性能,增强网络的有效性,限制网络流量并提供智能化功能,比如对网络的虚拟化。
磁盘阵列几乎是每个网管员必须掌握的一项技术。随着现在越来越多的厂商推出了各种磁盘阵列技术,在现在的存储应用中也越来越广泛。那么磁盘阵列技术对我们的影响有什么呢?
数据增长速度的加快、新应用需求的增加、对数据存档的监管力度的增大和业务连续性需求,正在让企业的IT预算越来越吃紧,同时也使得其传统存储架构的不足日益显露,而分层存储从某种程度上可以减缓这些压力。
最新更新
专家答疑
技巧
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……
Greg Schulz
我们有两个负载均衡网络服务器,都是可用的,正在尽力访问SAN上的相同的LUN。我们在操作系统和EMC SAN上用Windows2003标准版本。我们如何实现并行写入SAN……