视频:业务连续性中的数据保护指南

日期: 2012-05-30 作者:Jon William Toigo翻译:张瀚文 来源:TechTarget中国 英文

作为效率最大化最佳实践五个部分中的第三部分,Jon William Toigo谈到了数据保护指南,其中包括映像,磁带备份以及基于广域网的复制技术。

除管理存储性能以及容量以外,数据存储管理员通常需要想方设法保护其管理的数据。在过去,这只需要将输出数据拷贝至一个或多个存储媒介——其他楼层的另一台阵列(以防护小范围的设备故障)或是会运送到离线站点的可移动媒介,又或者是广域网上的另一端连接的存储(来预防更广地域范围的中断事故)。但是随着时间推移,业务产生的数据量不断递增,存储数据所用的磁盘阵列不断激增,单纯设定并遵照一系列数据保护指南变得越来越复杂,具有挑战性而且非常昂贵。

数据保护的有效性是一项衡量管理员应对快速增长的数据保护能力的指标:为每个字节设定了适当的数据保护方式,通过测试并验证其数据保护技术的应对能力,并以预算允许的方式提供“深度防护”。以下列出五项可以实现更高效地数据保护成效的途径。

数据保护指南1:放弃“糟糕的磁带”的固有思维

你应当避免轻信来自于磁盘阵列厂商有关“磁带已死”的论调。自从上世纪九十年代末由磁盘阵列厂商所发起的声势浩大的市场活动不断推动用磁盘替换磁带这一方式,例如具备重复数据删除功能的虚拟磁带设备,并且这似乎已经成功的撼动了购买者的观念和采购策略。

引用行业分析的最新报告:在2011年中部署的20EB+的外部磁盘存储中,超过半数的容量用以作为另一半的拷贝。在许多企业中,基于本地局域网(LAN)的镜像数量不断增加,原因就是通过基于WAN的数据复制技术,一项完全基于磁盘的数据保护方式,被阵列厂商吹捧为21世纪的数据保护之道。

虽然阵列到阵列镜像和复制技术对于某些数据而言确实是一种合适的数据保护方式,但并不适合于所有的数据。该结论源自这一事实:数据从支持应用和最终用户的业务流程中继承其重要性。而并非所有的业务流程都“总是”要求故障切换式的恢复策略,这是一种最为昂贵的恢复方式。基于WAN镜像似乎提供了很好的保护,但即使这样,这也不是绝对安全的数据保护方式。(见下文)

而从另一方面讲,磁带备份提供的有效性意味着其可以很好地保护那些不要求“总是”在线的服务。相比简单地将应用程序重新指向基于磁盘的存储,从磁带中恢复数据可能确实要花费更长的时间,但其大幅降低了成本,并且在许多情况下更为可靠。聪明的数据存储管理员会对镜像的阵列进行磁带备份,因为每年磁盘的故障率大致在7%到14%之间。数据保护通常需要混合的技术。

数据保护指南2:别幻想着基于WAN的复制技术

基于WAN的磁盘到磁盘复制策略只适用于消除了恢复时间目标(RTO)和恢复点目标(RPO)的无差异数据。而只要数据通过共享网络线路传输超过18公里,生产数据中心的数据状态同恢复数据中心的数据镜像之间的差异就一定会存在。

这其中的一部分应当归因于距离所产生的延时——通过WAN连接你可以多快地传输数据。据估计数据传输每隔100公里(62英里)的SONET连接,远程阵列距主站点的延时大约为12次SCSI操作。这是光速原理中的基本现象,我们可无法突破爱因斯坦的这一理论。

除了距离延时所造成的差异,还有“延迟抖动”,即由使用共享网络服务所产生的延迟。延迟抖动的影响可大可小,取决于主站点和备份站点的距离。尽管WAN传输有标准速率,不过一家加利福尼亚的公司在开发位于硅利康峡谷附近一个站点的数据复制方案时发现传速速率的不可预知性,变化范围从几秒钟到几个小时不等——这是由九家运营商网络之间互相路由所导致的。

结论:WAN服务的平均速率并无参考意义。处理器延迟或路由协议,到缓存拥挤和数据包重发的每项因素都会影响最终的传输速率。即便是能够支付得起OC-192线路的公司也要明白传输10TB的数据至少需要2个小时。这也就是为什么在两地间传输数据的最快方式仍旧是使用信鸽。(参考Google的“信鸽IP通讯”)

重复数据删除技术可能是降低WAN线路上所要传输数据的有效方式,不过这并不能使得数据在极度拥挤的信息通讯线路上传输得更快。

数据保护指南3:镜像很难测试

无论你通过WAN传输数据还是LAN来做镜像,这些数据保护方式另一项困难在于难以进行特别有效的测试。测试是灾难恢复规划中的一项长期开销,因此管理员应当寻求途径降低每年测试工作的负载,将整个数据保护场景的特定测试贯彻在整年中实施。

假如你想要验证在一个镜像配置中故障切换是否可行,你需要“中断”镜像过程,然后检查主站点和备份站点的数据存储内容。在LAN内部,这通常是一项痛苦的过程,要求(1)生产应用程序中断或暂时重定向;(2)所有的缓存数据写入连续性的卷中(磁盘内容进行复制);(3)数据全部复制到远端的磁盘上;(4)并且镜像流程自行停止;(5)开始比较流程,对比主站点和恢复站点卷上内容的差异。(6)并且始终同时,(6A)应用端的新数据(假如没有停止的话)需要被缓存起来,并且(6B)当镜像连接重新建立时,(7)数据存储再次同步。

上述这些流程中的困难点很好地说明了为什么测试很少进行。而一项没有经过测试的镜像很容易发生严重的恢复问题,甚至会影响相关人员的职务。

数据保护指南4:没钱?那就别当太空007

从实用性角度出发,镜像和WAN的复制都过于昂贵。磁盘阵列供应商似乎也是想通过将可行的镜像关系现在在同一厂商仅有的几个阵列型号中,从而将用户锁定。在异构存储基础基础架构中,这使得很多事情都变得非常复杂,从寻址到连线的配对,到镜像和管理基础架构和不断变化数据存储位置。

这同样也增加了数据保护的成本。举例来讲,在已经购买的通用虚拟磁带设备上内置专用的重复删除和复制软件所需的采购价格为每32TB 410,000美元,而每1TB SATA磁盘驱动器的价格约为4,000美元。为了复制该应用,还需要对同一设备进行二次拷贝。此外还要加上WAN线路的成本,以及用以长期固定恢复设备的目标系统宿主,再用最新的日元汇率换算下。就像Everett Dirksen说的“不久将来,你就发现这是真正需要花的钱了。”

这也阐释了另一个实际理由,为什么镜像和基于WAN的复制无法作为所有数据保护的方式:高成本。为了实现高效地数据保护,成本应当在可接受的范围内,并且用以衡量提供保护的方式和数据本身的重要性。资深的管理会涉及到财务管理,这时就需要关注这一部分并清楚地加以衡量,否则经费申请可能被拒。

数据保护指南5:考虑“深入地防御”

我们要认识到这一事实,当前的数据保护纲要需要深度的防御措施。数据能够防护由于应用或用户错误以及恶意软件或病毒攻击所造成的中断的丢失。此外,根据同心圆原理,防御措施要能够防止设备故障(参考Google“弗吉尼亚州联邦存储阵列2011年故障事故”)并且防止断电或破坏事故。

这三层的数据防护可以通过三种截然不同的技术实现,这些技术都必须可被管理并且可以在一整年中进行有效地测试。该目标的实现只有通过将数据保护服务从硬件上移除并且进入到公共存储虚拟化层。

将存储基础架构虚拟化可以使得你创建数据复制和镜像层,而无需担心被硬件厂商锁定,降低成本并提升可管理性。一个优秀的存储虚拟化引擎同样可以根据需要和数据及业务流程的重要性有选择地将数据保护服务分配到不同的应用数据上。

最后的想法:无论你选择何种“存储Hypervisor”,你需要确保你可以将磁带集成到你的整体方案中。记住索尼之前的建议“只有两种磁盘:出故障的和可以没有出故障的。“集成并管理多种保护技术是提升数据保护有效性的关键。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐