您现在的位置:TT存储 > 数据管理工具 > 如何精简数据

如何精简数据

2008-12-3    | |
打印本文章
RSS

导读:文章阐述了可以帮助企业简化数据备份和恢复的方法。究竟要采用哪种方法取决于企业的工作性质、公司规模、站点数量和公司需求等。

关键词:简化数据备份 恢复 数据净化 数据保护

正在加载数据...

  当企业开始进行数据净化时,无疑还将面临更大的挑战,比如如何制定更合理有效的留存政策,如何将无用的数据真正净化干净等。不过,企业至少应该明白,净化数据比将数据存档到廉价的磁盘上的可靠性更高,且成本更低。

  无疑,制定数据留存政策对于企业来说是非常棘手的任务,并且这项工作还会变得越来越困难。Zimmer就表示: “很多时候,我们不知道很多不同种类的数据应该保留多久。”Gartner为此提供了一份参考,在其最新的分析报告中指出,在制定数据留存规则时,减少数据量的关键在于“内容评估”的过程,而此过程包括内容的使用模式、内容的自然属性以及业务目的等因素。

  减少数据量最简单的方法就是删除自己不需要的数据,但这说起来容易,做起来却很难。实际上,除了电子邮件以外,大部分数据信息都不可能被轻易删除。“更何况,绝大部分的早期系统都没有提供数据净化的功能,而新的软件也很少提供这种功能。并且,删除这些数据也是十分复杂的过程。”Merryman表示。

  但是,如果企业抛开软件系统来看待这些数据的话,就会不知道该怎么办才好,并且企业也不希望将这些数据脱离软件。“不过,却很少有企业会为了数据留存方面的需求而调整自己的基础架构。”Merryman说。在纽约的一家银行里,有很多数据文件连扩展名都已经不知道是什么了,这些数据也不可能再通过现有的软件进行访问,却还一直保留着。

  此外,在数据净化的过程中的确还存在着一大隐患,就是不能保证可以删除某种数据集中的所有实例。“你可能会认为删除了自己过去所有的电子邮件就大功告成了,但是你却不知道,它们很可能还保存在企业的磁带上,事实上这些数据仍然存在。”ESG的Babineau说: “因此,很多企业认为,既然不能保证将所有的备份都删除,那就不去删除了,因为即使删除了这些数据,它们也很可能还在某个没人知道的地方保留着。”

  以现在企业的数据留存状态来看,净化数据令很多人望而却步,但是Merryman却并没有被困难吓倒,从制定净化策略开始,西卡罗莱纳大学开始了他们精简数据的进程。“不要在一开始就试图在很老的应用上净化数据。”Merryman建议说: “如果你面对的是高风险、高数据量的软件,那么你将会面临更大的危险; 如果你的目标是所有的应用程序,那你很可能永远也完成不了数据净化的任务。”

  此外,Merryman还提醒,不要忘了还有业务逻辑。“在层叠的存储环境中,在业务过程中净化数据比将数据存档到廉价的磁盘上的可靠性更高。”Merryman说,“永久保存和管理那些没有经过筛选和净化的数据需要极高的成本。”

  不过,现实情况是,大部分使用层叠存储结构的企业认为能够先存储数据,然后再进行净化。Merryman则表示: “这恰恰是数据净化的问题所在,就好像清理很久没去过的地下室一样,总是有点晚了。”因此,Merryman提出了这样的疑问,既然企业在保存数据上投了资,那么当企业不需要某些数据时,为什么不在销毁数据上也适当投资呢?

  四种方法精简数据备份过程

  很多方法可以帮助企业简化数据备份和恢复的过程。究竟要采用哪种方法取决于企业的工作性质、公司规模、站点数量和公司需求等。换句话说,没有哪种方法适合所有情况。企业首先应该看看自己的运作和数据归类情况,因为这些问题会影响到存储环境中的备份和数据留存策略。下面我们按自上而下的顺序给出一些建议,从影响大部分数据的问题开始,以更低的成本发挥更大的作用。

  方法1: 根据企业需求部署数据保护策略

  数据保护中最重要的一点就是确保数据的保护级别与企业需求相一致,包括数据种类、备份频率、数据保留时间以及其他影响服务级别的因素。数据保护的服务级别通常由恢复点目标(RPO)和恢复时间目标(RTO)衡量,这两大标准指定了允许丢失的数据量和数据恢复时间。当然,企业的目标并不是使RTO和RPO最小,而是使它们与企业需求相一致。

  一般情况下,针对不同的应用程序和数据种类,IT人员都提供相同级别的保护。但是,这种方法对企业的关键数据而言,保护级别太低了; 而对于不太重要的数据而言,保护级别又太高了,因为有一些数据需要的保护级别很低,甚至有一些根本不需要保护。因此,首先要弄清楚数据需要哪类保护级别,才有可能减少受保护数据的数量,实现为重要数据提供更高保护的同时而不增加成本。

  此外,采用更规范的数据留存策略将有助于简化备份和恢复的过程。有些企业就明确要求“每周对主目录数据进行五次完全备份”,但是,更多的企业却做不到这一点。

  方法2: 集中备份

  集中备份包括集中备份一个站点、几个站点、操作环境以及其他。审计备份和恢复过程应该关注整个企业,包括企业平台、应用程序、商业程序、商业小组等; 并减少或撤除远程站点的设备,尤其是那些仅用于备份的设备。在状况良好的情况下,诊断、维护和支持远程设备非常困难,而撤除设备则有助于简化整个数据保护过程。
  
  方法3: 采用基于磁盘的备份策略

  在备份过程中,企业把大部分时间都花在了磁带的管理上,包括加载、卸载、标记、将磁带迁移到异地以及取回旧磁带重新利用。而为了实现备份和恢复,在D2D2T架构中,企业通常将磁盘存储部署成VTL或磁盘缓存。因为磁盘阵列技术提供了即时的数据复本,也可以在恢复中被采用。不过,现在,保证应用程序与数据复本的一致性,已经成为了一个非常困难的问题,很多供应商都在提供相应的技术来解决这个问题。这些技术虽然能提高备份速度,尤其是恢复速度,但却往往忽略了一个更大的问题,即如何判断应该备份哪些数据或多久备份一次数据。

  方法4: 考虑备份服务

  企业也可以考虑采用在线备份工具。对于小于1TB的备份组,这种方法可供选择。而对于更大容量的数据组,在线备份就是很好的选择,但同时需要考虑变化速率、连接速度等问题。通常,具有大型数据中心的企业或者IT人员较少的企业会发现,在线备份是很好的选择。

来源:计世网    
  评论
 
CommVault这本战略白皮书旨在提供指导和简单方法,帮助用户以一种更加有利于技术主管和业务主管两方面的方式,制定信息管理战略。
 
TechTarget中国于近日对邮件归档软件厂商MessageSolution进行了专访,了解诸多当前用户对邮件归档的应用状况以及邮件归档与OA无缝集成的新型归档产品。
 
恢复服务提供商(RSP)Simply Continuous昨天发布了面向中端市场的数据和应用程序恢复服务。新服务包括Data Recovery Vault(数据方面)和AppAlive(应用方面)两款。
 
ALSP的Kevin Carr给我提了一些关于加快电子发现审核过程的速度的好建议。他认为成功有四个主要因素:技术、报告、过程和人。
 
Compellent的软件应用包括精简配置,远程复制和自动化的分层存储,可以配合ASM实现Oracle数据更容易被访问、复制和相对于传统存储方案的更为快速的动态扩展。
这本技术手册介绍硬盘扇区(块)大小和文件系统分配单元(块)大小的区别。 
不恰当的磁带存储操作常常会导致数据丢失。灰尘,猛然撞击和高温只是导致磁带不能读取的一部分原因。因此,磁带操作和磁带管理非常重要,在实际工作中需要特别注意。
由于法规所要求的数据的存储和保留,数据增长不可避免。当备份的数据被删除时,它们真的找不会来了吗?数据销毁是什么,怎样进行?
最新更新
专家答疑
技巧
钟富钧
问:在Windows Server 2003或Windows XP下,为什么由QSAN控制器组成的磁盘不能从基本转换成动态?
Jeff Boles
问:什么存储刀片?为什么存储刀片是一项好的技术选择?答:今天我们发现很多用户在经济危机时期采用刀片服务器,这是非常好的解决方案……
Curtis Breville
问:磁带写完后应该怎样保存? 答:使用磁带防护罩是有必要的。把磁带放到了防护罩里以后,确保磁带防护罩放在合适的、气候环境可控的环境里。

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
登录Email
请输入您的登录Email
密码
下次自动登录