RSS订阅
RSS订阅TT存储

购买数据分类工具的注意事项

2008-10-24  选择字号:  | |
打印本文章

导读:数据分类工作需要双管齐下。公司必须先了解其应用程序和数据的价值,才能以合适的服务级别存储和保护数据,文章讲解在购买分层存储时需要考虑哪些问题。

关键词:数据分类 分层存储 数据分类工具

正在加载数据... 【TechTarget中国原创】数据分类工作需要双管齐下。公司必须先了解其应用程序和数据的价值,才能以合适的服务级别存储和保护数据。事实上,数据分类就是根据存储结构调整企业程序。听起来很容易,其实很难,原因在于公司无法准确定位所有数据,也就无法正确分类或明确数据的商业价值。数据分类工具可以克服这些障碍:帮助企业找出数据,然后根据用户定义的规则重新定位数据。数据分类以后,许多工具可以将数据移动或者迁移到合适的存储子系统中。

【TechTarget中国原创】数据分类工作需要双管齐下。公司必须先了解其应用程序和数据的价值,才能以合适的服务级别存储和保护数据。事实上,数据分类就是根据存储结构调整企业程序。听起来很容易,其实很难,原因在于公司无法准确定位所有数据,也就无法正确分类或明确数据的商业价值。数据分类工具可以克服这些障碍:帮助企业找出数据,然后根据用户定义的规则重新定位数据。数据分类以后,许多工具可以将数据移动或者迁移到合适的存储子系统中。

  数据分类工作不能仅由IT人员完成。只有了解数据的商业价值,才能准确无误地将数据分类,这需要法律、生产、人力资源、金融等业务部门的积极参与。首先,应在纸上列出数据分类过程,然后由分类工具高效、自动地完成分类任务。

  市场上可供选择的数据分类工具多种多样,每种都具备索引、查找、策略管理和迁移等功能。在阅读下文列举的数据分类工具购买标准之前,你应该回想一下在购买分层存储时需要考虑哪些问题。列举了应考虑的事项以后,你就会发现许多说明书都能帮助你比较Abrevity、EMC Corp、Index Engines、StoredIQ等供应商的数据分类工具。

  分类工具支持哪些文件类型?一旦你清楚地了解需要支持多少种文件类型,就选择的数据分类工具就应该能处理这么多种文件类型。同理,选择的工具应该完全支持结构化和非结构化数据。有些工具只能处理结构化数据或非结构化数据,或者只是针对某种特定的应用程序(如数据库),就无法满足你的长远需求。大多数工具能同时处理结构化和非结构化文件阵列。例如,Abrevity公司的FileData Classifier软件能处理上百种文件类型,其中包括微软的Office文件、PDF文件、电子邮件、SQL或Access等数据库,以及各种图像文件。否则,有些文件就得不到分类,也就无法正确存储。

  分类工具如何支持规则集和自动化?所有的数据分类工具都会依赖一组规则来驱动分类引擎。早期的数据分类工具依靠公司内置的规则集,不过目前大多数工具能够输入既定的规则集(例如,支持医疗或法律行业)。你应该判断修改或者使用既定规则集,能否满足你的具体需求。例如,Arkivio公司的自动存储(auto-stor)产品包含标准分类目录,但是当需求变化时,可以改变类别或者增加类别。并非所有情况下都能实现手动分类。Kazeon Systems公司的信息服务器(Information Server)允许用户和管理员对某种文件(由搜索引擎或报告决定)实行手动分类,而EMC公司的Infoscape则不支持手动分类功能。

  分类工具支持分层存储和数据迁移吗?高达20%的企业数据没有受到足够保护。企业在服务级别上无法获取这些数据,因此需要很长时间才能恢复这些数据。相反,高达60%的数据受到过度保护——这些数据保存在价格不菲的存储中,复制次数远远大于其商业价值。这就会导致存储成本过高。寻找能够在存储层之间迁移数据的分类工具,这样各种类型的数据在分类以后都能获得合适的服务级别。这么做技能维持存储性能,又能降低成本。如果分类工具不具有数据迁移功能,就应该确保该工具支持第三方数据迁移器。请注意:由于迁移中的数据会与其它存储竞争网络流量,因此迁移过程在一定程度上会影响网络性能。

  分类工具的性能和扩展性如何?大企业可能需要分类和迁移几百万甚至几十亿的文件。数据分类工具支持的文件数量通常有一定的限度,因此应选择数据量符合要求、而性能水平又不逊色的工具。接下来就应了解分类工具如何从文件数量和规模方面处理数据。一些工具可能善于处理大量的小型文件,另一些则可能适合处理少量的大型文件。数据量会快速增长,因此分类工具应能满足未来数据卷的需求。

  分类工具的异构水平如何?数据分类工具必须与存储环境中的其它平台相互作用。例如,如果数据分类工具没有迁移功能,就需要与其它策略管理器或数据迁移器一起工作。同时,分类工具应支持现有的存储平台。如果你的数据分布在三个不同的存储系统中,那么分类工具就需要同时与三个系统兼容,才能进入系统完成工作;否则,分类工具就无法完全实现价值。建议在实验室进行测试,验证性能和互操作性。


采购产品必备
 购买光纤通道HBA产品的注意事项
 购买容量规划工具的注意事项
 购买SRM工具需考虑的注意事项
 购买中端阵列的注意事项
 购买高端存储阵列的注意事项
 购买NAS产品时要考虑的问题
 购买数据分类工具的注意事项
 数据迁移工具的购买标准
 购买磁带库之前向供应商咨询的十个问题
 SaaS存储服务会减少存储设备总数和购买的存储容量吗?
 SaaS购买技巧
 购买VTL之前需考虑六个问题
 购买电子邮件归档产品的关键
 购买NAS管理软件需要考虑的因素

还没有登录? 阅读全文请先登录或注册
用户名:(请填写您的E-mail做为登录账号)
  • 获取最新的IT业界资讯、市场动态、行业趋势等独家原创内容。
  • 分享国内外技术专业人士提供的技巧经验。
  • 利用专注IT的技术资源中心,不断更新专业知识。
  • 享受白皮书、Webcast等系列特色增值服务。
  • 免费参加TT中国举办的各种会员活动。
  • 更多的精彩服务,在不断开发中……
用户名:(请填写您的E-mail)
密 码:
 永久登录
请输入您的登录email:
分层存储(Tiered Storage)是指为不同类型的存储介质分配不同类别的数据,借此提高存储效率,减少总体拥有成本……
存储类别不同决定了价钱的不同。例如,今年你可以花120/gigabyte美元买到高速,高可用性存储系统,你也可以花7美元/gigabyte买到一个速度较低,可用性稍差一点的ATA盘……
对于信息生命周期管理(ILM)能够节约资金的说法,我已经十分厌倦。如果没有合理地部署分层存储,则可能增加成本。我们来讨论分层存储可能遇到的一些问题。
市场上可供选择的数据分类工具多种多样,每种都具备索引、查找、迁移等功能。那么数据分类工具购买标准是什么呢?
迁移数据其实就是移动数据:从文件夹、分割区、磁盘或磁盘子系统提取数据,放入其它的物理站点。大多数情况下,迁移数据是为了执行数据分类措施,实现分层存储。

2009年对于备份来说是关键的一年。预算在减少,但是备份的数据总量却在增长。新趋势像重复数据删除使它更具有吸引力。在常见系统中,数据备份最多使用的是读写操作;通常,备份问题在影响日常操作之前,都会显现一定的征兆。因此我们总结了2008年最受欢迎的备份技巧,希望可以给大家一些帮助。

存储区域网络(SAN)和网络附属存储(NAS)在网络存储中的支柱作用毋庸置疑,但是直接附属存储(DAS)依然盛行,即使在企业中也是如此。TechTarget专家将深入DAS在企业中的应用以及在应用过程中遇到的问题。

对于整个存储解决方案来说,交换机固然是存储网络环节中极为重要的一部分,但是HBA卡也是其中不可或缺的一环,甚至可以说HBA卡性能的高低直接决定了网络的整体性能。所以什么是总机总线适配器呢,在购买时要注意什么问题呢,以及在升级的过程中该注意什么问题呢? TechTarget专家将深入给我们讲解总机总线适配器(HBA)。
最新更新
专家答疑
技巧
Randy Kerns
我有一个客户,他想把1TB左右的存储加在他们的网络上。我想用HP DL380和MSA30以及300GB的磁盘。网络中NAS和DAS的性能有什么不同呢?
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……