如何高效率地查询数据

2009-1-7    | |
打印本文章
RSS

导读:文章讲解了要想实现全方位的内容查询,有两点关键技术必须突破,一是要有高效的、针对海量数据的全文索引,另一方面就是要能对不同介质的存储进行虚拟化管理。

关键词:内容查询 全文索引 虚拟化管理 数据管理 CommVault

正在加载数据...

  今时今日,众多企业在数据管理中所面临的主要挑战之一是如何从海量数据中获得更多的价值,尤其是从企业自身一点一滴辛苦积累起来的数据中获取价值。为了应对这个问题,近年来,很多公司都在信息技术系统上进行了巨额投资。但是,很多情况下种瓜未必得瓜,不菲的投入并未能给企业客户带来应有的回报――一些企业随着业务量和数据量的逐年增大,内部出现了数据混乱的局面:谁也不知道整个公司的信息系统中存放了多少数据,这些数据又具体存在哪个系统,其中又有多少数据间存在冲突……至于是否存在未经授权就使用数据的情况就更不得而知了。IT经理们也经常抱怨:“企业内部的数据越来越多,每个信息系统里都有大量的数据,但若要从这些系统里寻找想要的数据,则难如大海捞针。”花了大价钱进行IT系统建设,到头来却出现找不着信息的尴尬局面,不能不引起深思。

  保护好数据和及时方便地搜索到所需信息是信息管理的两个重要方面。我们都已经习惯在网上用Google来查询一些资料,只要简单输入关键字,就能得到相关的信息。可是当我们面对在线的生产系统或离线的保护数据时,就没那么幸运了。经常会遇到这样的情况:当需要查询某一文档时,既不知道文件名,又不知道文件产生的时间,只知道文件相关内容,在这种情况下,怎么查?如果该文档还存在于在线生产系统中,也许还有办法;但如果该文件在某种离线的数据保护介质上,如磁带,也许就不那么好办了。传统的数据管理系统由于技术的局限性,是没办法处理这种问题的。

  新一代的数据管理软件使解决这一难题出现了希望的曙光。其实,只要对在线生产数据和离线保护数据建立内容索引,通过内容索引,用户就能查询到在线数据、离线备份数据、归档数据副本中的文档。表面上看,这种技术并不复杂,但真要实现这一功能却并不容易。原因是我们面对的是海量的非结构化数据,再加上多种文件格式,如:Word、PDF、Excel等,还要考虑到多个版本,如此种种,事情就没那么简单了!

  要想实现全方位的内容查询,有两点关键技术必须突破,一是要有高效的、针对海量数据的全文索引,另一方面就是要能对不同介质的存储进行虚拟化管理。目前主流的存储介质有三类:磁盘、磁带和光盘,这些不同类型的介质所构成的存储设备环境的特性是不一样的。在多层存储架构中,我们一般会用磁盘来做近线存储,数据保留周期在一年以内;通常会利用磁带来做离线存储,数据保留周期在三至七年;利用光盘来做归档存储,数据保留永久。在这种分层的存储架构下,数据因时间的推移会被迁移,因此内容索引机制不仅要能跟踪数据的迁移,而且对数据的存取也必须能跨越不同的存储,也就是说能对存储进行虚拟化管理,用户只需要利用逻辑的查找界面,就能发现并读取所需要的数据和文件,而不必关心数据存放在何种介质的设备上。

搜索平台

  全方位的内容查询就是能对当前数据、历史数据,能对在线存储、离线存储,能对复制数据、备份数据和归档数据,能对不同应用软件产生的不同格式的数据进行全方位的查询。这是一个美好的目标,堪称数据管理的更高境界!

  作为数据管理应用软件供应商,CommVault为业界带来了一体化的搜索平台,通过对在线、离线数据建立统一的索引,快速定位任何数据副本所在的物理位置,不管该文件是在磁盘或磁带上,实现全方位的数据搜索。CommVault最新数据管理软件Simpana 7.0就包含了“全方位数据查询”这一卓越功能。这一功能主要为两类用户设计:从事法律调查取证的专业用户,以及一般的企业用户。针对两者不同的管理权限,Simpana也通过两种截然不同的方式帮助他们从杂乱的“故纸堆”中立刻找到所需信息:

  法规遵循用户搜索——以往要从庞大的数据集中找出蛛丝马迹,对于从事法律调查取证的用户来说,是最令人头痛的。Simpana 7.0的出现让这一问题迎刃而解。在一个统一的界面上,特许用户获得高级数据访问权,通过迅捷的数据查找,大大提高了搜索备份和存档数据的能力,从而能积极响应各类政策法规的调查取证要求。

  企业用户搜索——使用CommVault的自助搜索功能,用户通过一个类似“google”的搜索界面就能立即使用原本被锁定于备份或存档副本中的数据。键入一个关键词或短语,所有与关键词有关的搜索结果条目在几秒之内呈现出来。

来源:CommVault    作者:CommVault    
  评论
 
CommVault这本战略白皮书旨在提供指导和简单方法,帮助用户以一种更加有利于技术主管和业务主管两方面的方式,制定信息管理战略。
 
TechTarget中国于近日对邮件归档软件厂商MessageSolution进行了专访,了解诸多当前用户对邮件归档的应用状况以及邮件归档与OA无缝集成的新型归档产品。
 
恢复服务提供商(RSP)Simply Continuous昨天发布了面向中端市场的数据和应用程序恢复服务。新服务包括Data Recovery Vault(数据方面)和AppAlive(应用方面)两款。
 
ALSP的Kevin Carr给我提了一些关于加快电子发现审核过程的速度的好建议。他认为成功有四个主要因素:技术、报告、过程和人。
 
Compellent的软件应用包括精简配置,远程复制和自动化的分层存储,可以配合ASM实现Oracle数据更容易被访问、复制和相对于传统存储方案的更为快速的动态扩展。
这本技术手册介绍硬盘扇区(块)大小和文件系统分配单元(块)大小的区别。 
不恰当的磁带存储操作常常会导致数据丢失。灰尘,猛然撞击和高温只是导致磁带不能读取的一部分原因。因此,磁带操作和磁带管理非常重要,在实际工作中需要特别注意。
由于法规所要求的数据的存储和保留,数据增长不可避免。当备份的数据被删除时,它们真的找不会来了吗?数据销毁是什么,怎样进行?
最新更新
专家答疑
技巧
钟富钧
问:在Windows Server 2003或Windows XP下,为什么由QSAN控制器组成的磁盘不能从基本转换成动态?
Jeff Boles
问:什么存储刀片?为什么存储刀片是一项好的技术选择?答:今天我们发现很多用户在经济危机时期采用刀片服务器,这是非常好的解决方案……
Curtis Breville
问:磁带写完后应该怎样保存? 答:使用磁带防护罩是有必要的。把磁带放到了防护罩里以后,确保磁带防护罩放在合适的、气候环境可控的环境里。

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
登录Email
请输入您的登录Email
密码
下次自动登录