信息检索技术在数据中心业务管理系统中的应用

论文价格:免费 论文用途:其他 编辑:jiuzhiqin 点击次数:116
论文字数:47500 论文编号:sb201209211159493041 日期:2012-09-21 来源:硕博论文网

伴随着网络业务的日益增长,数据中心管理与维护任务也就越来越多。因此,数据中心管理人员面临的当务之急是如何有效地进行数据中心业务管理,提高效率和安全性,获得更好的业务成效。本文首先在论述数据中心及其管理系统的发展现状的基础上,对数据中心业务管理系统应具有的功能及其系统组成进行了分析和研究。接着阐述了信息检索技术的起源与发展、中文分词方法、检索模型、倒排索引机制、检索过程、评价指标等相关知识。之后根据数据中心业务管理系统的需求分析,详细阐述了系统的业务流程、功能设计和数据库设计。基于对信息检索技术的研究,根据数据中心业务管理系统用户对业务管理知识检索的需求,以工程师曰志为数据源,设计了业务管理信息检索子系统。最后,从业务管理信息检索子系统和其他子系统两个方面对数据中心业务管理系统的予以实现。本文的业务管理信息检索子系统在木数据中心业务管理信息检索方面比通用搜索引擎有更强的针对性和准确度,具有一定的实用价值。

1引言

信息检索是随着科技工作的开展而产生,伴随着科学技术的发展和人类各类信息数量的剧增,信息检索研究逐渐深入。英国科学家詹姆斯-马丁曾经指出:在十九世纪中,人类所掌握到的科学文化知识每隔五十年增加一倍,在二十世纪中期,每十年增加一倍,然而在二十世纪七十年代就已经是每五年增加一倍;同时,出现了信息量剧增、信息分散和引用频繁等现象,人类生产信息的能力远远超过了处理和组织信息的能力,因此产生了信息爆炸。所以,在学习和研究过程中,人们越来越希望准确而迅速地从浩如烟海的信息中查找到所需要的资料,信息检索技术的战略地位也就得到了日益提高(孙建军等,2004)。

1.1选题背景

1.1.1IDC互联网数据中心

随着互联网技术的发展,互联网数据中心(Internet Data Center,缩写IDC)业务也随之而出现。互联网数据中心的网络设备通常放置在高标准的机房或数据中心中,它们对室内温度、湿度等条件都有严格的要求。数据中心内部的网络与多条骨千网连接,其主要业务就是向各企事业单位提供存储空间、带宽和各种增殖业务,并且提供优质服务的系统总称(罗文雄等,2005)。数据中心,正在从过去基于大型通用计算机的可预测性、可控制性时代,逐渐向基于Internet和电子商务的、具有网络计算环境开放性、快捷性的数据中心IDC进化。从60年代到现在,IT经历了"集中-分散-再集中"的历程,数据中心的结构、功能,也同步发生了相应的进化。

1.2选题的目的和意义

随着信息技术的快速发展,各行各业都在推动信息化进程,各个行业都在大规模建设信息系统以满足业务和市场需要。数据中心是用来支撑各个信息系统应用的平台,因此,只有加强数据中心的建设和维护工作,才能不断提高信息服务能力和服务质量。许多行业花费大量的人力、物力专注于对具体技术的投入,却忽视了对数据中心的合理定位,造成事倍功半的结局。

2信息检索技术的硏究

2.1信息检索概述

信息检索(Information Retrieval)指的是按照相应的查询条件在对应的信息集合中筛选出比较符合的信息子集合,然后对其进行排序显示。一个完整的信息检索的过程分为信息的存储与组织、信息的检索和信息的展示三个步骤。(苏新宁,2004)。目前,对文本检索模型的研究主要是两个方向:基于语义的检索和基于统计的检索。比较经典的文字信息检索模型有布尔模型(BooleanModel)、向量空间模型(Vector Space Model)和概率模型(Probabilistic Model)等(刘挺等,2008)。

2.4倒排索引机制

在word、txt等文档中查找,其方法是通过线性匹配驻留在内存中的文本实现的,进行顺序查找。该方法,不需要对文档进行预处理操作。因此,顺序查找

只适用于文档较少的检索,或者是内存经常变化或内存不足,没有足够的存储空间来支持索引。传统查找的优点是容易实现,其不足之处是信息检索速度比较慢。

2.4.1倒排索引的定义

实际上,倒排索引就是将文档中的关键字(词)切分出来,并将其保存在索引中。因此,实际上,倒排索引是一种面向单词的索引机制,一般由关键字(词)和在文档中出现的情况两部分组成。在倒排索引机制中,每个关键字(词)都有一个相应的位置列表,用来记录该关键字在所有文档中出现的位置和频度。数据中心业务管理系统涉及到业务管理的方方面面,由于时问和本人的能力有限,本文设计的数据中心业务管理系统还存在着很多需要改进的空间,在许多功能方面还有待挖掘。从实用和技术的角度来看,数据中心业务管理系统以后需

3数据中心业务管理系统的设计………………………………………………22

3.1系统设计………………………………………………  22

3.2系统功能介绍………………………………………………27

4数据中心业务管理系统的实现………………………………………………38

4.1业务管理信息检索子系统的实现………………………………………………38

4.2业务管理其它子系统的实现………………………………………………45

要在以下几个方面进行改进:

(1)   进一步实现查询扩展和查询推荐功能,进一步方便用户进行业务管理知识的信息检索操作。

(2)   实现相关反馈机制,进一步改善检索信息的效果。用户隐性偏好挖掘,

记录系统用户输入的关键词和检索之后的浏览行为(例如浏览次数,浏览时间等),对其进行统计分析处理,挖掘用户的实际检索意图,根据用户兴趣来设定关键词的权值,最后按照检索结果排名。

(3)   业务管理系统信息安全机制的进一步加强。随着数据中心业务量的发展,业务管理系统的数据量也随之剧增,因此,今后系统的重点工作是保证数据中心业务管理各种信息和数据安全。

 ''以上是本系统下一步需要解决的问题,也是今后的需要进一步努力改进的方向。随着数据中心业务的进一步发展,相信在不远的将来更加先进的信息检索技术会进一步地应用到数据中心业务管理系统的开发工作中。

 


QQ 1429724474 电话 18964107217