多Agent信息智能搜索机制探究——面向工程监理

论文价格:免费 论文用途:其他 编辑:ya6310 点击次数:54
论文字数:2049 论文编号:sb201211221517514417 日期:2012-11-23 来源:硕博论文网

第一章 绪论


1.课题的研究目标

1.合理的组织搭建面向特定行业的专业化 Multi-Agent 智能信息检索模型。以保持大量的已有实践经验数据之间的关联,便于从多维度对其进行组织和分析。数据模型应该能够很好地支持已有实践经验的重用,和相关信息的获取与储存。实现信息的智能化检索。
2.方便地组织实践经验的获取和传播,促进行业相关数据的积累以及在相关人员间的传播、共享和重用,为具有多样性和动态性人员的知识需求提供智能的辅助支持。
3.有效的组织浏览与检索。便于人员对历史有用信息的浏览, 获得与需求高度相关的检索结果,从而促进项目技术方案的确定、项目中具体问题的及时解决。


2.课题的研究内容
本文的主要研究内容为如何对特定行业中不同结构,不同格式的历史数据建立通用数据模型,以达到信息智能检索模型对数据的操作要求,以及研究整个行业内部既可以信息高度共享,又可以方便高效的查询、借鉴历史资料信息的智能检索架构,最重要的部分是检索模型中所研究的检索机制,检索方法及其实现,以及数据过滤方式。具体的说有以下内容:
1.针对专业化信息智能检索的要求,结合现有的研究成果,研究出一个采用基于B/S 三层架构的布局、多个智能 Agent 模块共同协作、引入多个辅助功能模块、能够比较有效的解决实际应用问题的信息智能检索机制。
2.找到一个能够有效组织专业化检索中面临的结构不同、形式多样、格式不统一的数据源的方法,建立起行业内部通用的数据模型,实现信息智能检索模型对资源数据的“理解”和“操作”。
3.探索出一个可以在现有技术的基础上进行改进的,能够较好解决当前信息搜索引擎中信息冗余量大、匹配精度低问题的核心算法。
4.为了提高信息智能检索模型的检索精度,探索数据过滤机制,完善整个模型的检索流程。


第二章 几种经典的信息检索模型


在信息智能检索领域决定一个模型或者是系统成功与否有两个关键的因素一个是算法的设计和搭配,另一个是模型的整个检索机制。目前主流的检索模型主要有布尔检索模型、向量空间检索模型、概率模型和逻辑模型。信息检索的经典模型认为, 每篇文献可以用一组有代表性的关键词即标引词集合来描述,标引词(index term)是文献中的词,其语义可以帮助理解文献的主题,因此标引词常用于编制索引和概括文献的内容。ik 表示标引词, dj表示文献,,0i jw ≥ 为二元组( ki,jd )的权值,该权值可以用来衡量描述文献语义内容的标引词的重要性。用 t 表示系统中标引词的数目,ik 表示标引词,1 2 tk = {k , k , ,k  }是所有标引词的集合,i jw0,是文献dj中标引词ki的权值,对于没有出现在文献文本中的标引词,其权值,0i jw = 。文献jd 可以用标引词向量jd 来表示;j 1, j 2, j t ,jd =(w ,w , ,w ),此外,函数gi用以返回任何 t 维向量中标引词ki的权值,即i j i ,jg(d )=w 。


第三章 智能检索模型框架及机制研究...............................................................11
3.1 模型整体布局.................................................................................... 11
3.1.1 整体结构........................................................................................ 12
3.1.2 功能模块的详细划分.................................................................. 12
3.2 分词器和专业词库........................................................... 13
3.2.1 分词器简介....................................................................................... 13
3.2.2 分词器研究现状................................................................... 13
3.2.3 专业词库的介绍.............................................................................. 14
3.3 构建通用数据模型...................................................................................... 14
3.3.1 规范化和格式化行业数据资料........................................................... 14
3.3.2 数据的精细化存储........................................................................ 18
3.4 模型中各个 Agent 的通信 ....................................................................... 19
3.4.1 通信语言........................................................................ 20
3.4.2 通信方式.................................................................... 22
第四章 智能信息检索方法研究及实现.......................................................24
4.1 检索 Agent 的核心算法 ............................................................................ 24
4.1.1 朴素贝叶斯分类器............................................................................. 24
4.1.2 优化的向量空间法.............................................................. 26
4.2 数据过滤................................................................................. 28
4.2.1 信息过滤的发展............................................................... 29
4.2.2 信息过滤的方式....................................................................... 29
4.2.3 信息过滤的算法.......................................................................... 29
4.2.4 检索过程........................................................... 31
4.3 模型学习训练........................................................................................... 31
4.3.1 Agent 的学习内容 .................................................................. 32
4.3.2 学习方法............................................................................. 32
4.3.3 学习过程............................................................... 33
第五章 模型在工程监理行业的应用与展望..........................................35
5.1 系统架构设计................................................................................ 35
5.2 系统实现过程..................................................................................... 36
5.2.1 数据处理......................................................................................... 36
5.2.2 数据库的设计与实现..................................................................... 37
5.2.3 系统数据取样、测试效果......................................................... 38


结论


论文虽然已经基本上完成了预期指标,但是由于智能检索机制研究中涉及到的理论知识比较广泛,在 CE-BVSM 模型的理论支撑下,根据黑龙江省中铁建设监理有限责任公司的实际项目需求,在 CE-BVSM 模型的理论支撑下,根据黑龙江省中铁建设监理有限责任公司的实际项目需求,搭建了面向监理行业的信息智能检索模型,取得了较好地应用效果,为该单位的进一步发展提供了有力的支持搭建了面向监理行业的信息智能检索模型,取得了较好地应用效果,为该单位的进一步发展提供了有力的支持。而且需要深入研究的内容比较多,因此本文中所研究的机制还有待于的深入探讨和细化。例如:
(1) 整个系统的动态适应性需要进一步的提高,以适应时时更新的信息数据资源和不断变化的用户查询需求。
(2)完善智能信息检索算法精度的训练、提高检索的精度。
(3)强化信息智能过滤功能,提高检索的准确率。认真研究分类器与检索 Agent 的配合使用上的先后顺序问题来提高检索的查全率。
(4)进行模型的通用性扩展研究。


QQ 1429724474 电话 18964107217