第一章绪论
随着手机等移动设备的普及和智能化,自然语言处理,语音识别技术以及语音合成技术的发展,人们通过对话方式获取信息和服务成为发展趋势,这一发展导致了对话系统的产生。对话系统就其本质而言也就是信息检索系统,其本质就是为用户提交的查询语句或关键字检索结果。对话系统是在信息检索系统的基础上进行改进和延伸,查询关键字输入方法由键盘输入改为语音输入,并将查询结果排序整合后返回给用户,在交互过程中给用户人机对话的感觉,增强了用户体验。近几年,对话系统成为了工业界以及学术界的研究热点。工业界需要幵发能真实服务于广大用户的对话系统,但是,由于对话系统的开发周期长,开发费用高,加之以用户是千差外别的,使对话系统的开发受到严重阻碍。如何构建对话系统,使其在经济实用的前提下满足不同用户的需求?如何设计具有任务独立性、支持快速迁移有良好的可扩展性的系统架构?这一系列问题都是值得研究和探讨的学术问题。针对以上问题,本文就图像检索系统中检索结果可视化处理、用户导航方法以及构建具有任务独立性、有良好错误处理能力的对话系统对话管理方法进行设计和实现。
............
第二章相关背景知识及问题描述
2.1检索结果可视化方法
一种常用的检索结果可视化方法是检索结果聚类显示法,基于聚类的方法是利用聚类技术,将检索结果划分为不同类目,并为每个簇选取具有代表性的标签用户可以通过点击对自己有吸引力的标签,查看该类目下的检索结果,从而快速定位到自己需要的信息。该方法可以分为两类:基于文档聚类的方法,利用聚类技术,将搜索引擎返回的检索结果文档聚类为多个簇,然后从各个族中抽取合适的标签(通常为一个具有代表性的短语或者单词)来表示或标注各个类别。这种方法产生的标签可读性性比较差,导致即使聚类方法本身性能很好,但是用户还是很难识别出符合自己需求的条目,用户体验较差,所以将算法进行改进,产生了第二类算法。基于标签聚类的方法,该算法与第一类算法流程相反,由于聚类标签的重要性,首先若干具有代表性的词、短语或者片段从搜索引擎返回的结果列表中被抽取出作为候选类别标签,然后对候选标签做进一步的评价和蹄选,并以这些标签为基础进行文档聚类工作。
2.2标签云
标签云也被称为文字云是对关键词、标签的视觉化描述。标签一般是独立的词汇,通常是用户提供的标注信息,或者是在网页中提取的关键词。各个标签可以按重要性次序、字母次序、随机次序等方式排列,其重要程度可以通过字体大小、颜色来表现。大多数标签云中的标签以超链接的形式存在,用户可以通过点击某一标签查看与其相关联的条目。最初标签云常用于各类社交网站、个人站点或公司网站形式化的显示用户生成的标签或网站的文字内容。随着技术发展,在知识管理、学科导航以及个性化推荐方面也有越来越多的应用。最近标签云被应用于搜索引擎,用于展示检索结果架构。
第三章基于视觉标签云的图像检索结果可视化方法.....17
3.1引言........17
3.2视觉标签云构建算法........18
第四章具有信息独立性的智能对话管理策略...........34
4.1引言..........34
4.2对话管理策略..........36
第五章总结与展望.............55
第四章具有信息独立性的智能对话管理策略
4.1引言
现有的对话系统大多围绕语音识别,自然语言理解,对话管理,自然语言生成以及语音合成这五个关键模块进行设计和开发。语音识别模块负责接收用户的语音信号,产生一系列的文本识别假设,然后传递到自然语言理解模块生成具有语义信息的格式化表达式,该表达式被传递到对话管理模块,对话管理模块根据当前输入以及对话上下文产生下一个交互行为。自然语言生成模块接收到对话管理模块指令后产生相应的文本信息并交由语音合成模块转化为语音输出。该要求是最基本要求。好的对话系统不仅仅是按部就班的完成用户任务,而是在任务过程中通过与用户不断协商,帮助用户明确需求,提供查询建议,以取得更精确的结果。
4.2对话管理策略
知识库表示是构建知识库的核心,利用面向对象的描述方法,将知识及作用于知识上的处理方法(包括输入、输出处理方法等)封装为独立单元。使用该方法构建知识库架构具有两大优势:封装性,知识被封装为独立单元,每个知识对象就是被封装的数据信息和对这些数据可进行的操作。面向对象设计中的封装性有效地将对象的内部实现和外部操作分开,有效实现保密性。继承性,面向对象的继承性可有效实现父类和子类间数据共享,有利于保持数据一致性,同时还保证子类的私有变量和操作独立性。以上两个优势实现了知识和封装以及模块独立化,使知识库便于维护、扩充和迁移。将各个知识模块化后,使用主题树来描述每个任务包含的各项知识以及知识间的逻辑关系。主题树的主要任务是处理对话控制逻辑中任务相关知识,它根据任务场景知识来构建对话控制议程,是针对交互任务设计的一个层次化的计划体。更确切的说,主题树由树形的对话节点组成,其中每一个节点负责处理对话的一个子单元,节点间层次关系描述了各个功能之间的关系。
.........
第五章总结与展望
在实验中,本文使用了面向机票、火车票和酒店查询及预订的旅行助手项目日志数据集。利用事务处理成功度、平均交互轮数、错误触发率和平均错误恢复率等测评指标全面的对对话控制策略和容错模型进行了评测。通过与已有的算法如,进行比较发现加入了UIA的对话控制策略具有更高的任务处理成功度,4-MDP容错模型具有更好的错误恢复效果。此外,本文还实现了基于关键字匹配和问句相似度计算的任务主题相关语料挖掘算法和实验结果。实践证明该工具产生的语料可以有效的帮助幵发人员生成对话系统提示,减少人工工作量,针对同一问题产生多种提问方式,有效增加用户在交互过程中的新鲜感和智能体验。
...........
参考文献(略)