绪论
1.1课题研究
内容本论文主要对数字图书馆、信息检索的定义及应用范围进行研究;对Ontology技术和个性化技术的定义以及分类进行分析研究,并与数字图书馆的信息检索方面进行紧密结合,实现专业、方便、快捷、个性化的信息检索。具体内容如卞:
1. 数字图书馆的信息检索服务机制、特性的研究;
2. Ontology技术的研究与应用;
3. 个性化信息检索技术的研究;
4. Ontology技术与个性化技术在数字图书馆的检索系统中的应用;
5. 基于Ontology、个性化技术构建数字图书馆的检索模型。
1.2课题背景
在进入二十世纪九十年代后,网络技术和计算机技术的飞速发展,.影响了旧有的各行各业的服务模式和发展方向。涌现出数字化图书馆、数字化校园、数字化城市以及数字化地球等概念,并以此引导了行业发展的方向。很多的行业逐渐与网络技术和计算机技术融合,形成了以计算机为基础的信息化、数字化服务模式,并更加的智能和人性化,人类社会己经步入到信息化社会、数字化社会。而二十一世纪,是各项信息化技术走向稳定发展、技术逐步成熟的重要发展时期。而且随着理论的不断完善,很多其它的技术也在融入到这个信息化的社会发展中,诸如多媒体技术、远程通讯技术、高密度存储等等也进入了人们的视野。海量的知识技术、生活工作信息实现了电子化、数字化,通行于计算机网络创造的信之上。人们逐渐接受和习惯了从网络中获得所需要的方而面的、详尽的、符合自身需求的知识和信息,以此提高自身的工作效率、生活富知识。但是计算机网络平台中的信息随时都在不断增加和变化,并且网络中的信息有着诸多特点:
1.数字化:旧有的书本的载方式,随着知识、信息的不断膨胀,已经无法承载多的海量信息。浩如烟海的信息,需要体积无比庞大的实体载体,对于人们来说,已经是无法翻阅和查看的。因此,人们把信息进行数字化,变为二进制的数字组合方式,数字生成为数掘、文字、阁像、视频、动画等等丰富多彩的信息表达方式,不再为实体的体积、空间等因素所限制,能够流通于计算机网络平台。
2.网络化:独立的计算机只能够服务于极少一部分用户的信息需求,只有能够操作特定计算机的用户才能从中获取特定的信息,有着很大的局限性:首先在用于服务的信息量较少,并且信息更新较慢,因为受限于独立的计算机只能提供预先存储的固定信息,更新也需要人为处理;其次服务对象同一时间通常只能服务一个用户,效率低下。因此,借助网络技术,信息资源就可以经由网络这一技术平台进行传递,不再局限于特定的、局限性的信息资源,传递方式也更加的快捷、方便,并且更加的安全和可信赖。因为传统的信息传递方式比如邮寄、快递等等实体方式,都有很大的可能造成丢失、替换和泄漏,而网络平台在完成好加密等信息保护工作后,能够有效的提高信息的安全性。
3.资源共享:如同网络化一样,信息通过网络平台来传递,那么首先就是要保证资源是可以、允许被放到网络平台中传递的。那么资源就是共享的,可以被多用户相互访问的,是开放的,又时刻更新中的,跨越了地域的局限,使得信息能够被不同地域的、不分时段的多用户来进行访问。4.智能化:也可以称为个性化,代表信息服务越来越针对用户的个人偏好以及兴趣。因为每个人的信息服务需求是不同的,并且每个人对于信息检索缺乏使用经验和新事物的接受、适应能力的不同,导致很多用户在信息检索过程中,无法寻找到自己需要、偏好和感兴趣的信息。那么更好的为不同层次的、不同需求的用户提供检索服务就要区别对待,也就是检索信息的工具要有识别用户的能力,捕获用户的偏好和爱好的能力,推测用户真实意图的能力,具有针对性的提供信息检索服务。因此,网络中的信息是纷乱和冗杂的,包涵了各种各样的信息,包罗万象,可是也由于它的驳杂性,使得人们在获取信息资源的时候,要去芜存菁,虽然现在有了很多较为有效的信息蹄选方式,可是依然无法较好的满足人们的信息获取需求。很多旧有的信息服务平台通过引入新兴技术,跟上了信息社会的发展,并发挥自身特色,在庞大的信息服务领域占有一席之地。它提供给我们学习的资源和环境。
图书馆是¥期人们只能从书本获取知识的吋代一个信息服务平台,信息以书本为载体,提供相对较小范围的知识集合体,而人们所需的知识、信息需耍人们从书本中进行人工的蹄选和判断,效率低下,渐渐无法跟上社会发展的脚步。随着社会的进步,计算机技术、网络技术、多媒体技术和通信技术等等也融入到了图书馆的建设中,发展出自动化图书馆,直到现在占据发展主流的数字图书馆。传统的图书馆经过多年发展,出现了现在的数字图书馆的服务模式,但是服务的主要内容、功能并没有特别巨大的差异。仍然以给用户提供各种专业知识、生活常识等等各方各面的查询、参考的服务,同吋在原有的服务银础之上,同时还提供了综合的公共信息访问服务。其发展虽然融合很多的先进技术,_比如计算机搜索引擎技术、计算机网络技术、信息通讯技术等等,但是数字化是数字图书馆构建的最基础、最主要的工作,是数字图书馆的基础建设的底层基石,也是研究人员的主要研究方向。经过近几年的发展,数字图书馆的电子书建设渐入正轨,研究发展方向主要致力于数字图书馆系统方向。数字图书馆(Digital Library)是以网络为基础,以计算机为载体,能够远程的把图书等资源提供给读者,是知识共享的、便于查阅的、供随时访问的、智能的知识平台。相较于旧有图书馆的服务方式,节省了人力、空间、时间的投入,不再需要特定的藏书和服务的大型场馆,大量的服务工作人员,也不再因为工作人员的工作时间而导致服务真空期。
第二章Ontology在数字图书馆个性化信息服务中的应用.............. 8
2.1 Ontology 概述 ..............8
2.2 Ontology的构建方法 ..............10
2.3本章小结.............. 12
第三章数字图书馆的个性化信息检索服务.............. 13
3.1数字图书馆的概述 ..............13
3.2数字阁书馆个性化信息服务 ..............14
3.3 Ontology在数字图书馆个性化信息服务中的意义.............. 23
第四章搞f Ontology的个性化数字图书馆检索模魁研究与设计.............. 26
4.1系统设计目标 ..............26
4.2系统流程设计 ..............27
4.3系统实现基础 ..............29
结论
相较于旧有图书馆的服务方式,节省了人力、空间、时间的投入,不再需要特定的藏书和服务的大型场馆,大量的服务工作人员,也不再因为工作人员的工作时间而导致服务真空期。
本论文对数字图书馆、信息检索的定义及应用范围进行研究;对Ontology技术和个性化技术的定义以及分类进行分析研究,并与数字图书馆的信息检索方面进行紧密结合,找到适合的切入点,使两种新技术能够更好的融入到检索中去,实现专业、方便、快捷、个性化的信息检索。本人由于涉足数字图书馆信息检索服务领域时间较短,对于文中所构建的系统模型还有很多的不足,如对于整个系统而言,本体的构建还不够完善,个性化服务的考虑不够全面,此后将对本体进一步进行深度构建,向用户提供更具有个性化的信息服务。
参考文献
[1] Salton G Avector space model for automatic indexing[J]. Communications of theACM. 2002(1 8): 61 3-620.
[2] K Aas, L Eikvil. Text Categorization ASurvey[R]. Norwegian Computing CenterReport NR 941. 1999: 8-9.
[3] P. Maglio,etal. How to Build Modeling Agents to Support Web Searches. NewYork,Spring-verlag,1997,(2): 12—17.
[4] Steffen Staab,et al. Where are the rules?Trends and Controversies. IEEE IntelligentSystem, 2006,67-75
[5] Susan Gauch. , Jason Chaffee. ,and Alexander Pretschner. Ontology—BasedPersonalized Search and Browsing. Web Intelligence and Agent Systems. 2003,1(3).
[6] Michael Wooldrige,Nicholas R . Jennings Intelligent Agents Theory andpractice[J]. Knowledge Engineering, 1995,10(2): 115—152
[7] Hsinchum Chen, Yi-Ming Chung, Ramsey, et al. Intelligent spider for internetsearching[C] . System Sciences,Proceedings of the Thirtieth Hawaii InternationalConference. 1997,4: 178-188.
[8] B. J. Wielinga,A. Th. Schreiber,J. Wielemaker,J. A. C. http://sblunwen.com/tsgxlw/ Sandberg. From thesaurus to Ontology. Report ICES—MIA project,University of Amsterdam, Social ScienceInformatics 2000 : 1一8
[9] Adomavicius, G. Tuzhilin. A. User profiling in personalization applications throughrule discovery and validation. Proceedings of the 5th International Conference on DataMining and Knowledge Discovery,New York,1999,40(3): 377-381
[10]Meng Weiyi’ Yu Clement,Liu King—Lup. Building Efficient and EffectiveMetasearch Engines. ACM Computing Surveys. 2002,34(1): 48-89.