基于协同过滤的个性化新闻推荐计算机系统的设计与实现

论文价格:免费 论文用途:其他 编辑:硕博论文网 点击次数:
论文字数:41254 论文编号:sb2019040812521225757 日期:2019-04-30 来源:硕博论文网
本文是一篇计算机论文,本文重点研究内容包括提出个性化新闻推荐模型、改进传统协同过滤算法以及结合移动平台实现个性化新闻推荐系统。其中个性化新闻推荐模型包括四个模块,分别为新闻分类、用户兴趣分析、用户聚类和推荐结果生成;协同过滤算法的改进包括使用用户评分均值加上物品受欢迎程度对缺省值进行填充来解决数据稀疏性问题,以及使用时间衰减函数对用户评分数据设置时间权重来解决用户兴趣迁移问题;个性化新闻推荐系统的实现包括对系统进行需求分析,对系统的设计思路和实现方法进行介绍,以及将改进后的推荐算法融入到系统中,最终实现个性化新闻推荐系统的开发。

1绪论

1.1研究背景与意义
随着网络信息技术的日益成熟,信息量的急剧增长,人们面对海量信息时难以准确得到自己感兴趣的信息,使得信息的使用率受到严重的影响。一方面,用户难以准确、高效地找到所需信息。另一方面,信息提供者难以将自身创建的有价值的信息呈现给有需求的用户。为了解决上述问题,诸如谷歌、百度等搜索引擎纷纷涌现出来,这些信息检索系统一定程度上缓解了这个问题。但是它们存在一些无法避免的缺陷,即难以实现检索结果的个性化。不同用户对同一关键字进行检索,呈现出的检索结果基本一致,无法满足用户的个性化需求。
因此,个性化推荐系统应运而生,它充分关注用户的个性化需求,根据用户以往的行为偏好,将符合用户喜好的信息呈现给用户。个性化推荐系统与搜索引擎的区别在于,它注重区分不同用户的行为偏好,在此基础上进行了个性化计算,对不同用户呈现自身所需的个性化信息。个性化推荐系统给用户带来了私人定制般的服务体验,能有效地增强用户粘度,避免用户流失。
与此同时,随着移动端的迅猛发展,以手机为主体的移动设备逐渐成为各大媒体的主要传播载体。移动媒体可细分为内容媒体、服务媒体和关系媒体这三大类。其中新闻资讯应用属于内容媒体的范畴。截止2017年,市场主要形成了如下两类新闻媒体。
第一类是实体新闻客户端。此类新闻客户端的主流运营商以实体媒体及报纸行业主。这些运营商普遍具有固定的新闻源,同时凭借着自身长期积累的品牌优势、受众的认可以及精心创作的新闻栏目,得到用户的广泛支持,在新闻媒体领域占据着一席之地。
第二类是个性化定制新闻客户端。此类客户端主要由非媒体机构创建,如百度新闻网易新闻、今日头条等。它们通过与供应商合作来获取新闻的原始数据,经过分析整理后,可以向终端用户推送具有个性化特色的新闻资讯。此类客户端以个性化推荐为技术核心,通过分析用户历史行为,向用户推送其最可能感兴趣的新闻内容。
........................

1.2论文内容与结构
本文设计的新闻推荐系统对协同过滤推荐算法进行了改进,并且对如何将算法融入到系统中进行了创新。针对协同过滤推荐算法的改进,本文使用用户评分均值加上物品受欢迎程度对缺省值进行填充,解决了数据稀疏性问题;接着结合时间衰减函数,对用户评分数据设置相应的时间权重,解决了用户兴趣迁移问题。针对如何将个性化推荐算法融入到系统中,本文通过收集用户的浏览、点赞、评论、转发、收藏等行据进行相关分析,不需要用户主动参与,提高了用户体验;并且,在算法计算过程中不但使用了用户以往的浏览数据,还根据时间设置了权重,使得用户最近浏览的内容在计算时占据更大的比重,得到更加准确的新闻推荐列表。本文的基本结构如下:
第一章重点说明本课题研宄背景与意义,介绍了国内外新闻资讯应用的现状,并分析国内外个性化推荐技术的研宄与应用进展,确定论文基本内容与结构。
第二章重点分析个性化推荐系统的相关技术。包括个性化推荐算法、文本聚类技术和移动端开发技术。
第三章首先介绍了个性化推荐的模型,接着对传统协同过滤算法进行了改进,一方面通过聚类解决数据稀疏问题,另一方面使用时间衰减函数作为权重,使得计算结果更具可信度,并设计了实验进行验证。
第四章对个性化新闻推荐系统进行了需求分析和设计,包括推荐模块,移动端模块以及服务器端模块的需求分析,同时对系统的结构和功能模块进行了设计。
第五章对系统的各功能模块进行了实现,包括个性化推荐模块的实现、客户端的页面展示和功能实现。
第六章主要对系统进行了相关测试,分别从功能和性能这两个角度设计了相关测试用例,并且对测试结果进行了分析和总结。
第七章重点是总结与展望,首先对个性化新闻推荐系统进行分析和总结,接着指出了本文创新点与不足之处,最后结合了个性化推荐系统未来的发展趋势,对本文后续工作进行了展望。
.........................

2个性化推荐系统的相关技术

2.1个性化推荐技术
个性化推荐技术有三类,即:协同过滤技术,基于内容的推荐技术和混合推荐技术。下面以协同过滤为主,对个性化推荐技术进行介绍。
2.1.1协同过滤推荐技术
协同过滤技术能分成两类,即基于项目的和基于用户的协同过滤。基于用户的协同过滤通过计算相似度,寻找到目标用户的最近邻居,结合最近邻居的行为偏好,对其喜欢某项目的程度进行预测。基于项目的协同过滤是计算目标物品与其他物品之间的相似度,假设某用户喜欢该物品,则将与该物品相似度较高的物品推荐给用户。协同过滤的推荐流程如图2.1所示。

从图2.1中可以看出协同过滤流程分为三步,分别是获取用户评分数据,相似度计算和个性化推荐。下面对这三个步骤进行详细的介绍。
(1)用户评分数据
协同过滤的第一步是获取用户评分数据,这些评分数据通常用表格表示,如表2.1所示:

..........................

2.2文本聚类技术
首先对文本对象的结构和特点进行分析,接着用特定的模型进行表示,然后计算文本距离,再根据距离,将集合分为一个个的聚类簇。具体流程可以划分为特征表示、模型构建、距离计算和聚类这四个步骤。
2.2.1文本特征表示
文本属于信息载体,是典型的非结构化的数据,可以利用计算机进行处理。因此,在聚类文本信息之前,需要将文本转化为结构化数据,方便计算机处理。转化的过程就是文本的特征表示。本文特征之间的状态转换有三种,即:机器可读文本、特征文本和原始文本模型。
(1)原始文本是根据自然语言的逻辑和语法组成的文本结构,需要经过特征处理,将其转换为特征文本。
(2)特征文本是把原始文本信息转换成具有特征信息的文本。本文的特征信息是指元数据,如短句、词组、词、字等,都能当成文本的特征项,还能根据各种元数据类型重新组合,得到文本组合特征。
(3)机器可读文本模型指的是将特征文本建模时采用的数学模型,需要确定文本特征,并且选择合适的权重计算公式。选择文本特征和权重计算公式后,往往还需要降低或转换计算结果,得到的文本模型能够被计算机所读取,方便后续的聚类处理。
.........................
3个性化新闻推荐模型与改进算法的实验与验证......................19
3.1个性化新闻推荐模型..............19
3.1.1新闻分类..............19
3.1.2用户兴趣分析..............22
4个性化新闻推荐系统的需求分析与设计.............27
4.1总体需求概述.........27
4.1.1个性化推荐模块的需求分析.........27
4.1.2客户端模块的需求分析...............31
5个性化新闻推荐系统的实现............38
5.1个性化新闻推荐系统的数据库设计..............38
5.2个性化新闻推荐算法模块的实现.............42

6系统测试

6.1系统测试概述
测试可以提前发现系统在运行过程中出现的问题和缺陷,促使开发人员进行修复,能够在系统上线前将一些潜在的问题进行暴露并进行解决,从而保证系统上线后能够稳定地运行。因此系统在交付到用户手中进行使用之前,需要对整个系统进行充分、全面的测试。
6.1.1测试百的和范围
(1)测试目的
本次测试对系统中所有的功能模块、场景边界限制和数据类型进行了相关测试。测试中主要以页面加载过程中加载速度是否缓慢、在各主流安卓系统中运行功能是否完备、系统在用户输入异常时能否进行友好提示、系统可能存在的异常和崩溃等各个角度进行分析。
本次测试旨在系统实际投入使用前能够尽可能地发现并消除系统中的漏洞和功能缺陷,全面地提髙系统的安全性和可靠性。最后认真梳理和改进了应用的源码,并且充分考虑到了程序的健壮性。
(2)测试范围
本次测试从功能和性能这两个维度对系统进行了测试。功能测试主要是围绕用户登录、用户注册、新闻栏目管理、新闻浏览、视频观看等场景进行测试。性能测试主要对应用响应时间、内存占用、CPU性能、应用功耗、应用流量使用情况等角度对系统进行相关测试。
.......................

7总结与展望

7.1论文总结
随着网络信息量的急剧增长,人们面对海量信息时难以准确得到自己感兴趣的内容。诸如谷歌、百度等搜索引擎一定程度上缓解了这个问题,但是它们无法满足用户的个性化需求。因此,个性化推荐系统应运而生,它根据用户以往的行为偏好,将符合用户喜好的信息呈现给用户。个性化推荐系统给用户带来了私人定制般的服务体验,能有效地增强用户粘度,避免用户流失。
与此同时,移动平台迅猛地发展,移动设备逐渐成为新闻媒体传播的主要载体。其中,安卓系统占据了移动平台的绝大部分市场。因此,本文在安卓系统上开发了基于协同过滤的个性化新闻推荐系统。本文首先提出了个性化新闻推荐模型,接着对传统协同过滤算法进行了改进,最后结合移动平台,设计并实现了基于协同过滤的个性化新闻推荐系统。重点研究内容如下:
(1)提出了个性化新闻推荐模型。模型由新闻分类、用户兴趣分析、用户聚类和推荐结果生成这四个模块组成。其中,新闻分类包括对新闻进行分词、特征提取、向量化表示以及分类,用户兴趣分析指根据用户行为习惯来分析用户兴趣,用户聚类包括对用户聚类,填充矩阵等操作,推荐结果生成包括计算相似度以及生成推荐列表。
(2)对传统协同过滤算法进行了改进,主要解决了数据稀疏性和用户兴趣迁移问题。针对数据稀疏性的改进,可以使用聚类中心点对缺省值进行填充,提高了填充数据的可靠性。针对用户兴趣迁移问题的改进,可以结合时间衰减函数,对用户评分数据设置相应的时间权重,使得计算结果更加准确。
(3)最后结合移动平台,设计并实现了个性化新闻推荐系统。具体内容包括对系统进行需求分析,接着对系统结构、系统功能以及数据库进行了设计,然后完成了推荐算法模块以及客户端模块的实现,将改进后的算法有效地融入到系统中,实现了基于协同过滤的个性化新闻推荐系统的开发。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217