基于多语义信任关系的社会化推荐算法探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:38999 论文编号:sb2022111815203049656 日期:2022-12-06 来源:硕博论文网

本文是一篇计算机论文,本文对如何解决社会化推荐算法中存在的评分数据和社交网络数据稀疏性问题展开研究,提出两种算法——融合多语义信任度与全局信息的协同过滤算法和基于多语义信任关系的社会化矩阵分解推荐算法,实验证明了两种算法可以取得更好的推荐效果。
1 绪论
1.1研究背景
随着信息技术和电子商务的迅速发展,人们已经处于一个大数据时代,“互联网+”理念的推广使得企业不断推动商品和服务信息化、多元化,越来越多的互联网信息和服务通过各种移动设备融入人们的日常生活中,人们可以足不出户的选购来自全球各地的商品,甚至可以即时得获取发生在全世界的新闻事件。尽管社会信息化程度的提高便捷了人们的生活,但与此同时,在线数据的爆炸性增长也带来了一定的弊端,种类繁多、体量巨大的信息或商品使得用户在选择的时候不知所措、犹豫不决,同时不相关和冗余的信息也会干扰用户的选择,用户想找到有趣且有价值的信息越来越难[1],信息超载问题往往会使用户的使用体验大打折扣。如何帮助用户在海量信息中准确找到那些真正需要的信息便成了当前互联网信息爆炸时代下的一大难题。
为了解决“信息过载”问题,学术界和企业界的研究人员展开了积极的探索,信息检索是其中具有代表性的技术方案,该项技术落地的产品即为搜索引擎,国内外著名的搜索引擎有Google、Baidu和Sougou等。用户可以在搜索引擎内输入关键字搜索自己想要获取的信息,搜索引擎会把与关键词相关的内容反馈给用户,但反馈的信息多数情况下内容大同小异,缺乏多样性,当用户不清楚自己需要什么样的信息或者用户无法明确表达出自己想要获取的信息的关键词时,搜索引擎很难发挥作用。同时搜索引擎的逐渐商业化导致给用户反馈的信息中包含较多的广告内容,甚至虚假信息,用户需要花费额外的精力筛选其中有用的信息。所以,搜索引擎虽然有效得提高了信息的利用率,但在用户体验满意度以及使用效率上还存在一定的弊端。在这种背景下,推荐系统成功问世
推荐系统改变了类似搜索引擎的这种必须由用户主动获取信息的方式,使用户被动的接收由推荐系统生成的信息。系统通过采集存储、处理分析用户的历史行为记录信息(如购买、评价、点击、浏览、收藏等)和个人基本信息(如性别、年龄、职业等)来了解用户的日常习惯或者兴趣,并据此将用户可能感兴趣的商品或者信息推送给用户[2]。今天的消费者在网上购物时面临着数以百万计的商品和服务,推荐系统通过提供用户可能感兴趣的商品或服务推荐来帮助消费者选择,如书籍、音乐、餐厅、在线新闻和旅游项目等。
.............................
1.2研究目的和意义
在过去几年中,在线社交网络和电子商务网站的爆炸性增长使得人们每天在互联网上花费的时间倍增。现实世界中各种各样的信息被加工成文字、音频、视频等多元化的在线数据,用户可以随时随地通过移动终端来访问这些在线数据,从中获取所需要的信息,但在海量的信息面前用户也会面临选择困难的问题。推荐系统旨在引导人们在海量信息中找到有用且更有趣的选择,其主要目标是:确定用户的兴趣,过滤现有信息,最后向用户提出有用且有趣的选项以供用户选择、参考。但推荐系统一直面临着冷启动、稀疏性、准确性与多样性矛盾等挑战,随着用户群体和商品服务种类基数的不断增大,这些问题对推荐系统造成的负面影响就变得非常严重。此外,现如今人们对于产品或服务质量的要求随着物质生活水平的极大丰富而逐渐提高,目前的推荐系统的推荐精度还远远不能满足人们的需求。协同过滤推荐是推荐领域最流行的方法,广泛用于推荐系统设计[4]。因此本文针对协同过滤推荐系统存在的上述问题展开深入研究,旨在缓解上述问题的同时提高推荐准确率,保证系统的推荐质量,增强用户的体验感。
移动设备的普及使人们越来越习惯在线解决衣食住行问题、在线办理业务、在线娱乐甚至在线办公,人们的生活已经网络化。例如,人们的一天从起床便开始与网络接触,早上起来打开手机看看有没有家人或公司发来的“微信”消息,在吃早餐时花几分钟阅读“今日头条”推荐的即时新闻,然后坐着“滴滴打车”派发的专车去上班,途中听着由“喜马拉雅”推荐的文学讲座,上班时在“腾讯会议”上开视频会议,中午下班后考虑午餐时,“美团”推荐了一家新餐馆,下午在办公之余看到“支付宝”推荐了当天的热门股票,晚上回家后看到“淘宝”推荐了最近收藏的书籍,随后果断下单,睡觉前又听了一首“酷我音乐”推荐的减压轻音乐。如今,推荐系统已经无处不在,为人们的日常消费、活动、工作带来巨大便利的同时,一定程度也满足了人们的精神文化需求,保证推荐系统推荐结果的准确度和可靠性对于全面提高人们生活质量有着重要意义。
...............................
2 推荐算法和相关理论概述
2.1推荐系统
2.1.1 推荐系统基本概念
随着移动互联网中信息量的爆发和电子商务网站的兴起,网络用户在搜寻信息或者选择商品时容易面临“选择困难、选择恐惧”的问题,这一方面会影响用户体验,另一方面也会限制卖方网上交易成交额的增长。推荐技术的出现使用户获取信息的方式由原先的主动搜寻变为被动的接收信息,这极大地减少了用户的选择痛苦,同时也给商家带来了营销便利。在这个过程中,推荐系统发挥着至关重要的作用。推荐系统是一种特定类型的智能信息过滤系统,其根据用户的偏好和行为,去预测用户对某个商品或服务的喜好,并向用户呈现可能感兴趣的信息,即通过对用户兴趣建模自动地将用户和信息连接起来。图2.1展示了推荐系统的各模块以及工作流程。

计算机论文怎么写
计算机论文怎么写

........................
2.2协同过滤推荐技术
协同过滤技术是推荐系统设计中是最流行的方法,该技术基于以下两种假设:具有相同或相似价值观、兴趣偏好的用户会做出相似的选择;用户如果在过去对某些物品产生过兴趣,那么将来他很可能依然对其保持热爱。它利用用户的历史行为数据计算用户间的相似性,然后根据相似关系自动为目标用户过滤信息、筛选最近邻,所以协同过滤也称为社会过滤。协同过滤推荐技术在实施阶段通常将用户的历史数据处理为评分反馈矩阵,矩阵中每个元素都代表了特定用户对特定物品的明确评价,如图2.3所示。图2.3左侧的关系图表示3个用户与4部电影之间的历史交互记录,连接线上星星符号的数量表示用户对电影的评分,根据左侧的交互记录生成图2.3右侧的评分矩阵,位于矩阵3行3列的元素“4”表示3号用户对3号电影的评价为4分。

计算机论文参考
计算机论文参考

协同过滤推荐方法根据在实现过程中是否借助了机器学习算法思想被分为基于内存的协同过滤和基于模型的协同过滤两类[39]。基于内存的方法又从用户和项目两个维度分为基于用户的协同过滤(User-based CF,UBCF)和基于项目的协同过滤(Item-based CF,IBCF),该方法仅作用于用户评分矩阵,使用相似性度量来获取用户或物品之间的相关度,同时在推荐之前允许对稀疏的评分矩阵进行填充。基于模型的方法使用数理统计和机器学习技术来创建模型,然后利用模型来预测原矩阵中缺失的评分。
................................
3 融合多语义信任度与全局信息的协同过滤算法 ........................ 27
3.1问题分析及研究思路 .................. 27
3.2基于加权元路径的多语义信任度 ......................... 28
3.3融合全局信息的用户相似度 ........................ 31
4 基于多语义信任关系的社会化矩阵分解推荐算法 .............................. 41
4.1问题分析及研究思路 .................... 41
4.2用户社交信任网络重构 ......................... 42
5 结论与展望 .............................. 54
5.1结论 ....................... 54
5.2展望 ...................... 54
4 基于多语义信任关系的社会化矩阵分解推荐算法
4.1问题分析及研究思路
社交网络可以将推荐系统内部或外部的资源连接起来,让用户通过主动选择信任对象的方式参与推荐过程。然而,目前基于社交网络的推荐方法研究所采用的信息源都集中在用户间显式的社交信任网络,即完全由用户自定义的社交信任关系,如Epinions、Ciao和Facebook中的用户社交信任网络。根表3.1描述的内容能够发现可用于社会化推荐的数据源(包括用户的评分数据和显式社交信任关系)依然面临着严重的稀疏性问题。

计算机论文参考
计算机论文参考

此外,尽管本文在第3章节提出的MSTGK可以利用额外的用户个人信息和项目属性信息挖掘用户潜在的信任关系,使其作为用户社交关系的补充信息来解决数据源稀疏的问题,但还是存在一些缺陷:一方面,我们不能保证每个应用场景中的数据集都有额外的用户信息(如3.2节中所使用的用户标签、用户加入的兴趣小组等)可以用于挖掘用户间潜在的信任关系。由于种种原因大多数用户不愿意提供他们的个人信息,例如,用户不相信要求他们提交信息的系统能保护好他们的个人隐私,提供个人信息的过程一般很耗时,如果系统强制用户在注册时提供个人信息,系统也有可能会失去用户。而且,大多数用户的信息会随着时间的推移而变化,如年龄、职业和住址等。系统收集的用户信息经过一段时间之后可能就失去了可靠性。另一方面,项目的种类千变万化,分析和界定能够表现项目特征的属性是一项极其复杂、艰巨的任务,这违背了系统高效率的原则。比如用户购买了篮球,有的用户是因为喜欢篮球的颜色,有的用户是因为喜欢篮球的材质、品牌、大小等等,每件商品都可以列举出很多属性,因此很难界定哪些是用户喜欢的特征,用户也有可能就是喜欢这个物品本身,而不是出于某些属性的考虑。同时当系统中的项目有非常多种类时,每个项目都有各自独特的属性,此时再用信息网络通过属性挖掘项目之间的联系就失去了意义。所以MSTGK仅适用于推荐同种类型项目的系统。
5 结论与展望
5.1结论
在最近的十年里,在线购物、娱乐和社交等互联网应用深刻影响着人们的生活。不可否认的是,各种电子商务以及娱乐网站上的信息量太过庞大。用户不可能了解整个网站的所有产品,这迫切需要建立一个推荐系统,以方便为用户过滤出基于特定信息的产品。另一方面,企业或商家意识到推荐系统的巨大潜力,希望借助推荐系统促进产品销售从而增加利润。最流行的协同过滤推荐系统主要依赖于用户评分信息,而这些信息大多是极度稀疏的,特别是对于冷启动。社交网站的兴起使用户更倾向于通过社交互动来表达自己,社交网站上的用户偏好作为辅助信息源被引入推荐系统以提高推荐准确度。然而,用户社交网络的稀疏特性使推荐系统难以展现出真实的效果。本文对如何解决社会化推荐算法中存在的评分数据和社交网络数据稀疏性问题展开研究,提出两种算法——融合多语义信任度与全局信息的协同过滤算法和基于多语义信任关系的社会化矩阵分解推荐算法,实验证明了两种算法可以取得更好的推荐效果。本文的主要结论有以下几点:
(1)用户之间产生信任的原因有多种,可以利用用户的社会关系、个人信息以及项目的属性信息来挖掘用户间潜在的信任关系,采用加权异构信息网络来集成这些信息并通过加权元路径来挖掘用户潜在信任信息是一种可行的方案。辅助信息丰富度的增加是提高推荐精度的关键。
(2)相似性度量是基于用户的协同过滤算法的关键,在考虑用户共同评价项目上评分差异的同时不能忽略了用户偏好程度和项目流行度这两个全局信息的影响,融合全局信息的相似性度量方法能够帮助推荐系统更准确的搜寻用户近邻。
(3)当系统无法获取额外的用户个人信息和项目属性信息时,通过加权异构信息网络集成仅有的信息、使推荐系统中的对象相互关联可以挖掘其中隐含的用户信任关系,将这种隐式的社交信任与用户显式的社交信任相结合能够缓解用户社交数据稀疏的问题。
(4)矩阵填充是推荐领域常用的技术之一,利用该项技术可以将用户的社交信息无缝的整合到评分矩阵中,还可以有选择的对冷启动用户的缺失评级进行填补。矩阵填充操作能有效的缓解评分数据稀疏问题、提高系统对用户的推荐精度,尤其是冷启动用户。
(5)矩阵分解能够进一步挖掘用户和项目间隐藏的特征相似关系,模型一旦构建完成,能够大大提高推荐系统的预测精度。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217