基于图神经网络的推荐方法思考

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:28222 论文编号:sb2022121412081949753 日期:2022-12-29 来源:硕博论文网

本文是一篇计算机论文,本文研究的基于图注意力的捆绑推荐模型BRGA,引入用户评论和社交网络来对用户和商品的特征进行表征,BRGA对捆绑推荐的数据稀疏性问题有一定的缓解,与此同时也利用图神经网络对商品特征的构建进行了有效的补充,从而能够达到更好的商品推荐效果。
第一章 绪论
1.1 课题的研究背景与意义
随着网络基础设施建设不断完善,互联网已经成为人们日常生活中的重要交流工具和平台,在人们的日常生活中扮演着非常关键的角色。根据中国互联网络信息中心第49次《中国互联网发展状况统计报告》显示,截止2021年12月,我国网民规模达10.32亿,较2020年12月增长4296万,互联网普及率达73.0%[1]。近年来,互联网用户数量呈现爆炸式增加,铺天盖地的数据信息就呈现指数级增长。根据IDC《数据时代2025》的信息披露显示,截止到2025年末,全球数据量预计将接近163ZB。虽然铺天盖地的数字信息开阔了人们的视野,也为人们带去了更广泛的选择,但是用户如何从铺天盖地的数字信息中找到自己感兴趣的信息变的非常困难,从而就给用户带来一个信息过载的问题,而信息过载就催生了信息过滤技术[2]。信息过滤技术由搜索引擎算法以及个性化推荐算法构成。搜索引擎需要用户输入一个明确的搜索需求,不同用户输入相同的搜索需求会显示相同的内容,这就缺乏了个性化。个性化推荐不需要用户为该算法表述一个很明确的需求,而是系统自动的收集用户的历史信息记录,从而给用户搭建一个个性化的偏好模型,最终,向用户推荐符合其个人喜好和需求的信息[3]。
目前,推荐系统无处不在,融入生活的各个方面[4],并且可以帮助用户解决信息过载问题以及为用户提供个性化服务。新闻类应用,如今日头条和腾讯新闻,根据用户的日常阅读兴趣,推荐可能感兴趣的信息;购物类应用,如淘宝和京东,根据用户的购物历史,给其推荐比较感兴趣的商品;视频类应用,如爱奇艺和优酷,根据用户过去的观看行为,给其推荐可能会观看的视频;外卖类应用,如饿了么和美团,根据用户过去的饮食行为推荐其可能感兴趣的美味;短视频类应用,如抖音和快手,根据用户过去的观看行为给用户推荐可能喜欢的电影。在海量数据信息时代,任何数据都是有价值的,这就促使各大公司如淘宝、腾讯、今日头条等,这些平台都会通过对用户的各种历史数据进行分析,更好地学习用户的行为规律,以便通过个性化推荐算法来提高用户体验[5]。
............................
1.2 国内外研究现状
推荐系统被认为是互联网时代一种最有应用前景和最有应用价值的信息检索工具。目前,推荐系统通过三十多年的技术积累和技术沉淀,其衍生出多种不同类型的推荐算法,并且这些算法在不同领域中都获得了不错的推荐效果。本文将从三个方面来论述目前推荐系统在国内外的一个研究现状,分别为传统推荐系统研究现状、基于深度学习的推荐系统研究现状,最后基于图神经网络的推荐系统研究现状[14]。
1.2.1 传统推荐系统研究现状
协同过滤是传统推荐系统的核心技术之一,也是目前应用最为广泛的推荐算法之一。类似的用户可能喜欢类似的物品是协同过滤的核心思想,其主要是学习用户和物品的评分数据信息,给用户推荐可能比较喜欢的物品。其又可以分为基于内存的算法和基于模型的算法。基于内存的算法利用用户和物品之间的评分矩阵给用户推荐可能比较喜欢的物品。按照研究对象可以进一步划分,可以划分为基于用户的算法和基于物品的算法。前者是通过用户对物品的偏好找到相似的邻居用户,然后将邻居用户喜欢的物品推荐给当前用户。后者是通过用户对物品的偏好找到相似的物品,然后给用户推荐其可能比较感兴趣的物品[15]。简而言之,基于内存的算法通常会通过相似度来计算用户之间或物品之间的相似性,如余弦距离或皮尔逊相关系数。基于内存的算法有许多优势:首先,算法原理简单、思想朴素,因为它只涉及到相似度计算,并能处理大规模数据集。其次,该算法易于实现,能够为用户推荐出多样性、新颖性的物品。然而,这种算法也有以下局限:首先,如果数据稀疏,可评估的共同项很少,那么相似度的计算就不那么精确,最终导致该算法推荐的准确性不那么高;其次,随着用户和物品数量逐渐增加,其计算能力也会逐渐下降;最后,当引入新的用户或物品时,会出现冷启动问题。基于模型的算法通过使用机器学习算法从数据中学习模型,然后基于学到的模型对策略进行优化,使用机器学习算法可以在一定程度上去弥补基于模型算法的缺陷,进一步提升基于模型的算法的推荐性能。这些算法可以处理工业环境中海量的数据集,同时避免一定的过拟合问题。其中,矩阵分解由于其较好的评分预测效果和可扩展性,逐渐成为了基于模型的算法的基础。矩阵分解就是把用户和物品的评分矩阵投影到低维稠密的向量空间中,得到用户和物品的特征向量表示,最后通过用户和物品的特征向量表示来计算用户对物品的兴趣偏好。
............................
第二章 相关理论与技术
2.1 推荐系统介绍
用户越来越多地使用被动推送的消息,来减少获取有效信息的难度。推荐系统本质上是利用算法自动地把用户和物品联系在一起,筛选出用户可能感兴趣的物品并推送给用户,从而可以改善用户的购物体验。上文提到的物品可以泛指不同类型的信息,依据推荐系统应用在不同的领域,它可能是广告、新闻、商品的其中之一。
电子商务推荐系统类似于“导购员”,只是它不需要主动询问用户的需求,而是通过用户的各种历史行为信息,如商品浏览信息、商品收藏信息或商品评分信息,来给用户推荐。首先,建模不同种类的物品推荐模型,其次,根据推荐模型预测的物品评分,对物品进行排序和过滤,最后,把评分排在前面的若干个物品推荐给用户。图 2-1 展示了推荐系统的工作原理。

计算机论文参考
计算机论文参考

个性化的推荐系统一般需要利用具有代表性的用户特征信息,比如用户信息、物品描述信息、用户评论信息等。其中,用户行为被分成显性和隐性反馈。最常用的是诸如评论、评分、点赞、收藏等行为数据,这些数据可以清楚地反映出一个物品的被喜欢程度。隐性反馈指的是没有明确表明用户偏好的行为。浏览网页是最能说明问题的隐性反馈形式,因为仅仅浏览网页并不意味着用户喜欢它。简而言之,虽然前者可以明确区分用户的评分信息,但是这些评分信息的数量都很小;隐性反馈和显性反馈呈现一个相反的关系,但由于隐性反馈拥有海量的数据量,在配合超强的特征提取技术,这样隐性反馈就可以为推荐系统获得宝贵的信息。因此,推荐系统的优劣与所选数据的质量直接相关。
............................
2.2 深度学习
最近几年,随着深度学习的快速发展,其已经成为机器学习领域的主导力量,深度学习已经渗透到图像、文本和视频等多个领域,成为学术界和工业界的研究热点。深度学习模型具有强大的海量数据处理能力,可以深层次的学习用户和商品之间的关联关系。下文将详细论述本文涉及到深度学习模型[40]。
2.2.1多层感知机
多层感知机模型一般至少由三层神经网络构成:输入层、隐藏层以及输出层,其中,隐藏层可以包含有多个,除了输入层的节点外,其他层中的神经元节点都拥有一个非线性的激活函数,图2-2展示多层感知机模型结构。
尽管多层感知机的网络结构看似简单,然而,事实证明,任何复杂的可导函数都可以被多层感知机逼近到所需的精度[41]。因此,多层感知机构成了许多先进算法的基础,并已被广泛应用于许多领域。
2.2.2 卷积神经网络
Fukushima等人[42]提出了卷积网络的早期雏形模型,该模型是一种自组织的神经网络,拥有平移和扭曲不变性。然而,由于当时的硬件计算能力的限制严重阻碍了卷积网络的发展,该算法在当时并没有受到广大研究者的关注。1999年,英伟达首先提出了GPU(图形处理器)的概念,其性能在接下来的五年里被提升了上千倍。2006年,CUDA发布,它将GPU应用于通用计算,解放了GPU的高性能并行计算能力。Krizhevsky等人[43]提出了AlexNet踩上GPU这阵东风,在ImageNet竞赛上准确率超出第二名12%,碾压式地证明了CNN的学习能力和泛化能力。此后,卷积神经网络得到了急速发展,在很多领域上都获得了巨大的突破。CNN本质上是一种前馈神经网络,CNN通过卷积操作从数据中提取特征,其拥有局部连接、权重共享这两大特性。图2-3展示了CNN的模型结构图。传统的算法需要人工的去提取数据特征信息,而CNN是通过端到端的方式去提取数据的特征信息。CNN的模型设计灵感来源于对生物的视觉系统的研究,CNN的网络结构受到了视觉感知的启发。神经网络当中的神经元与生物的神经元是一一对应的关系,CNN模型当中的卷积核代表生物神经元不同的受体,能够对不同的特征做出响应[44]。

计算机论文怎么写
计算机论文怎么写

..................................
第三章 基于图注意力增强图神经网络多模态个性化商品推荐 ............. 16
3.1 引言 ................................. 16
3.2 方法描述 ........................ 16
第四章 基于图注意力的捆绑推荐 ...................... 27
4.1 引言 .............................. 27
4.2 符号与定义 ........................... 28
4.3 方法描述 ......................... 29
第五章 总结与展望 .................... 39
5.1 研究总结 .......................... 39
5.2 研究展望 ............................... 40
第四章 基于图注意力的捆绑推荐
4.1 引言
面对网络上海量的“商品数据”,推荐系统已成为解决商品信息过载的一种有效工具,被广泛应用于现代电子商务网站和在线服务业务,如亚马逊、淘宝、Netflix。但是推荐系统通常不得不面对冷启动、数据稀疏性问题,给模型去学习用户和商品之间更丰富的语义信息带来严峻的挑战[66]。推荐系统的基本目标是为用户找到潜在感兴趣的物品,现有的推荐系统大多侧重于直接利用交互行为数据为用户建模,从而给用户推荐其可能比较感兴趣的单个物品。在真实的线下销售场景中,捆绑式的营销无处不在。捆绑推荐利用用户消费物品的关联特性,附带推荐与主推物品常见的关联物品,从而间接提升推荐的准确率。捆绑推荐物品的网络评论包含了用户物品间的更复杂的交互信息,是用户选择物品的重要参考,一定程度上可以弥补只依赖用户物品购买行为分析导致的冷启动和数据稀疏性问题。同时,考虑到电商网络与社交网络的融合趋势,将社交关系整合到推荐中也会为用户提供更多信息用于个性化建模。因此,如何融合和利用好这些辅助信息,实现更好的捆绑推荐性能仍然是当前学术和工业界研究人员关注的焦点之一。
大部分一般的推荐算法都是根据用户的偏好和从用户-物品历史交互行为中提取的物品特征来为用户推荐一个物品。直观上的说,可以把捆绑当作一个虚拟物品,并把基于用户-捆绑交互行为的捆绑推荐应用到一般的推荐方案当中去。虽然这种推荐方案在技术上是可行的,但由于缺乏用户与捆绑之间的互动,导致捆绑推荐的性能不够理想[67]。此外,捆绑推荐是一项非常具有挑战的任务,因为它很难去捕获用户、物品、捆绑之间异常复杂的异质关系。一般一个捆绑是由多个物品组成,一个用户可能和多个物品和捆绑进行交互。一般的推荐方案仅仅将聚焦于用户对捆绑和捆绑特征的偏好上,忽略了物品和捆绑之间的关联以及用户对捆绑和物品偏好可以用来进一步提供推荐的性能。从这个角度来看,一般的推荐方案可以在捆绑推荐中进一步优化。
.............................
第五章 总结与展望
5.1 研究总结
随着网络基础设施建设不断完善,人们已经进入互联网经济时代,网上购物的方式也越来越多,其已变成一种热门的消费方式,这就会导致“信息过载”困扰。而推荐系统已成为解决上述问题的一种工具,其可以在“信息过载”困扰严重的当下扮演着非常重要的角色。推荐系统一般要面对冷启动、用户兴趣漂移和数据稀疏性等困扰,给商品用户的偏好建模带来很大挑战。网络上的商品评论包含了用户商品间的更复杂的交互信息,是用户选择商品的重要参考;商家提供的商品的介绍描述会包含更多更全面的商品特征,也是用户选择商品的重要依据。推荐系统的基本目标是为用户找到可能比较喜欢的物品,现有的推荐系统大多侧重于直接利用交互行为数据为用户建模,给用户推荐其可能比较喜欢的单个物品。在真实的线下销售场景中,捆绑式的营销无处不在。捆绑推荐利用用户消费物品的关联特性,附带推荐与主推物品常见的关联物品,从而间接提升推荐的准确率。捆绑推荐商品的网络评论包含了用户商品间的更复杂的交互信息,是用户选择商品的重要参考,一定程度上可以弥补只依赖用户物品购买行为分析导致的冷启动和数据稀疏性问题。同时,考虑到电商网络与社交网络的融合趋势,将社交关系整合到推荐中也会为用户提供更多信息用于个性化建模。因此,融合并利用好这些辅助信息表示,这可以实现更好的个性化商品推荐。本文的主要研究内容有两点:
(1)在真实推荐场景中,图结构数据通常包含多种不同类型的节点和边。传统的商品推荐算法包括基于用户-商品直接交互的协同过滤方法和基于用户历史交互的以及基于内容的方法大多都难以捕获交互的高阶信息,而通过图神经网络能够捕获复杂拓扑结构信息,保留图网络中属性的图结构信息,从而学习更加丰富的语义和结构信息,更好地建模用户和商品的表示,提升推荐效果。因此,本文结合图神经网络相关方法,构建用户-商品交互二部图,提出一种基于图注意力增强图神经网络多模态个性化商品推荐模型GAGN。GAGN充分利用历史交互行为信息以及文本词嵌入信息,这既可以缓解数据的稀疏性又可以降低数据的过拟合。与此同时,该模型利用图神经网络可以捕捉到用户和商品之间更加高级的语义特征,这也更符合商品推荐场景。在三个真实的数据集上,本文提出的GAGN模型均超越了相比较的基线模型,取得了更好的推荐效果。
(2)传统的商品推荐算法,大部分的研究都是给用户推荐单个商品,然而,在很多真实推荐应用场景中,平台需要的是给用户推荐商品集合,例如,营销策略中会将多个商品打包在一起销售,这在现实推荐场景中被称为捆绑推荐。而通过捆绑推荐可以大大的解决一部分用户的选择多个商品的困难症问题,对于提升用户的购物体验有很大的帮助。因此,本文提出一种基于图注意力的捆绑推荐模型BRGA,具体而言,提出的方法从用户-物品-捆绑的异质网络中学习复杂的异质关联的节点表示、从评论文本中提取异质网络中对应的高阶文本语义信息、从用户的社交网络中学习影响用户捆绑推荐的社交语义信息表示,然后通过一个聚合器聚合这些丰富的语义词嵌入信息,其目的是缓解数据的稀疏性。另外,在2个数据集上进行广泛实验,实验结果显示,本文提出的BRGA模型优于其他基准算法,能够显著提高捆绑推荐的性能。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217