高校学生就业推荐算法计算机研究及应用

论文价格:免费 论文用途:其他 编辑:硕博论文网 点击次数:
论文字数:49899 论文编号:sb2020062217140131755 日期:2020-06-26 来源:硕博论文网
本文是一篇计算机论文研究,本文引入用户画像概念对学生背景信息进行详细分析,提出了结合学生背景和企业招聘信息的两种推荐算法。本文的贡献和创新点如下:(1)适用于就业推荐的协同过滤改进算法 通过分析往届毕业生就业去向信息得出,在应届生就业推荐场景中不同学生背景的就业倾向也会有所不同,因此提出了先建立学生背景相似子群,使得群落中学生的就业倾向和在校基本信息比较相似,同时发掘在就业推荐场景中,学生一般会将热门企业作为自己求职过程中重点选择的公司同时参考相同职业类型下的高质量活跃同学的建议作为参考,由此引入企业热度值和专家推荐系数作为改进学生相似度计算方法最后结合 Top-N 进行推荐,实验结果与常见 UCF 推荐算法和 CCF 算法在推荐精度和推荐误差两个评价维度都有比较大的提升。

第一章  绪论

1.1  研究背景及意义
近年来,高校数量不断增加、高等教育招生人数逐年上升,应届毕业生数量也逐年增加。2014 年应届毕业人数为 727 万人、2015 年毕业人数为 749 万人、2016年毕业总人数已经达到 765 万人,2017、2018 两年的毕业总人数比往年总体增高3%,2019 年应届毕业总人数已经高达 834 万人[1]。从数据显示可知每年都会有大量的毕业生涌入人才市场,但是每年人才市场上新增的就业岗位数量却远远少于毕业生的数量。这种市场上供求严重不对等的情况为毕业生的就业带了极大的阻碍。人工智能技术应用的不断深入给传统市场结构体系带来了巨大的冲击,各公司都在积极调整内部人才结构组成,因此导致大量技术熟练人员重新流入人才市场。这种现象进一步加大了就业市场中应届毕业生的就业阻力[1]。学生就业问题随着时间的推移越来越受到社会各界人士的关注。为了改善高校应届毕业生就业现状,我国在体制上、政策上采取了一系列措施。就学校层面来看,各高校成立学生就业指导中心主动为学生提供求职指导,积极收集和发布招聘信息为学生提供及时可靠的就业消息[2],但是随着科技的发展,信息更新速度不断加快,目前范围性的信息推荐方式已经渐渐不能满足学生的求职需求。如何针对不同学生制定个性化的职业推荐是目前毕业生就业问题研究的主要方向。推荐系统是现如今最为流行的信息精准筛选的方法,因此将推荐系统引入毕业生就业问题研究是现下有效解决学生就业推荐的一种方法[2]。
经过国内外学者的多年研究,推荐系统的支撑技术已经相当成熟。但是将已经成熟的推荐系统直接移植到毕业生就业推荐场景中,由于背景环境和数据特征的差异使得推荐效果并不能满足毕业生就业需求[2]。目前毕业生求职推荐中主要存在的问题有:首先,推荐过程中只考虑了招聘方的要求,却没有考虑学生本身背景因素对求职成功率的影响;其次,就业推荐中并没有用动态发展的眼光来看企业的招聘意向,因此忽略企业招聘需求随时间的波动,最终造成由于推荐信息过旧而导致就业失败[2];最后,现有的求职推荐系统没有为毕业生提供实时动态的求职趋势分析信息,无法帮助毕业生及时掌握就业形势。为了给毕业生提供更加精准的就业推荐服务,本文一方面开展了基于用户的就业推荐算法改进研究和基于二分图的就业推荐算法改进研究;另一方面利用 Tableau 技术将往届毕业生的就业信息绘制成为就业形势画像,为应届毕业生提供精准的就业形势分析。
............................

1.2  国内外研究现状
1.2.1 就业推荐研究及存在问题
1991 年 Parks J B 利用美国一个大型本科教育管理的就业系统数据对该校学生的就业状况做出分析[7]。本次研究首次利用统计学原理分析了与职业薪水相关联的多维度的学生特征,最后给出有效的求职建议,自此开创了从数据分析角度给出学生就业指导意见的先河。2014 年 Nobel  M 借助 SPSS 平台采用定量和定性研究相结合的方式,分析了芬兰国际留学生在应用科学大学毕业后的就业情况,以此确定了学生就业的障碍因素[8]。2017 年 Verma  P 等人利用三维模型的多重测量值计算出面向每个职业的学生期望得分以此得到学生的就业偏好,最终根据学生的就业偏好给出令人满意的职业路径建议[9]。同年 Reusens M 等人利用与 Flemish 公共服务的合作关系,确定了一种基于隐式反馈的就业推荐算法[10]。此次研究展现了推荐技术相较于传统信息筛选在个性化就业推荐方面的强大优势,因此利用推荐技术在求职招聘领域为高校就业生提供针对个体的精准职业推荐是学生就业推荐的主要研究方向。
国内对就业推荐的研究相较于国外会晚一些。自改革开放以来,我国逐渐取消高校毕业生工作分配制,因此高校毕业生需要面临与社会人士相同的就业压力。2003 年朱国仁针对新时期我国高校毕业生就业问题,首次系统地论述了我国高校就业生的压力来源,以及从教育学和宏观政治调控方面给出了相关解决策略[11]。自此之后,我国高校学生就业问题研究才引起专家学者的关注。多年以来,我国对高校毕业生就业问题的研究主要停留在教育学理论层面,如何利用信息科学技术解决毕业生就业问题一直是该方向研究上所缺失的。毕业生就业推荐问题缺乏系统性研究的主要原因是学生就业信息存储残缺度过高。近几年,随着高校信息化建设的完善,学生各项信息得到完整的结构化存储,利用数据分析从信息技术层面为毕业生提供可靠就业指导成为可能。因此如何利用推荐技术为毕业生提供个性化就业推荐重新成为高校毕业生就业研究方向的重点。2011 年刘秀琪等人提出了一种基于模糊评价的方法,该方法给出目前高校就业推荐工作中的综合评价方案[12]。2016 年吉林大学实现了基于 web 的大学生综合评测系统,该系统实现了学生信息规范化存储以及学生信息数据化分析[13]。
.........................

第二章  推荐系统简介

2.1  推荐系统架构
在信息爆炸式发展的形势下,用户进行信息筛选检索的困难逐渐升高。个性化推荐系统作为信息检索技术的进一步发展能够为用户提供更加精准的信息推荐服务,因此推荐系统从提出开始就受到了科学研究和应用研究的广泛关注。经过多年的研究和探索推荐系统已经形成了一套成熟的技术体系,根据应用场景的不同推荐系统可以分为以下四种推荐方式[15]:
(1)基于热门计算的热门推荐,此类推荐主要存在于社交网络与新闻媒体行业,利用计算将曝光最高的物品推送至整个平台。该种推荐最成功的应用实例为新浪平台的热搜板块。
(2)人工推荐,在一些数据量较小、推荐内容比较单一的场景可以利用人工推荐达到最好的推荐效果。
(3)相关推荐,此类推荐方式常与个性化推荐相互结合一起应用于电子商务平台进行用户潜在购买商品的推荐。
(4)个性化推荐,此类推荐方式主要借助用户的历史行为针对每个用户提供独特的推荐方案。本文通过分析学生求职就业场景发现就业推荐中需要针对每个学生给出不同推荐方案,因此本文选择个性化推荐的方式作为研究的重点。
推荐系统整体架构从层次角度来看需要划分四个部分:系统架构、模型服务、算法模型、数据平台[15],见图 5。
图 5   推荐系统架构
...........................

2.2  常用推荐算法
推荐算法的设计是决定推荐系统能否为用户提供符合要求的推荐结果的关键。开发者需要通过分析不同的推荐场景选用合适的基础算法进行改进,推荐算法经过多年研究总结可以分为如下几种:基于邻域的协同过滤算法、基于内容的推荐算法和基于知识的推荐算法[21]。本节对课题所要研究的基于用户的协同过滤算法(User-based collaborative filtering recommendation algorithm, UCF)和基于图的协同过滤算法(Graph-based  collaborative  filtering  recommendation  algorithm, GCF)从推荐原理和推荐流程两方面做了详细介绍。
2.2.1  基于用户的协同过滤算法
协同过滤的核心思想是通过当前平台中已经存在的用户历史行为筛选与目标用户比较相似的近邻用户集,根据近邻用户集的历史商品集为目标用户筛选出一部分商品。从协同过滤的核心思想可以看出基于该类型的推荐算法都具有如下特征[22]:
(1)推荐算法的优劣与推荐内容无关,推荐准确性取决于前期对用户历史数据的分析。
(2)算法不考虑推荐物品的本身实际内容的情况下可以实现推荐结果具有多样性。
(3)算法实现简单,可实用性较强容易产生多样性的推荐结果。
协同过滤思想在推荐系统最开始被提出时就应用于推荐结果的产生中,多年来经过大量学者的不断研究与实验,针对不同的推荐场景衍生出多个基于协同过滤思想的推荐算法。基于邻域模型的协同过滤推荐算法是出现最早,目前应用最广的一种协同过滤算法模型[19]。
............................
 
第三章  毕业生就业数据获取及预处理 ................................ 31
3.1  用户画像及可视化技术 ......................................... 31
3.1.1  数据处理方法 ........................................ 31
3.1.2  用户画像标签体系 .......................... 34
第四章  适用于就业推荐的协同过滤改进算法 ................................ 47
4.1  算法设计与实现 ..................................... 47
4.1.1  建立用户背景相似子群 ..................................... 49
4.1.2  企业热度值 ............................... 50
第五章  基于企业招聘需求的二分图改进算法 ............................ 59
5.1  算法设计与实现 ............................................. 59
5.1.1  企业-学生属性关联模型 .............................. 59
5.1.2  企业招聘偏好系数 ....................................... 61

第六章  高校学生就业推荐系统的实现

6.1  系统环境介绍
就业推荐系统平台的搭建选取 Django 作为基础技术框架,Django 框架自带的后台处理功能使得开发重点可以完全放置在推荐算法实现和就业形势分析两个模块。平台搭建过程中需要的物理环境和软件环境具体见表 15。
表 15   就业推荐系统平台搭建环境清单
..............................
 
总结与展望

总结
随着风高校的不断扩招,毕业生数目不断增长,无论对于学生本人还是社会都将面临巨大的就业压力。本文引入用户画像概念对学生背景信息进行详细分析,提出了结合学生背景和企业招聘信息的两种推荐算法。本文的贡献和创新点如下:
(1)适用于就业推荐的协同过滤改进算法
通过分析往届毕业生就业去向信息得出,在应届生就业推荐场景中不同学生背景的就业倾向也会有所不同,因此提出了先建立学生背景相似子群,使得群落中学生的就业倾向和在校基本信息比较相似,同时发掘在就业推荐场景中,学生一般会将热门企业作为自己求职过程中重点选择的公司同时参考相同职业类型下的高质量活跃同学的建议作为参考,由此引入企业热度值和专家推荐系数作为改进学生相似度计算方法最后结合 Top-N 进行推荐,实验结果与常见 UCF 推荐算法和 CCF 算法在推荐精度和推荐误差两个评价维度都有比较大的提升。
(2)基于企业招聘需求的二分图改进算法
本文将企业作为推荐主体提出了一种基于企业招聘需求的就业推荐算法,该算法在原有的基于图论的推荐算法基础上引入就业场景中企业招聘偏好系数和企业招聘需求系数对基础推荐算法进行修正,使得改进后的推荐算法在学生就业推荐场景中有着更好的表现。
(3)高校学生就业推荐系统的实现
本文基于改进算法和学生求职形势分析结果设计实现了高校学生就业推荐系统,系统中就业推荐部分将两种推荐算法的推荐结果求并集最终全部展示给学生,就业形势分析模块利用 Javascript 所提供的 API 接口将 Tableau 分析结果嵌入 Web网页实现就业形势的实时更新交互。系统简单实现了学生反馈数据的采集为后续修正推荐算法提供数据依据。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217