强连接下用户影响力模型构建及人格特质表现研究

论文价格:免费 论文用途:其他 编辑:硕博论文网 点击次数:
论文字数:35588 论文编号:sb2020050511531730832 日期:2020-05-07 来源:硕博论文网
本文是一篇管理论文,本文提出了适用于微信朋友圈的用户影响力度量模型来计算用户影响力强度大小,从结构维度、行为维度、内容维度三个维度对用户影响力进行基础性测量,随后运用熵权法和 LeaderRank 迭代获得综合用户影响力。最后通过爬取微信朋友圈数据验证模型,并与 LeaderRank、用户受欢迎度和UIEM 三种用户影响力度量模型进行对比,用度量结果重复率、意见领袖挖掘的准确率和召回率来评价模型的实用性和有效性。人格特质作为一种个性特色的表现,与用户行为有着较高的一致性,通过探究人格特质与用户影响力之间的联系,可以挖掘出人格特质在用户影响力上的表现形式,并为分析人格特质在用户影响力形成和传播过程中的作用提供参考。本文对爬取的微信朋友圈数据进行预处理,运用文心软件构建语言文本特征,随后结合行为特征作为自变量,人格量表报告结果作为因变量,对比了多元线性回归、决策树回归和随机森林回归三种回归预测模型,最终选择随机森林回归模型完成剩余用户的人格特质评估,实现使用机器学习和人格量表互补的方法获取用户的人格报告。随后本文根据用户的代表人格将用户群划分为特质集群,探究了人格特质在用户影响力维度上的表现形式。

第1章  绪论

1.1 研究背景与目的
随着移动端技术和线上社交网络越发成熟,社交软件的发展给人们日常的生活与工作带来了巨大的变化,它影响着人们的社交模式,改变了人们沟通和合作的方式。一方面,现在的社交平台不断完善化和多样化,从早期的博客社区型社交,到图片+短文本互动社交,再到现在火爆各个应用商店的短视频社交,如抖音,快手等 APP。人们在线上的自我表达和展现不再单纯地局限于本文字段,用户能够通过更加多样的方式将真实的自我展现在线上社交网络。线上社交网络已渐渐变成人们线下社交的一个延伸,它与现实生活中的社交网络有所不同但又相互联系。另一方面,人们已经习惯借助社交 APP 在社交网络平台上分享日常的生活,讨论热点话题,发表自身的看法和观点。人们不再单纯地作为内容的接收者,他们还成为了内容的生产者和信息的传播者。大量形式多样且内容丰富的用户原创内容(UGC)为普通用户成为线上社交网络中的影响力用户(意见领袖)创造了机会。此外,这些海量的用户原创内容和社交交互数据也为社交网络研究提供了良好的条件。根据《2018 年微信数据报告》表示,微信的月活跃用户已超过 10.8 亿。微博在 2018 年 12 月最新披露的数据中表明,微博的日活跃用户已超过 2 亿。当下的社交软件根据社交关系的强弱可分为两类[1]。一类是以微博、论坛、抖音为主的弱连接社交软件,弱连接社交网络的特点在于用户的异质性比较强,彼此之间的关联不紧密,不具备太强的感情联系,往往线下两个用户并不相识,这类社交软件有助于信息的传播[2]和求职检索[1][2]。另一类是以微信、qq为主的强连接社交软件,强连接社交网络的特点在于用户的同质性较强,彼此之间的关系紧密,往往是线下社交关系的线上迁移,用户往往相识,这类社交软件可以提供情感支持,提高用户的主观幸福感[3],有助于提升新产品的接受度,具有更多的经济价值[4]。当下火热的社交电商正是以微信、QQ 这一类强连接社交软件为切入点,主打朋友圈开店引流策略,借助熟人网络实现病毒式营销。
..........................

1.2 国内外研究现状
1.2.1 人格特质研究现状
人格特质是指个体区别于其他人的稳定的思维、情感特点和行为方式,它与个体行为具有较高的一致性,能够有效地对个体的行为做出解释和预测。人格特质的理论派系众多,主要有行为主义派系、认知派系、特质派系和生物学派系等。人格类型理论是特质派系中的典型,Myers Briggs Type Indicator(MBTI)[13]是人格类型划分模型中应用最为广泛的评估方法。人格类型理论提出将人群根据社交行为的不同划分为固定的几个集群,每个类型集群之间存在较大的区别。该理论在现实生活中有着良好的群众基础,且在企业中被人力资源业务广泛应用。但因其假定的理想化问题,现仍存在一定的争议。
大五人格理论从宜人性(Agreeableness)、责任心(Conscientiousness)、外向性(Extraversion)、神经质(Neuroticism)和开放性(Openness to Experience)五个维度来描述一个人的人格,它是人以群分,物以类聚现象的理论支持,不同于 MBTI 模型对人群的分类,它强调的是一种聚类思想。大五人格模型的具体描述如下[14]:
宜人性(A):对人信任,利他主义,乐于助人,具备共情心等特质。宜人性项得分高者的特点是乐于助人,待人脾气好,为人谦虚,信任他人;而得分低者的特点是疑心重,无情,刻薄,缺乏同理心。
责任心(C):具有责任心,自律意识强,做事认真严谨,追求成就等特质。责任心项得分高者的特点是做事认真,勤奋负责,自律意识强,时间观念强;而得分低者的特点是做事马虎,杂乱无章,缺乏自律性,时间观念差。
外向性(E):热情活跃,热衷社交,为人乐观,喜欢冒险等特质。外向性项得分高者的特点是热爱社交,健谈,感情外露;而得分低者的特点是为人孤僻,
不合群,不善于表达自身感情。神经质(N):焦虑压抑,自我意识,为人冲动,心理脆弱等特质。神经质项得分高者的特点是情绪暴躁,缺乏安全感,感情用事,自怜自哀;而得分低者的特点是处事淡定,为人冷静,自我满意。
图 1-1 论文研究技术路线图
.........................

第2章  相关理论及文献综述

2.1 人格特质评估与预测的理论基础
借助机器学习对人格特质进行识别与预测是作为人格特质评估的重要支系,它是传统的人格量表手段的互补手段,能够有效地提升人格特质评估的准确度和可靠性。互联网时代下,人们在日常的交流沟通、工作协调、社交活动和 APP 使用的过程中会不经意地且不可避免地遗留下一些带有人格特色的行为数据。人们喜欢在社交平台上分享自己的观点和日常活动,也喜欢借助社交平台去了解他人的生活和态度,因此用户在社交平台中会留下与他们人格特质相关的行为数据,且这些数据能够有效地描绘出用户真实的人格特质。目前,通过社交网络中用户的行为数据对用户进行人格特质分析和识别主要有两个角度,一个是行为特征数据,另一个是语言特征数据。
对人格特质的语言-行为分析研究目前已有一定基础。Blackwell 等人对 207位 facebook 用户的社交数据进行了分析,表示相对于内向型的用户,外向型的用户通常有更多的朋友数,且拥有更多的社交群组。神经质用户更喜欢频繁地发布动态、点赞、转发或评论[22]。孙晓晨表示宜人性和外向性人格的用户会拥有更多的资源,且更容易获得来自于他人的尊重和信任,神经质人格的用户倾向于在社交网络上抒发自身情感和情绪,神经质人格与自我披露具有高度的相关性[23]。Schwartz 等人对 7 亿个单词、短语和话题实例进行了词类分析,并探究了人格特质、性别和年龄与这些语言运用的联系[24]。Yaekoni 从谷歌博客爬取了 5000 位用户的社交数据,随后通过邮件发放 NEO-PI-R 获得了 694 位用户的人格特质数据,借助 LIWC 软件对这些用户的社交内容进行分析,发现大五人格与 LIWC 中的 64 类词汇之间存在关联性[25]。
........................

2.2 用户影响力度量
根据目前在社交网络的用户影响力研究中侧重点的不同,本文对相关的用户影响力度量模型进行了梳理,分为三类用户影响力度量模型,分别是基于社交网络拓扑结构的影响力模型,基于用户交互行为的影响力模型和用户交互内容的影响力模型,其中后两者的影响力度量模型中都会涉及到一些基于社交网络拓扑结构的影响力度量方法,是一种补充拓展。
(1)基于社交网络拓扑结构的影响力模型。
这一种影响力度量模型的特点是以网络拓扑结构和图论为基础,通过对节点本身和节点之间联系进行建模分析,用节点模拟用户,用边来模拟联系或者信息传播的渠道。Freeman 提出了度中心度和介数中心度用于表示当前节点对其他节点的影响力[30]。在拓扑网络的无向图中的节点度可以表示社交网络中用户与用户之间的联系。而有向图中节点本身的出度和入度则可以被视作用户间的交互行为如点赞,评论等,也可以表示信息的传播路径。度中心度是一种基于节点度的计算方法,可以用于表示当前节点对其他相邻节点的平均用户影响力大小,如公式 2-1 所示。
2-1
...........................
 
第 3 章  朋友圈数据爬取与预处理 .................................... 16
3.1 朋友圈数据爬取...................................... 16
3.2  朋友圈文本数据预处理.............................................. 17
3.3  本章小结...................................... 19
第 4 章  微信朋友圈的用户影响力度量模型构建 ...................... 20
4.1  相关变量定义...................................... 20
4.2  微信朋友圈的用户影响力度量模型构建.............. 20
第 5 章  微信朋友圈的用户影响力度量模型验证 ............................... 31
5.1  对比模型概述..................................... 31
5.2  模型对比指标选择................................... 33
5.3 模型有效性验证.................................. 34

第6章  人格特质的用户影响力维度表现探究

6.1 人格特质评估
用户人格数据获取的方法主要有三种:自我报告,API 直接获取和开放数据集。自我报告法就是以问卷形式获取用户的人格数据,python 的 Twitter 包是 API直接获取的代表,Facebook 的 myPersonality 数据集是开放数据集中的代表。由于人格量表存在局限性和主观性,近些年来有学者提出借助机器学习的方法,对文本进行分析,与人格量表互补进行人格特质的预测性评估。Yaekoni 通过对博客数据集分析,发现了人格与词汇使用差异之间存在联系,并强调了互补方法在人格评估研究中的价值[25]。在目前的社交网络人格预测领域中,应用较为广泛的预测方法是以爬取的用户数据为基础,借助 LIWC 工具从文本中提取偏好主题要素,即封闭词汇法,提取用户的语言特征和行为特征统计,获取特征向量,进而构建预测模型。预测算法比较多元化,主要有决策树、SVM 和多元线性回归等等机器学习算法。
因为微信提供的 itchat 接口只能获取到基础的用户属性信息,没有关于人格数据的 API 接口,且目前没有公开的微信用户的人格特质报告数据集,所以本文选择通过人格量表对部分用户的人格特征进行了评估。通过线下联系,获得部分用户的授权,并通过大五人格测试问卷 44 题简本(详见附录)获得他们相对应的人格数据,用于预测模型的训练。通过问卷星的问卷发放,去除不符合最小活动数的阈值 30 条和无法完成昵称和 id 匹配的问卷,共计回收有效 126 份问卷。随后本文从爬取的朋友圈数据中提取了用户的交互行为数据,然后参考 Tandera等人使用 LIWC 字典工具构造特征向量[51],本文选用文心分词系统,最后选择具有最佳指标的预测模型,对其余用户进行评估。人格特质评估流程如图6-1所示。
图 6-1 人格特质评估流程图
..........................

第7章  研究结论及展望

7.1 研究结论
随着移动端技术和线上社交网络越发成熟,在人们社交过程产生的海量社交数据为线上社交网络的深入研究提供了可靠的条件。同时,社交电商的概念越发成熟,熟人网络中的意见领袖的价值正在不断提高。如何有效地挖掘出意见领袖,以较低成本获取并转化潜在的用户,是目前社交电商发展的关注点之一。用户影响力的相关研究是意见领袖挖掘的基础,因此对强连接社交网络中的用户影响力度量与分析有着重要意义。本文提出了适用于微信朋友圈的用户影响力度量模型来计算用户影响力强度大小,从结构维度、行为维度、内容维度三个维度对用户影响力进行基础性测量,随后运用熵权法和 LeaderRank 迭代获得综合用户影响力。最后通过爬取微信朋友圈数据验证模型,并与 LeaderRank、用户受欢迎度和UIEM 三种用户影响力度量模型进行对比,用度量结果重复率、意见领袖挖掘的准确率和召回率来评价模型的实用性和有效性。
人格特质作为一种个性特色的表现,与用户行为有着较高的一致性,通过探究人格特质与用户影响力之间的联系,可以挖掘出人格特质在用户影响力上的表现形式,并为分析人格特质在用户影响力形成和传播过程中的作用提供参考。本文对爬取的微信朋友圈数据进行预处理,运用文心软件构建语言文本特征,随后结合行为特征作为自变量,人格量表报告结果作为因变量,对比了多元线性回归、决策树回归和随机森林回归三种回归预测模型,最终选择随机森林回归模型完成剩余用户的人格特质评估,实现使用机器学习和人格量表互补的方法获取用户的人格报告。随后本文根据用户的代表人格将用户群划分为特质集群,探究了人格特质在用户影响力维度上的表现形式。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217