本文是一篇计算机论文,本文提出了新的基于距离和以方面词为导向的图卷积神经网络(DAGCN)模型。通过对依赖树剪枝和引入新的注意力机制来整合局部和全局句法信息,然后加入KL散度到损失函数中保证两个GCN学习到的信息是不同的。
第1章 绪论
1.1研究背景
近年来,随着我国的高等教育规模逐渐扩大,每年有数千万高等院校的学生毕业。社会对他们的关注日益提高,主要关心的是他们应有的能力是否能匹配上他们的受教育水平[1,2]。事实证明,毕业生在高校当中学习到的专业知识在大多数情况下无法对应他们的能力。因此,进入到二十一世纪后,国家和高等院校通过一系列的手段提高学生的能力[3,4],例如产学结合[5],设置创新创业课程以及出台相关政策[6]等等,以此来提高高等教育教学质量,并达到二十大报告中提出的建设教育强国的要求。实际上,学生主要是在课堂上学习文化知识,即学生知识水平演变的主要阵地在课堂,教学活动的质量直接影响到了后续一系列问题。很长时间以来,中国的教育由于有应试的因素,一直以教师的意志为主,忽视了学生在学习过程中的主导地位[7,8]。《关于深化高等学校教师职称制度改革的指导意见》[9]中明确指出:“加强教学质量评价,把课堂教学质量作为主要标准,突出教书育人实绩。”所以,倾听学生的声音,获得学生在教学活动中的反馈,这对于提高学生的能力水平至关重要。
国内外研究者对教学评价有一定的研究[10],研究的重点从原先的基础理论研究,相关指标设置,到教学评价的有效性和评价工具设计,随着信息化时代的到来,评价数据由原先的纸质数据演变为数字型数据,且数量上逐渐增多,这使得运用计算机技术来研究教学评价成为可能,也成为了目前的焦点[11]。目前,众多高校成立线上评价系统,包含的评价数据分为两类:结构化评价数据和非结构化评价数据。结构化评价数据的形式为线上问卷,问卷中的问题内容为询问教师在某一教学维度,例如课堂教学、教学能力等上的表现,并让学生选择合适的答案[12-14]。答案的形式多为选项数据,即“是”和“否”,“符合”和“不符合”等;另一部分答案形式为评分,即对某一教学维度进行打分。因此,结构化的数据多为数值类型数据,很多研究采用统计学方法,尤其是机器学习算法处理此类数据,主要目的是把人们从人工发掘大数据的繁杂任务中解放出来,并分析其中隐藏的信息与关联规则,从多方面评价教师在某一教学活动中的表现。然而,此类方法存在一些缺陷:首先,提出的问卷是人为产生的,虽然问题可能由专家斟酌决定,但是依然较难覆盖全面的教学评价维度。
计算机论文参考
..............................
1.2研究意义
教学评价是学校教学质量保障的重要一环。它可以帮助教师处在学生的角度审视自己教学的过程,明确学生在此过程中的诉求,促进教师对教学活动的反思并进一步改进教学能力。现在,许多高校已经建立诸多线上教学评价的平台,邀请教育专家设计问卷考察教师在各个教学维度上的表现,形式多为选项或打分制。但是此种形式容易流于形式,问卷问题过于笼统抽象,无法与学生产生共鸣,学生也因此产生抗拒,达不到教学评价的目的。所以,非结构化评价数据,即教学评价文本可以使得学生直抒胸臆,评价的内容与学生内心所想完全匹配,观点更加真实,能最大程度上提升教学评价的质量。通过对教学评价文本不同粒度的分析,可以满足不同使用者的需求,从各个方面改进教学质量。基于此,本文的研究意义如下:
由于教学评价文本中存在较多的问题,例如短文本和默认好评的文本过多,非中文文本的使用以及标点符号的不规范使用等,并且在过往的研究中对此较少提及,本文定义了在评教领域下的数据预处理范式,通过建立过滤规则和正则化表达式对数据进行清洗,为之后情感分析奠定扎实的基础。
从细粒度的角度来说,采用句法距离加权(DSW)策略,给予句法距离较近的词更高的权重,这不仅有助于提升关键意见词的识别准确率,还能有效消除依赖树中的噪声。进一步地,通过引入注意力机制来适应观点词与方面词距离较远的情况并进一步地缩小候选观点词的范围。最后,在损失函数中添加KL散度,确保两个GCN学习到不同的信息,并最终提高了预测效果。
.............................
第2章 相关技术及整体研究框架
2.1相关技术介绍
从细粒度的角度来说,采用句法距离加权(DSW)策略,给予句法距离较近的词更高的权重,这不仅有助于提升关键意见词的识别准确率,还能有效消除依赖树中的噪声。进一步地,通过引入注意力机制来适应观点词与方面词距离较远的情况并进一步地缩小候选观点词的范围。最后,在损失函数中添加KL散度,确保两个GCN学习到不同的信息,并最终提高了预测效果。
图神经网络(Graph Neural Network,GNN)的核心创新在于其对图结构数据的有效处理能力。传统的深度学习模型在处理非欧几里得数据(如图数据)时存在局限性,而GNN通过邻域聚合和节点表示学习机制,能够有效捕捉图中节点间的复杂关系和结构信息。近年来,随着计算能力的提升和数据集的丰富,GNN在多个方面都取得了显著的进步。
首先是图卷积网络(Graph Convolutional Network,GCN)[66],在自然语言处理中依赖树可作为一种特殊的图看待,图中每个节点表示一个单词。通过聚合邻域节点的信息,更新每个节点的表示。这种聚合机制使得每个节点能够捕捉到其周围结构的信息,从而有效地学习图中的空间特征。其次是图注意力网络(Graph Attention Network, GAT)[67],它通过为每个节点的邻居分配不同的注意力权重来聚合邻域信息,不需要邻接矩阵。这意味着模型可以更加灵活地决定哪些邻居对当前节点更重要,从而实现更精细化的特征学习。最后是异构图神经网络(Heterogeneous Graph Neural Network)[68],这类网络专门用于处理包含多种类型节点和边的图。在异构图中,不同类型的节点和边可能代表不同的语义和功能。异构图神经网络通过设计特定的机制来处理这些不同类型的元素,从而能够更有效地捕捉图中的丰富语义信息。
...........................
2.2研究目标及框架
2.2.1研究目标
本文的整体目标为利用国内某高校的结构化评教数据和非结构化评教数据,通过细粒度和粗粒度的情感分析方法,分别预测每个学生对教师授课行为的多方面情感态度和所有学生对某一教学活动的整体感受,分别为今后教师改进自身教学方法和教学管理者提高整体教学质量提供参考。
对于评教领域的方面级情感分析来说,针对非观点词对方面词的情感极性判断存在干扰的问题,我们首先观察到多数情况下,在依赖树上观点词和方面词的句法距离较近,通过句法距离让模型聚焦于局部句法范围,提高识别观点词的概率。同时,考虑到依然存在观点词和方面词句法距离较远的情况,我们提出新的注意力机制兼顾全局句法信息并同时进一步在局部句法范围内筛选候选观点词。然后,将前两者通过一定规则做信息融合,让全局句法信息和局部句法信息整合在一起,并基于此构建GCN提取句法信息。此外,为应对句法结构不严谨的语句,自注意力机制被用来构建另一个GCN的邻接矩阵,使得语义信息也考虑在内。最后,将句法信息和语义信息通过信息交互模块融合在一起得到最终的预测结果,损失函数中还添加KL散度来保证两个GCN学习到不同的信息。根据实验结果可知,此章提出的模型可以比其他基线模型获得更好的预测结果。
对于评教领域的篇章级情感分析来说,针对数据标注规则不再适配评教领域和传统机器学习模型与深度学习模型不具备教育先验知识的问题,我们首先遵循教育学和心理学理论构建数据标注的prompt,然后将数据输入到ChatGPT中标注数据,在此充分利用ChatGPT蕴含的丰富教育知识以及与人类高度一致的价值观,确保标注的结果符合学科属性和无害性。然后,再利用ChatGPT构建多个教学评价专属的prompt,详细描述教学评价场景和任务需求,使得后续大模型准确理解任务目标。最后,评价文本被填入进prompt后输入到中文大模型中提示其需要遵循的指令,以此激发大模型隐含的教育领域知识,同时还有效地增加数据的多样性和数量,让大模型更能充分理解此任务的需求,避免陷入局部最优。从实验结果来看,该部分提出的模型明显优于之前的工作,证明了提出模型架构的有效性。
..............................
第3章 基于距离和以方面词为导向的方面级情感分析.................... 16
3.1 DAGCN模型..................... 19
3.1.1 词嵌入层...................... 20
3.1.2 上下文信息交互层................. 20
第4章 基于提示工程的篇章级情感分析................................ 48
4.1 模型概述 ........................ 50
4.1.1 提示工程构建.......................... 50
4.1.2 中文大模型微调.................. 52
第5章 总结与展望................................. 73
5.1 本文总结 ........................ 73
5.2 未来展望 ........................... 74
第4章 基于提示工程的篇章级情感分析
4.1 模型概述
Prompt实际上由两部分组成,包括template和verbalizer。Template是指示或引导语言模型执行任务的文本,verbalizer是大模型输出结果的答案映射。在template中,往往包含两类空缺位置和。表示输入数据的所在位置,在本章中即为输入的某门课的所有评价文本。表示大模型输出结果的位置,由于大模型的架构一般来说是 decoder-only,在该位置上的输出通常为在词典中挑选概率最大的词汇,但是输出的词汇不一定是对应的标签,所以需要verbalizer对答案进行映射,最终与标签计算损失。
基于上述prompt的概念,prompt可由下列三个要点组成:
1. 任务要求描述。本章的场景为教学评价,任务要求是从全局的角度评判学生对教师的情感态度。因此在构建prompt时,需要提前描述清晰教学评价的含义和作用,激发大模型内部关于教育的所见所闻,以教育专家的角度评阅学生的评价。另外,与第三章细粒度的情感分析不同,大模型不再是着重观察评价的细节,而是从整体角度把握学生的情感共性,要求大模型具备较强的大局意识。
2. 固定输出格式。本章的任务依然属于文本分类,在verbalizer阶段会有很多词汇对应同一个情感极性,如果都对它们做与标签的映射话需要耗费大量的人力物力,不太现实,因此在template中告诉大模型从积极、中性和消极三个词语中选择答案输出。同时,要求大模型使用简短的答案或一个词来回答,这是因为大模型在回答时可能会对自己的答案进行解释或者输出对于分类来说无意义的文本,因此要求输出格式是至关重要的。
计算机论文怎么写
..............................
第5章 总结与展望
5.1 本文总结
随着中国高等教育的快速发展,社会对大学生的教育质量与其能力是否匹配提出了高度关注。尽管大学专业知识的学习与毕业生实际能力往往不符,但教育部门正采取措施如产学合作和创新政策来提升学生能力,以实现教育强国的目标。课堂教学质量直接关系到学生能力的提升,而《关于深化高等学校教师职称制度改革的指导意见》强调了提升教学质量的重要性,尤其是倾听学生在教学活动中的声音。随着数字化进程,大量教学评价数据的产生为利用计算技术提供了可能,这些数据包括结构化的问卷数据和非结构化的文本反馈。后者尤为重要,因为它们能详细反映学生对教学的全面感受,为提高教学质量提供了关键信息。其中,对评教文本进行细粒度情感分析揭示学生对教师在特定教学维度的具体看法,其中情感丰富的词汇表达出难以直接察觉的感受,根据分析的结果帮助教师理解学生的内心需求并提供个性化教学。从宏观角度看,尽管学生评价存在个体差异,通过提取共性可以评估教师的整体教学表现,为教学管理者制定后续教学政策提供科学可靠的指引。因此,我们从细粒度和粗粒度两个角度分别建模,以此来达到理想的预测结果。
针对细粒度情感分析问题,本文提出全新的基于距离和以方面词为导向的图卷积神经网络(DAGCN)模型。通过对句法距离的统计分析,我们发现观点词在局部上下文中出现的概率更高。因此,我们采用了句法距离加权(DSW)策略,给予句法距离较近的词更高的权重,这不仅有助于提升关键意见词的识别准确率,还能有效消除依赖树中的噪声。进一步地,我们构建了依赖权重矩阵(DWM)来存储DSW,并通过注意力函数(AF)更新DWM,以适应那些观点词与方面词距离较远的情况并进一步地缩小候选观点词的范围。最后,受到之前研究的启发,我们定义了一个用于处理句法结构不严谨语句的语义图卷积网络(SaGCN),并将KL散度融入损失函数中,以确保AoGCN和SaGCN学习到不同的信息,即AoGCN学习到句法信息,SaGCN学习到语义信息。与其他基准模型相比,DAGCN无论在评教数据集还是公共数据集上都取得了卓越的表现,这证明了我们提出的架构的有效性。关于粗粒度情感分析,我们根据教育学和心理学的相关理论制定了标注规则,并使用ChatGPT标注数据,保证标注过程符合学科属性的同时也与人类价值观保持一致。
参考文献(略)