基于改进模拟退火算法的项目选择优化方法之计算机研究

论文价格:免费 论文用途:其他 编辑:硕博论文网 点击次数:
论文字数:30655 论文编号:sb2019091720180827849 日期:2019-10-15 来源:硕博论文网
本文是一篇计算机论文,  本文的创新点是将遗传算法和模拟退火算法相结合形成一种新的启发式项目选择方法,该算法首先通过遗传算法搜索当前最优解,并将当前最优解作为模拟退火阶段的初始解,然后再进一步的进行最优解的探索。算法在保留了遗传算法较强的全局搜索能力的同时,也吸收了模拟退火算法超强的局部搜索能力,避免了局部最优的情况产生。

第一章  绪论

1.1 研究背景
考试是教育评价[1]的形式之一,可以及时的反馈出学生对于知识的掌握情况,测试学生的能力水平[2],是教育工作者了解学生学习情况最有效的途径,也是国家和企业选拔精英的主要方式。在日常教学生活中,教育工作者可以根据学生的考试成绩来检验自身的教学成果以及评估学生对于知识的掌握情况[3],以便在今后的教学工作中针对自身的不足和教学中的遗漏进行改进;学生则可以通过考试成绩来了解自己过去一段时间里对于新知识的掌握情况。传统的考试都是以纸笔测试(Paper & Pencil Test,PPTs)为主要形式,它的基础理论是经典的测试理论(Classical Test Theory,CTT),是真分数理论[4]的代表之一,它的优点[5]是建模简单、容易计算、适用性广泛,并且对于容量小的被试样本,测试结果的准确性高。但是该理论也受到了一些限制,例如测试题目内容的同一性,使得分数处于两端的被试无法测试出自己的真实水平,相同分数的被试也没有合理的解释找到差异,并且传统的 CTT 理论依赖被试样本对测试参数的项目难度区分,而对测试题目本身的难度区分等因素没有考虑。所以综上所述,传统的笔试考试形式已经不能科学地反映出学生的真实水平,必须设计更加合理的测试方法,以达到“因人而异”的效果。
在第三次科技革命的推动下,几十年来,随着计算机应用技术和互联网的飞速发展,人们开始尝试着运用信息技术来辅助教育领域[6],所以以计算机为主要工具的计算机自适应测试[7]( Computerized Adaptive Testing,CAT)登上了历史舞台,它巧妙地运用了被试的实时能力水平,使计算机模仿人类的智能评估行为,智能化地为被试选择测试试题,按照被试的得分情况以及事先确定的终止条件[8],计算机来决定是否停止测试的一种智能测试[9]。计算机自适应测试的理论基础是项目反应理论[10][11](Item Response Theory,IRT),该理论运用心理学[12]和数学中概率论的方法,描述了被试与测试项目试题之间的相互概率关系,并通过数学模型的建立,使计算机达到自适应目的。
.............................

1.2 国内外现状
20 世纪 70 年代之后,全行业都以计算机平台为基础开始了产业升级,与教育学和心理学相关联的自适应测试研究也更上一层楼,应用途径也更加广泛。依靠着项目反应理论的不断完善[13]、项目池题库的升级优化[14][15],计算机自适应测试越来越受到关注,尤其是项目选择方法,作为计算机自适应测试的根基技术,更是得到了国内外学者的广泛研究。好的项目选择方法可以提高自适应系统的效率,包括减少选题时间、提高项目池试题的利用率以及提升被试预估能力值的准确性,因此项目选择方法在自适应测试中起着“承上启下”的作用。
1.2.1 国外研究现状
国外在计算机自适应测试的研究分为理论研究和应用研究两个方面,理论研究还是以计算机自适应测试里面的模型建立和新自适应测试理论[16][17][18]的研究为主,应用领域包括以测验、编程学习[19]、语言学习[20]、医疗诊断[21]为目的的自适应测试系统的实现研究。项目选择方法的研究层面,国外也进行了大量的研究。
1、最大信息量法(MI)
Lord 在 1977 年基于 0-1 评分模型的基础上提出了难度匹配法(Optimal Item Difficulty, OID),这是计算机自适应测试的最初形式。但是这种方法依赖于初始测试项目的选择,测验效率较低,随后 Lord 根据被试能力水平和项目信息量之间的关系提出了最大信息量法[22](Maximun Fisher Information,MFI),最大信息量方法的假设是:一个项目的信息量越大,对被试的评价结果就最接近于真实的结果。最大信息量法的优点是测量的精确度高,因为它每次为被试挑选试题时,都是选择剩余项目池中信息量最大的项目试题给被试,所以它的收敛速度快,在测试的初期,系统的预估值接近被试的真实能力值。这种方法的缺陷在于,信息量大的项目会被经常选中,严重影响的项目曝光度,导致题库里面的题目运用不均衡,项目池题库的安全性受到了挑战。
2、曝光控制法[23](S-H):
针对项目曝光度不均的问题,学者们继续进行了深入的研究,提出了多种方法,最开始是随机程序法,通过对项目池中区分度高的项目进行筛选,然后从中随机选出来一个项目让被试进行作答,虽然此方法可以降低一些区分度高的项目被频繁使用,但是没有从根本上解决项目曝光度高的问题[24]。随后 Sympson  和 Hetter 提出了基于条件概率的项目曝光控制方法,即 S-H 算法,他们通过调整不同项目的曝光值,把曝光率低的项目控制值调大,同时将曝光率高的项目控制值调小,以此来实现曝光控制,曝光控制法的优点是通过前期的模拟测试,人为地调整曝光控制参数,使项目池题库的安全性得到了保障。但是此方法对于前期测试样本内容依赖度很大,如果实际项目和样本的差别较大,就会严重影响测试效果。
.................................

第二章 相关基础理论与技术

2.1 项目反应理论(IRT)
2.1.1 IRT 理论概述
项目反应理论(Item Response Theory,IRT)最早在心理学研究领域中被提出,由于它可以通过测试过程,发现被试的心理特质和潜在能力,进而猜想出被试者对于试题检测的反应,所以最初也被称之为潜在特质理论(Latent Trait Theory,LTT),它将被试对于试题的特征反应概率与试题的特质联系了起来,最后将试题和被试的关系用数学模型描述出来,一般都用项目特征曲线[38](Item Characteristic Curve,ICC)来展现二者之间的关系。
1950 年前后,项目反应理论由美国人费雷德里克-洛德(Frederic M. Lord)和丹麦人格奥尔格-罗旭(Georg Rasch)分别提出,虽然他们分别用于统计学和心理学的方法做研究,但是他们得出来的结论大体相同。1952 年,第一个项目反应模型——双参数正太卵模型,由普林斯顿大学的 F.Lord 提出,这个模型通过正态分布函数来描述项目特征曲线,解决了实际生活中的二值评分问题,至此项目反应理论开始被世人所接受,双参数正太卵模型的提出标志了项目反应理论的诞生。随后格奥尔格-罗旭提出了 Rasch 模型,但是这个模型只有一个难度参数,
实际应用效果不如双参数正太卵模型,此后,人们根据参数数目的不同,又相继提出了单参数、双参数和三参数模型。
2.1.2 IRT 理论的基本假设
项目反应理论包括四种强假设[39],它们分别是:
1、被试潜在能力的单维性假设 假设被试的能力变量是单维的,其他的能力都是定值不变量,因此项目反应理论可以对不同的被试之间只进行一个单维的比较,即只测试被试的一种能力,而其他能力都是相同的。虽然说这个假设不严谨,但是这个单维性假设是指所有影响因子中最主要的影响因素。
2、测试项目的局部独立性假设
被试在进行某一项目测试时的特征反应,不会影响被试在做其他项目测试时的特征反应,项目试题的参数独立于被试的不同样本,同样被试的反应也会被分开统计完全独立。
...............................

2.2 遗传算法(GA)
2.2.1 遗传算法概述
遗传算法[43][44]是以达尔文的“进化论”为基础,模拟自然界中生物种群的遗传和变异特征,形成的一种自适应全局优化搜索算法。根据“适者生存”的自然法则,遗传算法将问题的求解过程模拟成一个生物种群内部进化升级的过程。
遗传算法的主要特点是采取概率论的方法,使种群内部自适应地调整搜索方向,通过预先的终止原则,在进化的生物种群中也就是优化后的搜索空间内去寻找近似最优解。
遗传算法将群体内部所有个体(染色体)为进行编码,同时计算个体适应度,来挑选优秀的染色体进行遗传操作,随后通过染色体的选择、交叉和变异得到下一代种群,新一代种群总是比上一代的种群更加优秀。因此,最后一代中,种群适应度最优的个体即为全局最优解。
2.2.2 遗传算法的相关要素
1、染色体
染色体作为遗传物质的主要载体,由多个基因组成,是遗传算法问题解的一种表现形式。染色体的编码形式会影响遗传算子的运算方法,同时也决定了遗传算法的效率。目前的染色体编码方式有二进制编码法、浮点编码法、符号编码法。
2、适应度函数
在遗传算法中,适应度是描述个体优劣的指性能标,根据染色体适应度的大小,对个体进行优胜劣汰,因此适应度是遗传算法的驱动力。遗传算法将问题的目标函数与个体的适应度建立映射关系,即遗传算法在种群体进化的过程中,可以根据个体的适应度去寻找最优解。适应度函数也称评价函数,适应度函数总是非负的,而目标函数可能有正有负,所以遗传算法要在目标函数与适应度函数之间进行权衡,任何情况下都希望它的值越大越好。
..............................
第三章  项目选择方法的分析与优化 ...................................... 18
3.1  项目选择方法分析 ...................................... 18
3.1.1  最大信息量方法和曝光控制法............................. 18
3.1.2  分层方法 .......................................... 18
第四章  遗传-模拟退火算法在自适应系统中的应用 ..................................... 28
4.1  项目池的构建和被试的生成 ..................................... 28
4.2  计算机自适应测试的实施过程 ............................. 30
4.3  项目选择方法实验结果分析 ................................. 31
第五章  自适应测试中项目选择系统的设计与实现 ................................. 36
5.1  项目选择系统的基本概述 ....................................... 36
5.2  系统的分析与建模 ........................................... 36

第五章 自适应测试中项目选择系统的设计与实现

5.1 项目选择系统的基本概述
项目选择系统根据不同被试人员之间能力水平的不同,为每一位被试选择一个适合被试作答的项目试题,以此来准确的评估被试的能力,系统将计算机的自适应性和被试人员的主观能动性相结合,使评价结果更加具有说服力,达到自适应系统所要求的“因人施测”的目的。本节首先阐述目前自适应项目选择系统所存在的不足,随后对本文所提的项目选择系统进行阐释说明,并对系统的主要功能和界面进行展示。
目前,国内外已涌现出多种学习系统、测试系统等,但是它们存在以下问题:软件系统设计、开发不够合理和完善,结果造成了系统的内部结构僵化,进行系统的优化和升级时将变得困难,而且系统之间的集成过程也非常的复杂,导致系统的可重用性、可移植性和可靠性不足。所以,为了设计一个重用性强、可移植性简单、可靠性高的项目选择系统,需要建立一个科学合理的软件系统设计方案。
本文提出的项目选择系统的方案如下:首先对系统的基本流程进行详细的分析,也就是说把项目选择系统的主体和基本流程都确定下来,包括项目池的确定、项目选择方法的确定和被试能力水平测评方法等等;随后,进行领域建模和功能建模;最后进行系统的数据库设计,系统框架的选取等等,最终完成项目选择系统的实现。
...........................

第六章 总结与展望

6.1 总结
第三次科技革命源于计算机和互联网的飞速发展,在信息时代之大背景的烘托之下,传统的教育学里面,包括现代教育技术在内,它的发展也走向了信息化和智能化的道路,教育评价作为教育学里面重要的分支之一,也顺理成章的搭上了信息时代的顺风车。教育测试,作为教育学中的一种重要的教育评价行为,它影响着学生、老师和教育方法三者之间的相互促进与发展。传统的教育测试形式是笔试测试,所有学生都做同一套试题,可是这种一套试题对应所有学生的测试形式,忽略了学生们发展不平衡性的特点,没有关注学生们的个性发展,也检测不到学生们的真实能力水平,传统的笔试测试的效果不甚理想。因此,借助计算机作为辅助平台来开展教育评价,是教育学发展的大势所趋。
计算机的测试分为计算机的测试和计算机自适应测试,前者和传统的笔试测试形式大体相同,只不过是将笔试行为放到了人机交互界面上来进行,因此在教学评价上没有革命性的贡献;后者则摆脱了传统教学评价中的机械化和非个性化的束缚,采取了智能化的手段进行科学的、系统的教育评价行为。计算机自适应测试的指导思想是:计算机模仿人类智能评估的行为,通过给被试者提供适合被试能力水平的项目,积累并观察被试者在项目上的反映情况,来估计被试者的真实能力水平,切实做到了先“因人施测”,再“因材施教”的目的。
自从上个世纪 80 年代第一个自算计自适应测试系统问世以来,经过 40 多年的研究与发展,已经细化分成了很多子问题方向,这些子问题包括项目池题库构建、被试能力评估方法、项目选择方法和项目终止技术等。这其中项目选择方法是自适应测试中非常重要的一环,项目选择的好坏既关系项目池题库的安全性和实用性,也关系到后期对被试进行评估方法的准确性。而且实践证明,当为被试选择的项目与被试的能力值相当,且选题的速度适当时,被试的积极性最高。因此如何设计一个良好的项目选择方法是计算机自适应测试中的重要课题。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217