这是一篇心理学博士论文范文,本文实证研究基于人格测评的真实数据,对 IIV-IRT 和 IIV-GGUM 模型进行了系统而深入的探索,充分揭示了在测量模型中引入个体瞬时波动参数的潜在价值。研究结果不仅验证了个体瞬时波动在实证数据中的实际存在性,还进一步证明了其测量效度,表明个体瞬时波动不仅仅是随机噪声,而是个体特质水平的重要特征。此外,本研究还探讨了个体瞬时波动与其他关键变量之间的关联模式,揭示了其在个体能力测评、心理状态波动以及应试策略等方面的作用机制。


目录
摘要
ABSTRACT
引言
1 文献综述
1.1 个体内部变异
传统心理学研究将关注点集中在个体的平均结构上,通常假设个体特质是一个固定不变的数值,而个体内部的波动往往被视为误差,归因于各种外部因素,并被认为在跨样本间具有一致性。例如,在混合效应模型中,未解释的方差通常被视为一个固定不变的常数,并归入残差分量,使得每个人仅贡献其特质分数。这种假设简化了统计方法的应用,便于数据处理。然而,有研究者提出,心理学研究应以个体为基本分析单位,个体是一个独特且完整的有机体,是一个复杂的动态系统,其特征受多种内生与外生因素的共同影响,个体具有可变性、复杂性和动态属性(Ford & Lerner, 1996; Magnusson, 2000; Molenaar, 2004; Thelen & Smith,2002)。
1.2 个体瞬时波动
个体内部变异是一个多维动态系统,其理论内涵可以从不同维度系统解析。Fiske 和 Rice(1955)在研究中根据个体内部变异的来源将个体内部变异划分为Type I、Type II 和 Type III 类三种类型,但他们的核心关注点始终是 Type I。他们强调,Type I 变异是在外部刺激和情境保持不变的条件下,个体对刺激的反应变异,是由个体内部因素产生的,因此是理解个体内部动态变化的关键概念。相比之下,他们对 II 类和 III 类变异的讨论更多是作为理论区分的辅助工具,意在厘清 I 类变异的定义,而非研究的核心目标。对于 II 类变异,他们指出这类变异除了包含 I 类变异的所有决定因素外,还额外受到了时间顺序的影响,如学习效应、疲劳效应或周期性波动,因此其研究价值主要在于揭示个体对自身先前反应的适应性调整。对于 III 类变异,他们认为其关注点在于个体在不同刺激或情境变化下的适应程度,而非个体在稳定条件下的自身波动,因此未对其展开深入探讨。总体而言,Fiske 和 Rice 通过对 I 类变异的重点研究,为个体内部变异的测量与理论建构奠定了基础,使其成为理解个体短期稳定性和动态变化的重要理论框架。
1.3 相关测量理论与方法
与经典测量理论聚焦于整个量表不同,项目反应理论允许在项目层面构建个体参数、项目参数和项目得分之间的关系模型。通过基于项目反应理论使用项目间变异的方法来建模和测量个体瞬时波动,可以有效排除因项目参数差异引起的波动,从而在单次测验中更准确地估计个体的瞬时波动。
1.4 参数估计方法
极大似然估计(Maximum Likelihood Estimation, MLE)是一种用于统计模型参数估计的方法,是心理统计建模中使用最为广泛的一种方法,其核心思想是通过选择使观测数据出现概率最大的模型参数来估计参数的值。它的基本原则是:假设给定一个统计模型和该模型的参数,观测数据是由该模型生成的,MLE 通过最大化数据的似然函数来估计模型参数。似然函数表示在给定参数下,观察到实际数据的概率。例如,给定一组观测数据???? = ????????????(???? = 1,2, ... , ????, ???? = 1,2, ... , ????),似然函数为:????(????|????, ????) = ∏ ∏ ????(????????????|????????, ????????)????????=1????????=1其中????????为个体参数集合,????????为项目参数集合。通过求解似然函数最大的集合,得到个体参数和项目参数的估计值。MLE 可以用于各种类型的概率分布,具有一定的灵活性,它具有一致性和渐近正态性,保证了估计的稳定性和可靠性。然而对于某些复杂模型,MLE 的计算可能非常困难,尤其是当似然函数不可解析或包含多个局部极值时。
2 问题提出与研究方案
2.1 问题提出
在传统心理研究中,研究的关注点集中在个体的平均结构上,通常假设个体特质是一个固定不变的数值,而个体内部的波动往往被视为误差,归因于各种外部因素,并被认为在跨样本间具有一致性,据此心理测量学家提出了同质性假设,尝试通过从总体测验分数关系中估计功能波动来评估群体的平均个体内部变异性(Cureton, 1971; Garside, 1958; Thouless, 1936)。近年来,研究者们对“个体在两个时间点的两个反应之间的差异”(Fiske & Rice, 1955)越来越感兴趣。个体内部变异逐渐被视为一种有价值的测量指标,并在心理学研究中作为预测变量。然而,综合文献综述部分发现,个体内部变异的研究较为有限,尤其是对个体瞬时波动的探讨更为匮乏,目前该领域仍处于初步发展阶段,存在以下几点不足:(1)概念和理论框架的不完善。在个体内部变异性研究中,尽管大量研究已经关注个体在较长时间尺度上的波动,例如日常情绪变化、数周内的认知能力波动、人格特质的跨时间稳定性等,但对于更短时间尺度上的瞬时波动,理论界仍然缺乏清晰的定义和系统的理论框架。现有研究往往将不同时间尺度上的波动混为一谈,未能有效区分瞬时波动和短期变异,从而影响了该领域研究的一致性和可比性。已有研究表明,个体内部变异可能与神经生理波动(如心率波动、脑电活动)、注意力变化、认知负荷以及脑区受损等因素密切相关(MacDonald et al.,2009; Schmiedek et al., 2007; Stuss, 2003),但这些研究大多未能明确区分瞬时波动和短期变异,导致不同时间尺度下的波动概念混杂。例如,在认知研究中,反应时的波动通常被用作个体内部变异的指标(Garrett et al., 2012; Lövdén et al.,2007);而在情绪研究中,有学者将一分钟内的情绪起伏视为个体内部变异,而另一些研究则认为情绪变异至少需要数小时甚至数天的测量(Nelson et al., 2020;Peeters et al., 2006)。因此,瞬时波动的内涵如何定义,以及它与短期变异的关系,仍然是值得探讨的问题。(2)纵向数据的建模方式易受测量误差及周期性环境变化的影响。首先,主流模型采用得分的个体标准差(iSD)作为量化指标,但离散化的量表评估(如5 点或 7 点 Likert 量表)与连续的潜在特质之间存在根本矛盾,这种量化误差会与真实波动相混淆;其次,在纵向数据中,虽然研究者尝试通过复杂的统计分析方法分离变异源,但仍难以有效区分个体瞬时波动与环境周期性变化导致的状态波动,导致瞬时波动的测量并不准确。为突破这些方法学瓶颈,亟需发展基于单次测量的新型评估模型,该模型应能直接估计潜在特质水平,从而实现对个体瞬时波动的精准测量,避免传统方法中因多次测量累积误差和环境干扰所导致的估计偏差。(3)参数估计方法的局限。虽然 Ferrando(2004)提出了项目反应理论的“双重”模型(Item response theory “dual”models, DMs),引入了个体区分度(Person Discrimination)或个体判别离散度(Person Discriminal Dispersion)的概念,但在实际应用层面仍存在显著不足。该模型采用的两步参数估计法在参数估计的准确性方面存在明显缺陷。为了确保模型参数的可识别性,研究者不得不施加较强的约束条件,这些技术限制不仅严重影响了模型在实际研究中的推广应用,更阻碍了对个体瞬时波动如何影响个体参数估计这一核心问题的深入探讨。因此,应当采用更为灵活的非约束参数估计方法,如马尔可夫链蒙特卡洛算法或全贝叶斯估计等现代计算统计技术,以克服传统方法的局限性。(4)未能与展开反应机制联合建模。个体瞬时波动和展开反应机制是人格测量的心理计量学建模中的两种关键机制。这两种机制虽然产生于不同的心理过程,却可能导致相似的反应偏差模式,从而对测量结果产生系统性影响。具体而言,在这两种机制作用下,被试倾向于对高于自身特质水平的项目表现出更高的肯定反应概率,同时对低于自身特质水平的项目表现出更高的否定反应概率。这种反应模式的相似性使得在测量模型中区分和识别这两种机制变得尤为重要。综上所述,当前关于个体内部变异的研究仍面临三大挑战,尚未得到有效解决。首先,个体瞬时波动的定义和测量方法亟需深入探讨;其次,如何基于测量模型区分并准确测量个体瞬时波动与展开反应机制仍需进一步研究;第三,个体瞬时波动的实证价值仍存在争议,尤其是在真实数据情境中的应用尚缺乏系统的研究。因此,本文旨在系统探讨并解决这三大问题,具体包括:(1)利用马尔可夫链蒙特卡洛算法实现个体瞬时波动的更精准测量;(2)将个体瞬时波动与展开反应机制进行联合建模;(3)探索个体瞬时波动在实证数据中的实际应用。
2.2 研究方案
基于上述关于个体瞬时波动研究的不足之处,本文拟基于项目反应理论和整体特质理论,提出一种能够精准刻画瞬时波动特征、有效区分瞬时波动与短时波动的分析框架,在提高测量精度的同时,确保跨情境适用性,并探索瞬时波动对个体参数估计的影响。在此基础上,本研究将使用马尔科夫链蒙特卡洛(MarkovChain Monte Carlo, MCMC)方法进行参数估计,采用最新的抽样方法,以提高模型估计的准确性和计算效率。与此同时,本文对不同测量方法与建模策略进行系统比较,并将模型应用于真实人格测评数据,以探测其在实证研究中的价值。
2.3 研究意义与创新
(1)丰富个体内部变异性的理论框架。个体瞬时波动在心理学研究中长期被忽视,传统心理测量多关注个体特质的平均水平,而忽略个体在短时间尺度上的动态变化。心理测量领域虽然有针对个体区分度的研究和建模,但对其理论根源没有进行深入研究。本研究通过引入个体瞬时波动的建模方法,深化了对个体内部变异性的理解,为个体特质理论提供了新的测量视角,使个体特质研究从静态走向动态化。(2)完善心理测量理论在个体瞬时波动中的适用性。传统心理测量方法在测量个体内部变异时存在局限性,通常将其视为误差。本研究构建的 IIV-IRT 模型和 IIV-GGUM 突破了这一局限,使心理测量能够更精准地刻画个体瞬时波动特征,并进一步将其拓展到展开反应机制,拓展了心理测量理论在个体内部变异性研究中的应用。(3)揭示个体瞬时波动的心理学意义。本研究不仅提出了瞬时波动的测量模型,还通过实证研究验证其心理学意义,更进一步将研究视角从传统的整体分析转向个体层面。研究结果表明,个体瞬时波动不仅具有稳定的个体差异,还可能与认知能力、情绪调节及心理健康状况密切相关。这一发现有助于推动个体瞬时波动在心理学领域的广泛应用,并为未来的个体差异研究提供理论依据。
3 研究一:基于累加反应机制的个体瞬时波动建模与参数估计
3.1 IIV-IRT 模型开发
3.2 研究 1a:IIV-IRT 性能验证
3.3 研究 1b:IIV-IRT 与 2PL 模型比较
3.4 研究 1c:IIV-IRT 模型与项目间和测验间个体瞬时波动模型的比较
3.5 研究 1d:分类个体分析
3.6 研究小结与讨论
4 研究二:基于展开反应机制的个体瞬时波动建模与参数估计
4.1 IIV-GGUM 模型开发
4.2 研究 2a:IIV-GGUM 模型性能验证
4.3 研究 2b:IIV-GGUM 模型与传统 GGUM 比较
4.4 研究 2c:IIV-GGUM 与项目间和测验间个体瞬时波动模型的比较
4.5 研究 2d:分类个体分析
4.6 研究结论与小结
5 研究三:个体瞬时波动建模在人格测评中的应用研究
这篇博士论文为了验证 IIV-IRT 模型在人格测评实践中的应用及其有效性与优势,以及与传统 2PL 模型在真实数据中的拟合程度进行比较,从而强调在心理测验中对个体瞬时波动进行建模的重要性,本实验采用了真实的人格测评的实证数据进行分析,这一实证分析有助于展现 IIV-IRT 模型在实践中的应用价值。5.1.2 研究数据本研究采用 2011 年贵州某高校大一新生心理测评数据集,该数据集以 2838名大一新生作为个体,年龄范围为 16 到 29 岁,平均 19.53 岁。其中男性 1519 人(53.5%),女性 1319 人(46.5%)。该数据集为陈仲庚(1983)修订的艾森克人格问卷(Eysenck personality questionnaire, EPQ),包括四个分量表:外倾性量表(Extraversion, E),反映个体在社交、活跃与冒险方面的倾向;情绪性量表(Neuroticism, N),衡量个体情绪波动、焦虑、易激惹等情绪稳定性;
5.1 研究 3a:IIV-IRT 模型在人格测评中的应用研究
本研究采用 2011 年贵州某高校大一新生心理测评数据集,该数据集以 2838名大一新生作为个体,年龄范围为 16 到 29 岁,平均 19.53 岁。其中男性 1519 人(53.5%),女性 1319 人(46.5%)。该数据集为陈仲庚(1983)修订的艾森克人格问卷(Eysenck personality questionnaire, EPQ),包括四个分量表:外倾性量表(Extraversion, E),反映个体在社交、活跃与冒险方面的倾向;情绪性量表(Neuroticism, N),衡量个体情绪波动、焦虑、易激惹等情绪稳定性;
5.2 研究 3b:IIV-GGUM 在人格测评中的应用研究
为了验证 IIV-GGUM 在人格测评实践中的应用及其有效性与优势,以及与传统 GGUM 模型在真实数据中的拟合程度进行比较,从而强调在心理测验中对个体瞬时波动进行建模的重要性,本实验采用了真实的人格测评的实证数据进行分析,这一实证分析有助于展现 IIV-GGUM 在实践中的应用价值。
5.3 研究小结与讨论
本研究对基于累加反应机制和展开反应机制的两种不同个体瞬时波动模型进行了实证分析,研究发现:(1)IIV-IRT 模型与 IIV-GGUM 在实证数据中验证了个体瞬时波动差异的存在,证明人格特质的个体瞬时波动的差异普遍存在,这与 Wright 和 Jackson(2025)利用纵向数据获得的研究结果一致,他们发现净个体内部变异的差异是广泛存在且显著的,其大小常常与截距和斜率一样重要,在人格发展的研究中,默认将这种差异纳入模型中考虑。
6 研究讨论与结论
6.1 总讨论
研究一开发的 IIV-IRT 模型为研究者在个体瞬时波动的测量方面提供了新的理论视角和分析工具。该模型基于整体特质理论(Fleeson & Jayawickreme, 2015)与项目反应理论,推导出一种能够同时估计个体瞬时波动和潜在特质水平的测量模型,为心理测量领域提供了一种更具解释力的建模框架。传统的 IRT 模型通常假设个体特质水平是稳定的,忽略了个体在短时间内的波动性,而 IIV-IRT 模型的引入突破了这一限制。该模型允许在单次测量中同时估计个体的瞬时波动和潜在特质水平,从而有效避免因忽略个体瞬时波动而导致的潜在特质水平估计偏差。这不仅提升了模型参数的估计准确性,还能够更全面地刻画个体在测量任务中的表现,减少因个体状态波动所带来的测量误差。此外,IIV-IRT 模型的一个重要价值在于,它在测量模型上清晰地区分了个体瞬时波动与个体短时波动。个体瞬时波动反映的是与外界无关的个体内源性波动,它可能存在于在单次测量过程中,具有时间无关性。而个体短时波动则描述个体在更长时间跨度(如几天或几周)内的波动趋势,它主要受到情境等外部因素的影响,需要一定时间间隔的测量来确定,具有时间相关性。通过这一区分,IIV-IRT 模型促进了对个体内部变异的研究,使研究者能够更精细地分析个体特质的动态变化模式,从而推动心理测量理论的进一步发展。在应用层面,IIV-IRT 模型不仅提升了个体测评的精确度,尤其在临床心理领域,对于特质水平偏离群体均值的个体,能够提供更精准的测量。该模型不仅能够刻画其个体瞬时波动的动态特征,还能有效识别其特质波动的模式,从而更准确地预估其潜在的心理风险。这一优势在精神疾病筛查、情绪障碍评估、自杀风险预测等高敏感性测评中尤为重要,有助于临床医生和心理学家制定更具针对性的干预策略,提高个体化心理健康管理的有效性。
6.2 总结论
个体瞬时波动是特质的一个重要特性。本文通过两个模拟研究和一个实证研究探讨了个体瞬时波动的测量及在人格测评中的作用。主要得出以下几点结论:(1)纳入瞬时波动指标不仅能够弥补传统稳定性指标在刻画个体差异方面的局限性,还可提升模型对真实心理机制的拟合程度。传统的稳定性指标通常侧重于特质的平均水平,忽视了个体的波动和性,而瞬时波动指标则可以捕捉到这种变化,从而更加全面地反映个体在不同情境下的心理状态。(2)在传统 IRT 模型中,个体对项目的反应主要由其潜在特质水平决定,特质越极端,越可能做出相应的极端选择。然而,这一静态视角忽略了瞬时波动对反应行为的影响。即使两个个体具有相同的特质水平,若其瞬时波动程度不同,其选择极端或非典型反应的概率也可能显著差异。波动越大,特质越不稳定,越可能偏离典型特质反应。因此,引入瞬时波动的 IRT 模型不仅增强了对反应行为的解释力与预测力,也为理解测量误差背后的心理机制提供了新的理论视角。(3)模拟研究和实证研究均表明,新开发的 IIV-IRT 模型和 IIV-GGUM 均能效地减少被试人格特质的测量误差并提升人格特质的测评精度,为人格的精准测评提供了重要的方法学支持。(4)个体瞬时波动的估计对个体特质估计精度的提升并不平均,对于部分个体的提升更为显著。对于不同个体,使用传统模型对其进行估计时的精度损失和偏差是不同的。心理测量往往更关注那些偏离均值的个体。(5)个体瞬时波动的准确测量依赖于项目区分度高且项目较多的测验,这类测验能提供充足信息,提升估计精度。然而,当前人格测量趋向短测验,限制了对波动性的捕捉能力,降低了测量的区分度与稳定性。因此,应在测验长度与信息量之间权衡,以保障测量的可靠性与有效性。(6)不同人格特质的个体瞬时波动水平呈现出的系统性差异。这种差异性表明,个体瞬时波动并非简单地源于统一的外在影响因素,如项目难度的不确定性、反应时的随机猜测行为,或是反应倾向等误差来源,而更可能反映了个体稳定的心理加工特征。
参考文献
附录