基于CEEMDAN-LSTM模型的中国商品期货已实现波动率预测

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:38566 论文编号:sb2024110722094352867 日期:2024-11-12 来源:硕博论文网

本文是一篇经济管理论文,本文选取了2018年5月1日到2023年12月30日的中国期货交易市场各大板块(除金融板块)中成交量与持仓量均较大的六种大宗商品的合约数据作为主要研究对象。
第1章 绪论
1.1 研究背景
当前,全球金融市场似乎一直处于动荡的边缘,受到来自多个方向的冲击。其中,地缘政治紧张的局势、全球供应链的扰乱,频发的“黑天鹅”事件、新冠疫情的持续影响以及不断增加的环境和社会问题都造成了资本市场波动率加剧、尾部风险事件频发。而随着经济全球化和资本国际化的不断推进,世界各国各地区之间金融经济联系和连带影响持续加大,使得彼此金融市场的波动性和关联性不断增加。
行为金融学理论指出,市场参与者在投资过程中所出现的从众现象,即投资行为易向市场多数人相一致的方向变化的现象,被称为“羊群效应”,该效应会显著加剧市场价格趋势的变动,导致价格出现大幅波动。随着我国期货市场规模不断壮大,吸引了越来越多的投资者涌入其中,他们大多以套利或避险为投资目标。然而,这种投资者间的“羊群效应”日益凸显,导致许多人盲目跟风,不顾风险地盲目追涨杀跌。若此现象持续,将极大破坏期货市场应有的保值预期和价格发现机制,进而使市场的不稳定性进一步加剧(张一锋等,2020)[1]。资产价格的起起伏伏会导致资本市场存在潜在的不稳定因素,一旦资本市场遭遇系统性风险,将会对实体经济产生严重冲击。当前,我国以推动高质量发展为主题,将扩大内需战略与深化供给侧结构性改革有机结合,推动经济结构转型升级。我国金融工作会议与党的二十大报告均提出,为了增强现代金融监管的效能与完备性,我们需要进一步巩固金融稳定保障体系,确保所有金融活动依法受到全面监管,守住不发生系统性风险底线。因此,如何有效准确地度量从而管控金融风险成为现下急需解决的热点问题。对资本市场的波动状态有深入的了解和准确的预估是有效管控金融风险的前提,同时需要把握市场中不同波动性下金融资产之间的内在联系。鉴于极端风险事件的突发性和随机性特征,基于正态分布假设的市场风险度量常常无法充分估计实际风险程度,这种风险的破坏力常常超乎预期,对金融市场的稳定造成严重影响。因此,如何有效评估资本市场尾部风险一直是管理者、投资者和学者们共同关注的重要课题。

经济管理论文怎么写
经济管理论文怎么写

................................
1.2 研究意义
首先,波动率是金融市场中风险的核心指标之一,对于投资组合管理和决策制定至关重要。高频数据能快速对复杂的日内波动性特征信息做出回应,实时揭露资产价格变动的动态特性,在精细化取样间隔的同时还能扩大样本容量,弥补低频率非连续性样本采集导致的信息缺失问题,从而实现精细化数据对某些极端事件进行研究(尹海员和吴兴颖,2019)[3]。由于期货市场已实现波动率的准确预测对投资者和风险管理者具有重要价值,于是,本文选取了期货各板块中具有代表性与影响力的几类期货的5分钟高频数据来预测已实现波动率,以便更好地评估未来市场波动性,从而使投资者更精确地制定风险管理策略,减少不确定性和损失,提高资产配置的有效性。
其次,CEEMDAN-LSTM模型结合了自适应噪声完备集合经验模态分解(CEEMDAN)和长短时记忆网络(LSTM)两种不同领域的先进技术。其中,CEEMDAN拥有强大的自适应性,能够在不同情境下适应不同信号的特性,将信号分解成多个本征模态函数(IMFs),这些函数捕捉了信号中的不同频率成分,为LSTM提供了更丰富的输入特征。其通过自适应噪声控制,能够有效减少噪声对信号分解的影响,提高了分解的准确性。这种创新性的结合提供了更准确和有力的预测工具,也有助于促进交叉学科研究,推动信号分解和深度学习方法的融合。
...................
第2章 文献综述和相关理论
2.1 文献综述
2.1.1 高频数据与已实现波动率
在经济全球化的背景下,特别是受到当代国际金融危机的冲击后,期货市场出现了前所未有的波动。这种波动增加了期货市场的不确定性和风险,不利于市场的正常运行。金融市场的波动性主要体现在对资产未来预期价值的偏离,代表了资产未来价格的不确定性。早期,学者们普遍集中于对低频波动率的预测。Engle(1982)[4]最早提出了自回归条件异方差模型(Autoregressive Conditional Heteroskedasticity, ARCH)。Bollerslev (1986)[5]改进了ARCH模型,引入无穷期的自相关项,提出了广义自回归条件异方差模型(Generalized-ARCH,GARCH)。ARCH和GARCH模型在描述波动的自相关性方面表现出色,但其模型参数估计过程颇具挑战性。然而,由于低频波动不可避免地包含大量噪声,低频波动的预测结果不能成为未来市场风险的参考。
随着高频数据在金融分析领域的广泛应用,学者们开始采用基于日内数据的历史波动率刻画资产价格的波动,提出了已实现波动率的概念(Anderson等, 1998)[6]。已实现波动率(Realized Volatility, RV)将交易时间划分为多个时间段,并计算各时间段的收益率平方和来度量波动率。这种方法无需模型假设,计算简便高效,并且在特定条件下能够实现对真实波动率的无偏估计。近年来,高频数据在波动率和风险度量研究中的地位日益凸显,陈声利等 (2018)[7]指出,高频波动率不仅比低频波动率包含更多有价值的信息,且计算效率更高。因此采用高频波动率建立高效的尾部风险测量方法正逐渐成为新的研究方向,而如何有效地将已实现波动率融入传统波动率和风险度量模型,已成为学术界广泛关注的焦点。
...........................
2.2 相关理论方法
2.2.1 已实现波动率的计算
为了降低噪声对RV预测的影响,需要对原序列RV(t)进行分解。Huang 等(1998)提出的经验模式分解方法(empirical mode decomposition,EMD),将非线性和非平稳时间序列分解为一组固有模态函数(IMF)和一个残差,虽然该算法是一种自适应的时频局部化分析方法,但也存在模态混淆问题(不同模态分量的尺度不同)。为解决该问题,Wu & Huang (2009)将EMD与噪声辅助分析方法相结合,提出了集成经验模态分解(ensemble empirical mode decomposition, EEMD)方法,该算法的基本原理是对原始信号与高斯白噪声混合后的新信号进行EMD分解,最后对得到的各本征模态函数(Intrinstic Mode Function, IMF)取平均值来抵消添加的白噪声,从而改善模态混叠问题。
而由于直接利用CEEMDAN模型对序列进行分解时可能会无意中接触到未来数据,这会导致模型在历史数据上表现出色,但在真实未知数据上表现不佳。且金融市场数据具有高度的动态性和波动性,直接对整个数据集应用CEEMDAN分解可能在处理大规模数据时遇到性能瓶颈。而滚动窗口通过分段处理数据,可以更高效地管理大量数据。
将滚动窗口机制融入CEEMDAN算法的实践中,能够显著提升数据处理的效率和准确性,尤其是在防止信息泄露方面表现突出。滚动窗口作为一种常用的时间序列分析技术,通过连续移动数据窗口来逐步更新和处理信息,这种方法在处理复杂的金融时间序列数据时尤为有效。
.............................
第3章 期货已实现波动率的分解 .......................... 22
3.1 期货数据的选取与说明............................... 22
3.2 期货日已实现波动率的计算................................... 24
第4章 期货已实现波动率预测实证结果 ....................... 35
4.1 评价指标体系构建....................................... 35
4.1.1 预测精度评价指标.................................... 35
4.1.2 DM检验 ............................................. 36
第5章 总结与展望 ........................ 63
5.1  全文总结.................................... 63
5.2  后续工作展望.............................. 63 
第4章 期货已实现波动率预测实证结果
4.1 评价指标体系构建
本章将聚焦于对期货已实现波动率时间序列数据进行时序学习和预测的有效性。考虑到期货已实现波动率时间序列数据含有大量市场微观结构噪音,本工作将CEEMDAN-LSTM方法视为处理上述问题的潜在有效学习方式,并展开实验进行验证。CEEMDAN-LSTM作为本研究的主要算法,结合了经验模态分解方法和长短期记忆网络,具有较强的非线性建模能力和时序特征提取能力。除CEEMDAN-LSTM外,本工作还探索了树模型、线性模型、LSTM等方法在期货已实现波动率时间序列数据预测方面的效果,并与CEEMDAN-LSTM的性能进行对比。本章首先介绍树模型、线性模型以及LSTM等对比算法的设计与实现,并在六大期货已实现波动率时间序列数据上进行实验;然后介绍基于CEEMDAN-LSTM的实验,并进行实验结果分析和性能对比。
本文选用平均绝对误差(Mean Absolute Error, MAE)、均方误差(Mean Square Error, MSE)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、和均方根误差(Root Mean Square Error, RMSE)来构建模型预测性能的评价体系,用以从多角度精准量化模型的预测性能。

经济管理论文参考
经济管理论文参考

....................
第5章 总结与展望
5.1  全文总结
近年来,已实现波动率已经成为了金融资产风险评估的重要指标,用于分析市场波动性。传统方法主要依赖计量经济学模型,而随着电子计算技术的日益精进与数据存储效能的增强,机器学习和深度学习在金融时间序列建模中崭露头角。同时,经验模态分解(EMD)等算法也被发现在研究金融时间序列时具有频率特性提取的优势。本文在这一背景下,结合经验模态分解算法和深度学习模型,旨在提高期货目标的已实现波动率的预测精度。
本文选取了2018 年 5 月 1 日到 2023 年 12 月 30 日的中国期货交易市场大宗商品合约数据序列。本文采取如下的方法:首先通过高频数据计算还原出已实现波动率序列数据,然后采用基于自适应噪声控制的信号分解方法——完全自适应噪声集合经验模态分解(CEEMDAN)算法,对各类期货标的的已实现波动率序列数据进行子频数据滚动分解和序列数据重构,得到各期货标的的原始已实现波动率序列数据的各分频子序列数据。这一方法可以有效减少噪声干扰,并且能够有效地保留原始序列信息,从而提高对日已实现波动率进行拟合的准确性。最后,将分解重构得到的三个子频序列数据分别输入对应的LSTM深度神经网络模型,对序列的已实现波动率指标进行预测,并将结果合并,从而恢复得到最终预测序列。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
相关经济管理论文论文
QQ 1429724474 电话 18964107217