基于深度学习的COVID-19传播趋势预测算法思考

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:35623 论文编号:sb2023113015493051503 日期:2023-12-11 来源:硕博论文网

本文是一篇软件工程论文,本研究旨在探讨时间序列预测中普遍存在的滞后性和非平稳性问题,以改善COVID-19传播趋势的预测算法。
第1章 绪论
1.1 选题背景及意义
1.1.1 选题背景
随着互联网、移动计算以及大数据等的快速发展,人工智能也进入到了一个全新的发展阶段,并已经作为新一轮科技革命和产业变革的重要力量。深度学习作为一个重要分支,已经广泛用于数据挖掘,机器学习,机器翻译,自然语言处理,推荐以及其他相关领域,并且都取得了很多前所未有的成果,这些成果已经深度应用到生活、学习和工作的方方面面。深度学习赋予机器像人一样的能力,解决了很多复杂的模式识别难题,使机器学习相关技术进步实现了巨大飞跃。当前,新冠疫情在全球多点暴发和恣意蔓延,已构成对人类生命健康安全和社会经济建设的严重威胁,并存在季节性传染和长期感染等长期化风险[1],因此疫情防控的常态化,就必然要求提升疫情监测预警能力。由于COVID-19病毒的传播动态受病毒内在致病机理和外在多种干预措施因素的影响,所以COVID-19疫情数据具有很多不确定性的特点。
一方面,统计数据质量较低。由于涉及隐私和信息安全,能够获得的统计变量有限,特别是由于无症状人群的潜伏性的存在,造成数据的异常不规则波动,这严重影响了模型对传播趋势预测的准确性,另一方面,由于感染传播的复杂性和多种因素的影响,经典的计算方法和数学模型难以发挥作用,其结果通常是不可靠的[2],因此数学建模难以提供有关COVID-19动力学的有价值的见解。
此外,由于缺乏可靠的数据收集和报告,使得各种建模的尝试变得困难和不可靠。通过人工智能技术有效地捕获COVID-19疫情的长时间依赖性,提高COVID-19疫情预测的准确性是目前COVID-19疫情预测亟待解决的难题。随着COVID-19流行病例的时间序列数据的可用性提高,针对具有同源连续性暴露传播、扩散传播、混合暴发流行等特征的新冠疫情,具备通过自适应学习时间依赖性的能力的深度学习时间序列预测技术,可为具有潜伏性、隐蔽性和传染性极强,致病率高,动态随机、高度分布等特点的疫情传播提供可靠准确的预测结果。这对提高疫情传播预警,对疫情的常态化防控,及时有效地化解疫情蔓延风险,具有十分重要的意义。因此,开展基于深度学习方法的COVID-19的预测研究,显得尤其必要和十分重要。

软件工程论文怎么写
软件工程论文怎么写

.....................
1.2 国内外研究现状
目前,国内外专家学者在深度学习的时间序列预测以及COVID-19传播趋势预测等领域都取得了一些重要的研究成果,为本论文研究工作的顺利开展提供了良好的基础。
1.2.1 基于深度学习的预测研究现状
随着深度神经网络在训练上的难度被突破之后,深度学习在各领域的研究上都取得了长足的进步,为很多跨学科领域的问题解决带来了新的研究思路,相应的研究成果也不断发表,在时间序列数据分析和预测方面也不例外。
当前,深度学习(DL)在时间序列数据分析和预测方面已经表现出广阔的应用前景。时间序列数据当中存在的时间依赖性和结构,如季节性和趋势可以很好地通过深度学习模型进行自动学习。例如:多层感知机(MLP)可以对多变量的输入进行处理[3],常常被用于多步预测研究。具有自动特征学习的卷积神经网络(CNN)可以用于时间序列预测研究中的多变量输入和输出,前馈神经网络(FFNN)也常用于时间序列预测[4],递归神经网络(RNN)及其衍生的神经网路已经广泛用于处理不同领域的时间序列的数据处理和应用研究。在COVID-19传播趋势预测方面,目前,支持向量机(SVM)、神经网络(NN)和朴素贝叶斯等机器学习和深度学习模型在实现自动化、智能决策和机器人自动控制等应用中发挥着重要作用。其中,支持向量机的结构比较简单,可以有效地处理非线性分类问题;神经网络采用多层权重和非线性激活函数,可以用于复杂的数据挖掘任务;朴素贝叶斯分类器利用贝叶斯定理,可以有效地处理大量分类问题,且模型拟合速度更快。此外,以上这些方法也可以结合起来,使用集成学习方法,从而可以更加准确地预测结果。
........................
第2章 相关技术理论基础与介绍
2.1 时间序列预测
时间序列数据是一组有序的观测数据。时间序列通常由趋势、季节、循环和不规则波动这几种形式的变化组成。时间序列预测是使用一个模型利用历史信息来预测未来的变化趋势,或加入预测因子预测未来值。近年来,深度神经网络在TFS任务中被广泛采用,并取得了巨大成功。时间序列预测经常面临重大的研究挑战,即如何在时间序列中捕获复杂的短期模式和长时间序列之间的依赖关系。
时间序列预测广泛应用于现实生活生产中,在能源消耗,交通流量预测,经济规划,天气预报和疾病传播预测等领域发挥着非常重要的作用。因此,生成准确可靠的预测已成为研究人员和相关机构的永恒努力。然而,时间序列中存在的复杂的短期和长期动态时间重复模式给时间序列的准确预测带来了许多挑战。传统的时间序列模型,例如指数平滑模型和自回归积分移动平均线模型,可以单独拟合每个时间序列并生成预测。
...............................
2.2  COVID-19传播随机时间序列
COVID-19传染性强、流行范围广、具有不易预测性,因此COVID-19传播是一种随机过程,COVID-19传播趋势的变化没有确定的形式,没有明显的变化规律。正是由于COVID-19传播的高度随机性,对COVID-19传播趋势的有效预测,现在仍然是一个复杂且具有挑战性的问题。
2.2.1 COVID-19传播趋势序列特性
(1)平稳性
定义2.1:假设一个时间序列是由某个随机过程(stochastic process)生成的,即假设时间序列{???????????????? }(????????=1,2,…)的每一个值都是从一个概率分布中随机得到的。如果该时间序列满足:均值、方差以及协方差都是与时间t无关的常数;那么称该时间序列是平稳的,并且该随机过程是平稳的。由于要求过于严格苛刻,因此大多数时间序列预测都是非平稳时间序列。
(2)非平稳性
现实中的时间序列通常是非平稳的,包含趋势、季节性或周期性等成分。非平稳序列可分为带趋势、带趋势和季节性、混合型等。对于非平稳序列,可以通过分解得到趋势项、季节项和残差项。时间趋势包含确定性和随机性两种类型的趋势,其中确定性趋势是时间的非随机函数,而随机性趋势是随机的且随时间变化的。
(3)用于非平稳性的传统预测方法
传统预测方法基于平稳序列设计,例如自回归模型,它利用序列的滞后阶数作为自变量的线性回归模型来预测未来值。通过历史序列训练,得到的各自变量系数代表滞后时刻的值与下一时刻值的相关性。如果序列接近平稳,这些相关性在未来一段时间内不会有太大变化,因此预测未来变得可能。
.............................
第3章 数据集构造与特征分析 ..................... 17
3.1  COVD-19传播时序数据集 ........................... 17
3.2  COVD-19传播时序预处理 ............................ 17
第4章 基于时间卷积网络的COVID-19传播趋势预测 ................ 23
4.1 COVID-19传播趋势滞后性问题描述 ................. 23
4.1.1  COVID-19传播趋势预测滞后性分析 ....................... 24
4.1.2 滞后性的解决办法 ........................... 24
第5章 基于Transformer的COVID-19传播趋势预测 ................... 42
5.1 COVID-19传播趋势非平稳性分析 ................................. 42
5.1.1 非平稳性 .................................... 42
5.1.2 平稳性检验方法 .......................... 43
第5章 基于Transformer的COVID-19传播趋势预测
5.1 COVID-19传播趋势非平稳性分析
时间序列数据分为两大类:平稳和非平稳。平稳的时间序列数据是指其均值和方差在时间维度上保持不变的数据。然而,在实际应用中,大部分时间序列数据都是非平稳的,这给时间序列预测的准确性带来了极大的挑战。因此,非平稳时间序列的预测成为当前热门领域之一。
5.1.3  COVID-19传播趋势非平稳性检验
本研究对收集的数据集进行了假设检验方法中ADF检验,即对时间序列数据进行移动平均值和标准差的分解,如图5.1和图5.2所示。
移动平均指的是一种在特定时间段内对数据进行平均值计算的方法,其可反映该时间段内数据的趋势,并使得数据波动更加平滑,有助于发现趋势和周期性变化等信息。标准偏差则是一种测量数据分散程度的指标,它是基于各个数据与其平均值之差的平方和的平均值的平方根所计算得到。标准偏差可用来描述数据分布情况,即每个数据点相对于平均值的偏离程度,标准偏差越小,则数据分布越集中;标准偏差越大,则数据分布越分散。

软件工程论文参考
软件工程论文参考

...............................
第6章 结论与展望
6.1 结论
本研究旨在探讨时间序列预测中普遍存在的滞后性和非平稳性问题,以改善COVID-19传播趋势的预测算法。本研究利用人工智能技术,如机器学习、深度学习和神经网络,来建立和改进时间序列预测模型,从而提高预测准确性和精度。准确预测COVID-19的传播趋势对许多方面都很重要,例如:判断疾病的发展趋势、医疗资源的再分配和政府决策等。此外,这种预测还可以为未来可能出现的其他传染病提供建模参考,本文提出的方法也可用于具有滞后性和非平稳时间序列预测的一般性问题。论文的主要工作如下:
(1)本文概述了当前COVID-19传播趋势预测的传统方法和现代人工智能方法,并介绍了相关理论。特别强调了COVID-19数据预测的滞后性以及非平稳时间序列预测的挑战。
(2)尽管本研究取得了一些研究成果,但是在评估过程中,本研究发现它仍存在一些问题需要进一步深入研究。具体来说,缺乏规范的相关数据进行更多的实验验证或模拟分析来加强证据,以更好的提供深度学习的可解释性。
(3)本研究发现在处理复杂模式数据时,一维卷积存在局限性,膨胀卷积可能会对时间序列的信息连续性造成损失。因此,通过改进TCN模型结构,本文提出了一种新的名为MDTCNet模型,并将其用于COVID-19传播趋势的短期和长期预测。该模型采用了一个多层深度卷积的残差结构进行特征提取,以增强模型的特征学习能力。这有助于弥补信息连续性的损失,该模型考虑了COVID-19的潜伏特点,并采用多种时间步长来避免时间步长对滞后性的影响。实验结果表明,MDTCNet相比基准模型在降低预测滞后性和提高准确性方面表现更好,通过实验验证了模型的有效性,评估指标MAPE、SMAPE和RMSE也证实了该模型的优越性。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217