基于深度学习的时序预测及可解释性探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:35633 论文编号:sb2023121216585551549 日期:2023-12-18 来源:硕博论文网

本文是一篇软件工程论文,本文分析了如何对负责模型进行简化并解释,量化了复杂深度学习预测模型的模型功能和变量,实现了对时序预测模型的解释。
第一章 绪论
1.1 选题背景与研究意义
随着科学技术的不断创新,人工智能得到了迅猛的发展。机器学习算法作为人工智能的重要组成部分,已经被广泛应用于许多领域[1]。例如,在医疗领域,机器学习算法可以帮助医生进行疾病诊断和治疗方案的制定;在金融领域,可以帮助银行和保险公司进行风险评估和欺诈检测;在交通领域,可以帮助城市规划师进行交通流量预测和交通拥堵缓解。可以说,机器学习算法的应用已经深入到我们生活的方方面面,为我们的生活带来了便利和效率。为了使机器获得更好的学习能力,许多学者努力提高算法的准确性。随着计算机算力的巨大提升,深度学习正在以惊人的速度发展,促进了人工智能技术大幅度前进,目前在计算机视觉、自然语言处理、信息检索等方面都有很好的进展[2]。同时,医学等多个领域也开始使用医疗诊断等深度学习技术作为辅助,科技发展的意义再次展现在了各行各业中。几十年来,时序预测一直在随着机器学习的进步不断进步,研究者们不断提出或改进网络模型,希望时序预测同样能在应用中有很好的表现,各种基于卷积神经网络或循环神经网络的模型的出现改进了实际场景中的时序预测问题的难点,随着长短时记忆网络的提出,时序预测问题中的梯度消失梯度爆炸等难点也得到了优化,时序预测模型距离可靠越来越近。
水资源关系到人们生活的方方面面,然而我国水资源分布极为不均,南北方水资源利用存在着巨大的差异。南方地区水资源相对丰富,而北方地区则面临着水资源短缺的严重问题。此外,我国还经常受到洪涝灾害和干旱灾害的影响,这些自然灾害给水资源的管理和利用带来了极大的挑战。因此,如何合理利用水能资源,保障水资源的可持续利用,成为了我国社会经济发展中亟待解决的重要问题。各地年降水量分布也严重不均,大部分地区降雨集中在夏秋,尤其是长江流域的水流变化情况特别复杂,很容易发生洪涝灾害,这让沿江地区人民的基本生活和安全生产得不到保障;而春冬季节又经常面临干旱的境地。因此,研究河流水位的变化规律以及变化过程,建立可靠的能够处理多变量水位数据的预测模型是特别关键的[3]。而与此同时,全球变暖导致的各种气候问题,如海陆水循环过程异常等,导致了大部分区域降水规律发生改变,这种异常会造成水资源分布情况发生改变,进而使部分地区更容易发生洪涝干旱等事件,增加了水位预测的难度。
........................
1.2 国内外研究现状
1.2.1 时序预测的研究现状
时序预测问题伴随着机器学习的发展不断进步,作为机器学习领域最重要的研究话题之一,它的主要目的是根据现有的时间-序列数据,预测未来的一个或多个时间点的数据。时间序列预测算法主要可分为三个方面,分别是以数学统计学为基础的模型,以支持向量机为代表的机器学习方法和以长短时记忆网络为代表的深度学习方法。
传统的时间序列预测方法通常使用的是统计学方法的回归模型,例如:自回归模型,移动平均模型,自回归移动平均模型、自回归差分移动平均模型等[8],采用统计模型的方法,是利用一系列相关数据来获取系统潜在变化机制的规律和趋势。尽管这种方法可以从可用数据中提取有用的信息和模式,但由于对系统认识的不足,其准确性和确定性存在缺陷,此外,该方法还需要超常的计算能力,例如经典的回归模型只适合自回归预测而不适合多变量的水位预测模型。早在1981年李纪人和刘德平[9]就提出了水文时间序列预测的概念,这本书主要应用了统计学方法构建水文时序模型,对影响水文的要素进行了分析预测。在神经网络和支持向量机等算法进入研究人员视野之前,利用统计方法建模并预测单一时间序列取得了不错的预测效果。然而,由于水流受多方面因素影响,并不具有线性和稳定性,因此使用传统的统计模型在准确度方面很难得到有效地提升。并且随着物联网技术的发展和传感器的不断进步,人们能获得的采样数据越来越复杂 [10]。而传统的基于统计模型无法抓取各个变量之间的潜在关系,对于多变量的时序预测效果并不能达到预期。因此,研究者们希望发现新的能够处理多变量的时序数据的方法,并在此基础上建立可靠的预测模型。
...........................
第二章 相关研究技术及理论
2.1 时间序列预测概述

软件工程论文怎么写
软件工程论文怎么写

近些年深度学习在各个领域飞速发展,尤其是在自然语言处理和计算机视觉方面已经取得了很成功的应用,时序预测随即被人们寄予厚望,希望能够将其应用在气象,水利,医学等各个方面,人们想要通过已有的数据预测将来的发展趋势,据此做出决策或者提前避免灾难。例如,医生使用时序预测模型判断某病人体征有患癌症的趋向,对此做出干预或示警;水利工作人员根据时序预测模型给出的洪峰预警或干旱预警提前做出相应的抗灾准备等。
时间序列可以看作是在不同时间对同一个现象的观察值排列而成的有序序列,用来描述随着时间变化这个现象的变化或发展的数据,通产来说,几种不同的变化形式可以叠加成一个时间序列。一般来说,可以把时间序列数据分解成系统性部分和非系统性部分。其中系统性的时间序列部分由趋势、季节性和周期性三种成分构成,代表了序列的规律性。而非系统性部分即为不规则变动,又被称为“随机扰动”或者“噪声”。而时序预测的重点就是挖掘这些隐藏起来的规律,并利用找到的规律预测将来的数据。
..........................
2.3 时间序列预测算法介绍
时序预测算法在不断进步,早期基于机器学习的模型在高维数据处理方面的表现一般,实现复杂功能的能力也有限[40]。随着模型的改进和算力的提升,研究者们开始使用深度学习技术建立时序预测模型。最初的深度学习模型以多层感知器为代表,它的创新之处在于可以有更多的层,经典的多层感知机由输入层、隐藏层和输出层组成,其中每个隐藏层都有激活函数。为了进一步提升模型性能,研究者们提出了循环神经网络(Recurrent Neural Network, RNN),这是一种有记忆性的深度学习网络,它与一般网络的区别是每个细胞的输出都依赖上一个细胞的输出和这个细胞的输入。为了解决RNN的梯度消失和梯度爆炸问题,以及对长期信息记忆不佳的问题,1997 年Hochreiter等人[41]提出了长短时记忆网络(Long Short-Term Memory, LSTM)。LSTM使用门来决定是否记忆信息,对长时间的信息记忆功能较佳。之后Hinton和他的团队[42]提出了深度置信网络,深度置信网络由多层受限玻尔兹曼机构成,是一种无监督的学习方法,会尽可能保留原始特征的特点,同时降低特征的维度。2018年, Bai等人[43]提出了时域卷积网络,时域卷积网络改进了卷积网络层数深,视野小,并且会泄露未来信息的缺点,在时序预测任务上表现很好。
深度学习的典型算法包括DNN(深度神经网络)、CNN(卷积神经网络)和RNN(循环神经网络)算法。其中,RNN在处理序列数据方面表现出色。连续数据,如时间序列数据,可以通过LSTM来处理而不损失梯度。
..............................
第三章 TCN-LSTM水位预测模型 ........................ 21
3.1 引言 ................................... 21
3.2 问题的定义 ............................... 22
3.3 数据预处理 ............................. 23
第四章 ATTENTION-TCN-LSTM水位预测模型 ................ 35
4.1 引言 .......................... 35
4.2 问题定义 ..................................... 35
4.3 算法原理与设计 .......................... 36
第五章 模型的可解释性分析 ............................. 43
5.1 引言 ............................ 43
5.2 深度学习的可解释性研究 ......................... 44
第五章 模型的可解释性分析
5.1 引言
近年来,深度学习在多个时序任务中表现出了卓越的性能。然而端到端的学习策略使得深度学习变成了一个黑盒子。除了最终的输出之外,很难理解时序预测模型内部隐藏的逻辑。近些年来,越来越多的研究人员意识到模型的高可解释性在理论和实践上都具有重要价值,并且已经开发了具有可解释的知识表示的模型。为了提高模型准确性,许多学者将可解释性方法引入时序预测中。常用的可解释性方法包括特征扩展、特征选择和特征工程。此外,一些学者也使用实例数据集来评估不同方法之间的性能差异。然而,目前尚未有人对不同可解释性方法在实际应用中的表现进行充分评估。因此,有必要对不同可解释性方法在实际应用中的表现进行关注和评估;以此为基础,将来可以根据不同情况选择最佳的可解释性方法从而使时态数据能够得到最佳利用。
尽管构建深度学习时序预测模型的主要目标是提高预测结果的准确率,但建立模型的最终目的还是能够在实际生产生活中使用,否则无异于纸上谈兵。而深度学习有一个致命的缺点,就是从输入到输出过程中的不透明性与不可解释性,这使得人们理解并接受预测模型变得困难[64],也让研究者们无法从模型决策依据方面分析并提升模型准确度,想要明确地解释模型原理也变成了一件困难的事,十分影响模型可靠性。然而,随着科技水平的发展,想要让建模技术跟上如今的预测需求,又必须依赖深度学习对大量数据的处理能力和学习能力,这导致尽管深度学习缺乏可解释性,人们在处理并建模复杂数据时对深度学习的依赖越来越高[65]。因此,研究者们着眼于建立可解释性的深度学习网络模型。

软件工程论文参考
软件工程论文参考

..............................
第六章 全文总结与展望
6.1 全文总结
时间序列预测问题已经深入到人们生活的方方面面,小到预测物品的价格波动决定何时购买,大到根据气象天文的变化走势提前调控预案,都直接或间接影响着人们的决策选择。近些年来,随着深度学习领域的快速发展,研究者们也希望能够帮助更多的应用场景,为了能给出更加可靠的预测结果,一个好的可解释性的时间序列预测模型尤为重要。本文研究针对水位的时间序列预测问题,预测水位后续走势,使用注意力机制和长短时记忆网络,最后对比现有的基准模型,预测效果良好。
深度学习和时序预测都是近些年热门的研究方向,随着算力的不断增强以及技术的不断迭代,不断有大量的时序预测模型被搭建出来。而由于深度学习在图像处理、自然语言处理等多个领域都取得了显著的成绩,许多研究人员开始探索将深度学习应用于更加广阔的领域,其中不乏将深度学习应用到时间序列预测的研究。
基于此,本文提出了基于时序卷积网络和长短时记忆网络的时序预测模型,发挥时序卷积网络能很好地提取数据特征的能力,改进了传统时序预测模型对多变量时序数据处理不佳的问题,搭建了TCN-LSTM时序预测模型。在此基础上,增加了多头自注意力机制,再次聚焦重点的特征信息,使网络能够更好地学习数据间的联系,搭建了Attention-TCN-LSTM时序预测模型。将模型应用于了瀑布沟水电站和深溪沟水电站的坝上水位预测场景中。具体来说,本文首先对时序预测问题做了具体的定义,之后详细介绍了两个模型的设计思路以及实现方法,其中包含了对应的模型原理,计算分析,算法实现等,在真实数据集上的实验结果证明了模型的可行性,并将本文提出的模型的实验结果与经典的时序预测基准模型的结果进行了比较和分析,实验结果证明了所提出的时序预测模型对现有模型改进的有效性,能够在时序预测任务中取得很好的表现。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
相关软件工程论文论文
QQ 1429724474 电话 18964107217