基于GSA-LA优化GRU神经网络的糖尿病预测模型

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:32633 论文编号:sb2022062114275348602 日期:2022-07-03 来源:硕博论文网

本文是一篇计算机论文,笔者利用提出的 LAGSA 算法用于优化 GRU 神经网络的参数,基于优化后的 GRU神经网络构建了糖尿病预测模型——LA-GSA-GRU。首先,利用 LAGSA 算法对 GRU 的权重、阈值参数优化,克服了原始随机赋值方法存在的缺陷;然后,将得到的最佳参数组合作为 GRU 的最佳初始参数,实现对于糖尿病的有效预测。
第 1 章 绪论
1.1 研究背景和意义
在国家经济市场持续发展的今天,医疗卫生机构和社会保障体系不断改善,中国国民生活质量有显著的提升。此外糖尿病发病率在这样的环境下持续攀升,对人民的身体健康水平产生直接影响,目前而言,疾病缺乏有效的治疗措施,也没有全面的治愈方案,更多的需要通过药物的方式进行控制,避免病情的持续恶化[1-3]。随着情况不断恶化,糖尿病威胁和风险使老年群体身体健康产生威胁,甚至已经发展为全年龄段群体的难题。
糖尿病一方面有着巨大的人口数量基数,同时对人的危害作用最为突出,我们都知道糖尿病本身并不可怕,最关键的就是糖尿病伴随着大量的并发症和问题,例如高血压、冠心病、心血管疾病、肾脏病变等。在长期的发展中,糖尿病并未建立有效的治疗体系和方案,更多的是提前进行预防和控制。从个人的角度看,糖尿病治疗是漫长的过程,并且使个人产生较大的身体负担。在糖尿病防治时,三高问题一直困扰着疾病患者,包括发病率高、并发症概率高、治疗费用高,根据国家卫生部副部长张凤楼所表明的观点,国家每年治疗糖尿病需要花费 2000 亿,在糖尿病患者数量持续增加的同时,相关费用依然在提升[4]。上述问题不仅仅在中国,美国 2019 年疾病控制中心提供的报告显示,美国糖尿病患者数量在快速提升。结合国家的趋势,2035 年全球在糖尿病中需要花费的医疗费用多达 6273 亿美元[5]。还需要考虑部分患者并未意识到糖尿病问题,此类患者并未作为统计样本,所以实际的医疗费用和数据损失依然在提升。不管从国内还是国外进行分析,糖尿病经济损失相对巨大,对人们的健康安全、国民经济发展有直接影响,此时更应该采取应对措施,有效控制糖尿病的发病。在当前处理糖尿病问题时,更多的是选择预防策略,对比治疗策略和预防策略,预防策略最大的优势就是在出现糖尿病前,直接制定有效的规避措施,以此降低后期的治疗费用。对比分析结果表明,糖尿病患者的治疗费用与 250 患者预防费用相同,因此开展针对糖尿病的研究,具备深远价值和影响。 人工神经网络是指基于动物神经网络结构所产生的数学模型,通过有效应用数据,整合多项参数条件,以此判断规律模式[6,7]。
.............................
1.2 国内外研究现状
1.2.1 糖尿病预测研究现状
整合国内和国外糖尿病的研究成果,研究目标可以细化成三个类型:其一是针对糖尿病并发症的探索,判断患者后期糖尿病并发症的概率[9];第二类是对糖尿病筛查模型的研究,筛查糖尿病患者,尽早发现尽快治疗;第三类是对糖尿病发病风险评估的研究,研究各类因素对患病的影响,辨别高危人群后,对可能的影响因素进行干预。 目前国内外与糖尿病有关的模型,从对象来划分可分三类
其一是针对糖尿病患者病情所引发的并发症的预测模型,能客观判断患者未来出现并发症的概率。目前较为著名的模型包括 Sheffield 模型、NIDDM 模型、GDMM 模型、UKPDS Models 模型、CORE模型、Archimedes 模型、Cardiff 糖尿病模型、EAGLE 模型、WESDR 模型等[10]。
其二是糖尿病筛查模型。针对所有群体展开糖尿病筛选和分析,以此在社区内部筛查糖尿病患者,通过模型筛查糖尿病患者,随后及时诊断和治疗,避免错过最佳的治疗时间[11]。
其三是糖尿病发病风险评估模型,主要作用在高危群体,需要对影响要素进行分析,模型本身伴随着诸多危险要素,所以需要应用 Logistic 等方法分析糖尿病的发病概率,结合前期结算的结果,分析和判断糖尿病高危人群;对危险要素进行评分处理,以分数判断最终的糖尿病高危人群[12]。在完成前期的筛选和评估后,分析患者的生活模式,调整患者的生活习惯,以此控制糖尿病的发病概率。在十年的发展历程中,模型使用更为广泛,也有部分研究结果表明,通过对高危群体进行干预治疗,对于后期公共卫生保护产生积极意义和影响。不仅如此,高位群体干预概率和效果与面向全体居民的效果更为合理,能尽快匹配合适的群体,做好干预治疗控制,以此提升糖尿病的管理效率,控制治疗的成本,避免糖尿病患者风险不断恶化。
.........................
第 2 章 预测模型的相关理论基础
2.1 引力搜索算法
伊朗 Esmat(2009)年提出引力搜索算法(GSA),GSA 属于新型群智能优化算法[45]。标准 GSA 中,需要确定引力与牛顿第二定律的基础,在 GSA 观点下:粒子万有引力客观存在,随着质量距离的减少,对应的粒子间引力将大幅提升,同时粒子会在其他粒子合力作用下发生加速度,并且面向高质量粒子,确保粒子能朝着大质量粒子聚拢,进而确保成为系统和方案的最优解。
GRU 神经网络特征如下所示:
(1)从输入到输出映射过程中,具体的数学理论现实,所有复杂非线性映射都有所呈现,由此判断 GRU 神经网络有着复杂化的内部机制;
(2)学习具备正确答案的实例集,自动提取求解规则,掌握自学习能力;
(3)推广和概括能力相对突出。 GRU 的这些优点,它是很适合应用到各种分类场景中,于是本研究选取 GRU 神经网络算法作为建模的一个算法,希望能分析糖尿病预测问题,创建更多高精准度、高性能的集成学习模型,以此预测和分析糖尿病,希望结合具体的分析结果,能为 GRU 神经网络分析提供理论指导和实践建议,同时确定慢性疾病后期的研究方向和思路。 从具体应用的角度进行分析, GRU 神经网络本身也存在不足:
(1)训练时序数据时,因为网络模型收敛速度的滞后,伴随着梯度发散等问题,在改变结构和参数时,可重点关注运行状态。
(2)权值更新时需要梯度下降算法的配合,在梯度下降算法的支持下,容易发生局部最小值的问题,进而对网络数据预测进行限制。
(3)对比传统神经网络,神经网络难以直接界定参数基础,主要要素包括:隐含层层数、神经元个数等。从上述问题分析,对操作者的个人经验有更高要求。
...............................
2.2 学习自动机
学习自动机(Learning automata,LA)首先由Narendra和Thathachar于1974年提出,是一种使用自动机在潜在的有限动作中找到最佳动作的方法,已被广泛应用在不同类型的工程上[46]。该方法的基本步骤如下:首先,从有限的潜在动作集中随机选择一个可能的动作;然后,将所选的动作用于评价过程随机环境,并进行反馈的信号进行计算;最后,使用反馈信号进行每个动作的概率更新。在LA中,正是迭代过程中的信号更新使得其能通过学习获得最好的结果。图2-1给出了学习自动机的学习过程。
GRU 神经网络由 Cho Kyunghyun 于 2014 所提出,模型前身是长短时记忆神经网络算法模型,两者均属于循环神经网络算法一类。该算法具有很多特点,其中最为突出的特点是规避了 CNN 算法中的依赖性问题[47]。LSTM 算法通过门的方式呈现,以此促进输入数据有效性,随后完成神经元单元状态的调整,例如:遗忘门(ForgetGate)、输出门(OutputGate)等。GRU 神经网络能进一步调整门的概念,完善输入们、遗忘门的设计思路,以此创建更新门(UpdateGate)。
对比分析传统神经网络, GRU 算法能完成多神经元的重组和结合,属于独立的链式模型,从传统神经网络系统的角度进行分析,神经元 A 不仅具备独立的简单函数,同时在 GRU 神经网络内,A 更是特定门限结构,有着较为复杂的运算逻辑
..............................
第 3 章 数据预处理及特征筛选分析 ......................... 16
3.1 数据来源 .................................... 16
3.2 数据预处理 ................................ 17 
第 4 章 基于 GSA-LA 优化 GRU 神经网络的糖尿病预测模型 .................................. 24
4.1 基于学习自动机优化的引力搜索算法 ........................... 24
4.2 LAGSA 算法与 GRU 神经网络的结合 .................................. 25
第 5 章 仿真实验分析 ......................... 30
5.1 实验环境 ............................. 30
5.2 LAGSA 算法性能对比实验 .................................. 30
第 5 章 仿真实验分析

5.1 实验环境
本节针对本文提出的 LAGSA 算法、LA-GSA-GRU 模型进行性能的仿真验证。首先,详细介绍了实验环境;然后,利用多种智能算法进行基准函数优化对比实验,验证 LAGSA 算法的有效性;最后,利用多种网络模型进行对比仿真实验,验证本文提出的 LA-GSA-GRU 模型的有效性,并从多个角度对这些模型得出的结果进行了分析。
检验分析LAGSA算法、LA-GSA-GRU模型效果时,需要考虑外部实验环境因素。本课题实验环境具体参考表 5-1:

计算机论文参考
计算机论文参考

................................
6 总结与展望
6.1 总结
针对传统的糖尿病预测模型预测精度低、泛化能力弱的问题,将群体智能算法与深度神经网络结合起来,开展了基于 GSA-LA 优化 GRU 神经网络的糖尿病预测模型研究;同时,设计了糖尿病预测模型验证实验,对比分析了本文所提算法的有效性。本文的主要工作如下:
(1)基于公开的糖尿病病例数据集进行实验,分别基于 XGBoost 算法、IV 值进行特征变量筛选,最终得到 12 个特征的集合进行后续建模的数据集
(2)将自动学习机算法用于优化引力搜索算法的引力常数,提出了一种基于自动学习机的引力搜索算法(LAGSA)。该算法基于学习自动机进行 GSA 中引力常数的自动调整,通过微调 GSA 算法参数可以其具有更好的寻优性能和更快的收敛速度。
(3)利用提出的 LAGSA 算法用于优化 GRU 神经网络的参数,基于优化后的 GRU神经网络构建了糖尿病预测模型——LA-GSA-GRU。首先,利用 LAGSA 算法对 GRU 的权重、阈值参数优化,克服了原始随机赋值方法存在的缺陷;然后,将得到的最佳参数组合作为 GRU 的最佳初始参数,实现对于糖尿病的有效预测。
(4)设计了糖尿病预测模型验证实验。首先,完成了 LAGSA 算法与常规 GSA 等算法在不同基准函数的对比实验,仿真结果表明 LAGSA 算法具有更高的寻优效果和更好的鲁棒性;然后,将 LA-GSA-GRU 模型与 GRU 神经网络、GSA-GRU 神经网络、LSTM 等模型进行对比分析,结果表明 LA-GSA-GRU 模型具有更高的预测精度和更强的泛化效果。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217