基于可解释深度学习和自监督学习的医学图像分类算法探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:42522 论文编号:sb2023102417265751258 日期:2023-10-30 来源:硕博论文网

本文是一篇计算机论文,本文讨论了医学图像分类算法的最新进展。研究了基于可解释深度学习的细粒度医学图像分类问题,提出了基于改进神经原型树的细粒度医学图像分类算法,提高了细粒度医学图像分类的准确率的同时,提供了更好的可解释性。
第1章 绪论
1.1 研究背景与意义

计算机论文参考
计算机论文参考

随着深度学习[1]的快速发展,在计算机视觉[2]、自然语言处理[3]等领域都取得了突飞猛进的进展,医学图像分类算法[4]是深度学习技术应用于医疗领域中的一个主流技术,对于医生的病症诊断和治疗具有重要的意义。传统的医学图像分类方法需要大量的手工特征提取和人工标注,而深度学习可以自动提取图像特征,并且在一定程度上减少了人工标注的需要。将深度学习技术应用于医学图像分类领域已成为研究热点。由于医学领域的安全性备受关注,但是传统的深度学习具有“黑盒特性”,传统的深度学习模型应用于医学领域时缺乏安全性和可靠性,医生和研究人员往往难以理解模型的决策过程,也就难以判断模型是否出现了误判或者偏见。另一方面,医学是一个高度技术化的领域,需要专业知识和技能。标注医学数据需要专业的医学知识和技能,医学数据集的标注成本通常很高,使得大多数的医学数据集的标注信息较少,限制了医学图像有监督分类算法的应用与发展。
可解释深度学习算法,可以在模型进行分类决策的同时提供可解释性,让人类更好地理解模型的决策过程和结论,从而提高模型的可靠性和可信度。目前,随着可解释深度学习的深入研究,人们已经逐渐从模型事后可解释的方法转向模型事前可解释的方法,大大推动了可解释的研究进程,随着模型可解释性能力的不断提升,基于可解释的深度学习技术不断应用于医学领域,取得了一些进展,但是,当前的应用于医学图像分类的深度学习技术的可解释性仍然有很大的改进空间。
基于自监督学习[5]的医学图像分类算法是使用医学数据集中的少量带标签的数据,可以完成医学图像的分类任务,由于医学图像数据的特殊性,缺少数据集以及标签数据较少,使得自监督的方法大多不如有监督学习的方法性能好,如何利用有效的标签数据来完成复杂的医学图像分类任务是一个当代的研究热点,而且使用自监督的方法通常也存在可解释性不足的问题,使得基于自监督的医学图像分类算法难以真正的投入到医学领域进行实际使用。
....................
1.2 研究现状
本小节主要针对于基于深度学习的医学图像处理算法、可解释深度学习算法和自监督学习算法的现状进行描述,介绍了国内外的研究现状并分析了目前存在的问题。
1.2.1 基于深度学习的医学图像处理算法研究现状
自深度学习兴起,深度学习被广泛应用于各种医学成像任务,并在许多医学成像应用中取得了显著的成功,从而推动我们进入所谓的人工智能[6](AI)时代。这些算法在训练过程中利用大量的医学图像数据来学习特征和模式,具有精度高和处理速度快的特点,使其在医学影像处理中具有广泛的应用前景,但是基于深度学习的医学图像处理算法通常是黑盒模型,很难直观地解释其内部运作方式。我们无法了解它们如何决策或预测结果。另一方面,标注数据的质量也对深度学习模型的性能和可靠性有着重要的影响。通常需要医学专业人员手动绘制出图像中的感兴趣区域,例如病变区域、组织区域、血管区域等等。这些标注数据提供了训练深度学习模型所需要的真实标签,以便模型能够学习如何识别和分割医学图像中的结构和特征。
初期浅层神经网络[7]在某些任务上取得了一定的进展,处理小规模数据集表现较好,但是存在特征表示能力有限和难以处理复杂任务的问题。深度神经网络比浅层神经网络具有更大的模型容量和更强的泛化能力。在大规模注释数据库上训练的深度模型获得了出色的性能,远远超过传统算法甚至人类的能力,研究人员企图使用更深的的网络来获得高性能,2012年,A. Krizhevsky[8]等人首次提出了深度卷积网络模型AlexNet网络,获得了2012年ImageNet图像分类竞赛的冠军,后来O. Ronneberger[9]等人提出了深层网络U-Net被用于图像分割。在生成式对抗网络(GAN)[10]中,提出在生成模型中附带一个鉴别器,判断样本是来自模型分布还是来自数据分布。生成器和鉴别器都由深度网络表示,其训练通过极大极小优化来完成。对抗性学习广泛应用于医学成像[11]。后来人们关注神经结构搜索和轻量化设计,NAS[12]的目标是自动设计一个针对给定任务的高性能的深度网络架构。Z. Zhu [13]等人成功地将NAS应用于医学图像分割任务中。
............................
第2章 相关技术及基本概念
2.1 医学图像分类算法的相关介绍
随着现代科技的不断进步,各种用于医疗领域的医学图像分类算法出现,使用机器学习和深度学习技术对医学数据进行分类,辅助医生进行疾病诊断和治疗,近年来,基于深度学习的医学图像分类算法层出不穷。
早期的医学分类算法采用传统的机器学习技术,如支持向量机[58]、随机森林[59]等,对医学数据进行分类。这些算法主要依赖于人工设计的特征提取和选择,需要大量的领域专家知识和经验支持。2019年Priyanka Chak[60]等人将神经网络和支持向量机(SVM)应用于肾结石的医学图像分类任务。作者采用了三种不同的特征提取方法:离散小波变换、离散余弦变换和灰度共生矩阵,并使用SVM对这些特征进行分类从而实现将支持向量机应用于医学图像分类任务中。
基于深度学习的图像分类主要以基于卷积神经网络(CNN)的分类为主,它通过学习卷积核的权重参数,将图像的特征提取和分类过程结合在一起,实现对图像的高效、准确的分类。1998年,Yann LeCun[61]等人提出了第一个卷积神经网络模型——LeNet-5。该模型包括卷积层、池化层和全连接层,用于手写数字识别。2012年,Alex Krizhevsky[8]等人提出了AlexNet模型,使用了更深的网络结构和更多的神经元,进一步提高了准确率。同时,他们使用了GPU并行计算,大大加速了训练过程。2015年,微软提出了ResN et模型[62],采用残差学习的方式解决了深层网络训练中的梯度消失和梯度爆炸问题,从而实现更深的网络结构和更高的准确率。2017年,DenseNet模型[63]提出了密集连接的结构,通过将输入特征与前面所有层的输出特征连接在一起,使得模型具有更强的特征重用能力。2020年,Google提出了基于注意力机制的图像分类模型——ViT[64]。该模型使用了Transformer结构,能够直接对图像进行分类,不需要使用传统的卷积层和池化层。它将图像划分为若干个图块,然后将这些图块变换为向量序列,并利用Transformer模型对这些向量进行处理,最后得到图像的分类结果。ViT 模型在图像分类任务上表现出了优异的性能。ViT 模型的提出,标志着基于 Transformer 的自然语言处理技术开始向图像处理领域渗透并取得了理想的效果。
..............................
2.2 可解释深度学习算法
传统的深度学习模型已被广泛用于医学图像分类算法中,并在许多医学成像应用中取得了显著的成功。虽然传统的深度学习模型在医学图像分类任务中具有很高的准确率。但是,这类算法通常具有黑盒特性,即其内部决策过程难以被解释和理解,缺乏可解释性。在医学领域中,通常医学图像涉及到人的健康和生命,需要确保算法的可靠性和准确性,对于模型的可解释性要求较高。为了解决这个问题,出现了基于深度学习模型的事后可解释方法,在一定程度上提供了模型的可解释性,例如在模型预测结果后使用可视化工具来分析模型对决策的关注点或特征。但是事后可解释模型缺乏对模型的全面理解,不能提供令人信服的证据。因此,出现了事前可解释方法,即在模型设计过程中考虑可解释性。这些方法通常通过增加可解释性约束或设计可解释的特征来实现。事前可解释方法比事后可解释方法具有更高的准确率以及更高的可解释能力。
2.2.1 事后可解释深度学习算法
随着深度学习的出现,各个领域的深度学习模型层出不穷,这归结于深度学习模型的优秀性能。深度学习模型通过借助强大算力的硬件设施可以实现图像分类的精确准确率。但是这些深度学习模型往往都是黑盒模型,不能对实验结果提供一个合理的解释,具有黑盒特性的深度学习算法往往存在一定的问题和风险。为了解决这类模型的黑盒问题,事后可解释的深度学习算法开始发展与兴起,深度学习模型不仅需要预测的准确性,可解释性也是衡量模型性能的一个重要指标。事后可解释的深度学习算法主要提供全局的可解释以及局部的可解释。
.............................
第3章 基于改进神经原型树的细粒度医学图像分类算法.............. 29
3.1 基于可解释深度学习的医学图像分类问题 .......................... 29
3.2 基于改进神经原型树的细粒度医学图像分类算法描述 ......................... 31
第4章 基于层次原型树的自监督对比学习医学图像分类算法 ...... 43
4.1 基于自监督学习的医学图像分类问题 ............................. 43
4.2 基于层次原型树的自监督对比学习医学图像分类算法描述 ................. 46 
第5章 总结与展望........................ 61
5.1 总结 ............................. 61
5.2 展望 ............................... 62
第4章 基于层次原型树的自监督对比学习医学图像分类算法
4.1 基于自监督学习的医学图像分类问题
医学图像分类是医学领域中非常重要的任务之一,它可以帮助医生准确、快速地诊断疾病,提高医疗诊断的精度和效率。然而在医学领域中,由于医学图像数据的获取难度和标注成本较高,导致数据集的规模和质量都有限,监督学习算法很难较好的应用于医学图像分类任务中。
基于自监督学习的医学图像分类算法可以利用未标注的数据来增加数据集的规模和多样性,通过在未标注的数据上进行预训练来学习通用的特征表达,从而加速模型的训练和优化过程,用于医学图像分类任务中,解决了医学图像分类中存在的“小数据,大任务”的问题。基于自监督学习的医学图像分类是目前深度学习的一个研究热点,自监督学习通过一个代理任务来学习一种表征,最后使用注释数据进行微调来应用到医学图像分类任务中,但是,早期基于代理任务的自监督学习的医学图像分类算法的准确率较低。
为了解决传统的基于自监督学习的医学图像分类算法中存在的问题,近些年,人们更加关注使用基于对比学习的自监督学习来从事医学图像方面的研究。早期的对比学习主要是基于实例的对比学习,实例对比学习模型通过将同一样本的不同视图或增强视图进行对比,通过不断优化有关样本的相似性和差异性,从而来进行图像样本的表示和学习。SimCLR[51]模型是一个端到端的模型,SimCLR通过潜在空间中的对比损失,通过最大化同一数据示例的不同增广视图之间的一致性来学习表示。MOCO[77]模型引入动量优化算法更新策略,来构建一个对比任务,将图像的正样本和负样本进行对比,从而学习到图像的表示。

计算机论文怎么写
计算机论文怎么写

.........................
第5章 总结与展望
5.1 总结
伴随着深度学习的快速发展,基于深度学习的医学图像分类算法不断被提出,受到了人们的广泛关注。但是,传统深度学习模型的黑箱性质导致其很难应用于医学图像分类中。而用于医学图像分类的模型更加需要具有可解释性,这是由于医学领域的特殊性质决定的。另一方面,医学图像领域具有“小数据,大任务”的特点,自监督学习是一种有效的解决方式。因此,研究基于可解释的深度学习和自监督学习的医学图像分类具有很强的现实意义,本文讨论了医学图像分类算法的最新进展。研究了基于可解释深度学习的细粒度医学图像分类问题,提出了基于改进神经原型树的细粒度医学图像分类算法,提高了细粒度医学图像分类的准确率的同时,提供了更好的可解释性。研究了基于自监督对比学习的医学图像分类问题,提出了基于层次原型树的自监督对比学习医学图像分类算法,提升了具有有限标注的数据下游医学图像分类任务中的健壮性和可迁移性。
本文主要做了以下工作:
(1)针对于医学图像领域中的模型可解释性的问题,本文提出了一种基于改进神经原型树的细粒度医学图像分类算法MBC_ProtoTree。为了更准确地提取图像特征,我们首先设计了一种多粒度特征提取网络,通过多粒度特征提取层获得每个图像的特征表示,并将水平和垂直位置信息嵌入到特征图中。随后将多粒度特征提取层生成的特征映射输入到原型层中,原型层计算原型与补丁之间的相似性,确定呈现图像的原型,并为路由提供证据。接下来,我们改进的软神经二叉决策树层对原型进行训练,为了解决错误原型影响分类决策的问题,我们在该层中设计了一种背景原型去除机制来优化原型路径决策。然后,为了提高模型的泛化能力,我们将全连通层损失函数和叶节点损失函数结合用于模型训练中。最后,将三个主干网络的组合融合作为概率预测。为了验证模型的有效性,我们在两个典型的细粒度基准图像数据集CUB-200-2011和FGVC-Aircraft上与其他各类基线模型进行了对比实验,最后,我们专门在细粒度医学图像分类数据集Chest X-Ray上进行了详细的验证实验。实验结果证明了我们提出的基于改进神经原型树的细粒度图像分类算法模型,对于其他可解释模型,在医学图像分类任务上的先进性。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
相关计算机论文论文
QQ 1429724474 电话 18964107217