基于卷积神经网络和Transformer的结直肠息肉分割方法思考

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:42522 论文编号:sb2023100912151851146 日期:2023-10-11 来源:硕博论文网

本文是一篇医学论文,笔者认为医学图像分割是医学诊断和治疗最重要的工具之一,它通过获取人体内部的图像信息来帮助医生诊断和治疗疾病。
第1章绪论
1.1研究背景以及意义
结直肠息肉是生长在结肠和直肠表面的异常组织,其恶化后可导致结直肠癌。结直肠癌是世界上第三常见的癌症,每年可夺去60000多人的生命[1]。Dougla等[2]研究报告表明:结直肠息肉的检测率每增加1%,结直肠癌发病率就会下降3%。在临床实践中,医生通过查看结肠镜视频或者息肉图像来手动注释息肉的区域和轮廓信息,并且根据标注的信息切除结直肠息肉。这个过程不仅要求医生具有丰富的临床经验,同时也会消耗医护人员较长的工作时间。另外,由于不同医生的专业水平存在差异,诊断结果可能不一致,甚至在标注过程中出现误判。因此,开发一种高效且精准的结直肠息肉检测和分割技术对筛查结直肠息肉和预防结直肠癌都具有十分重要的意义。早期,结直肠息肉分割方法主要依赖于几何特征和线性迭代聚类超像素等低级特征。然而,这类方法产生的结果存在大量的误差,方法的泛化性比较差,很难满足医生和患者的实际需求。近几年,卷积神经网络在医学图像处理方面展示出巨大的潜力。与传统的结直肠息肉分割方法相比,基于卷积神经网络的结直肠息肉分割方法凭借卷积层强大的特征提取能力取得了令人满意的分割结果。

医学论文怎么写
医学论文怎么写

图1.1展示了结直肠内窥镜采集的结直肠息肉结构及其对应的分割结果。尽管目前一些先进的分割方法在医学图像分割中取得了可喜的结果,但是,结直肠息肉分割仍然是一项具有挑战性的任务[3],主要原因有以下几点:首先,结直肠息肉影像需要在肛门镜下采集,仪器操作空间狭小、仪器镜头被肠黏液污染等外界因素会导致采集的图像存在伪影、模糊等图像退化问题。其次,结直肠息肉的形态多变性很容易导致漏检和错检。最后,结直肠息肉的颜色和质地与周围组织及其相似,使得息肉与周围组织之间的边界不尖锐,导致许多方法存在边界分割错误和边界不连贯等问题。因此,对于临床医生来说,开发一种能够准确的定位和分割所有可能的结直肠息肉的分割方法是必不可少的。
.........................
1.2国内外研究现状
随着深度卷积神经网络的发展,医学图像分割已经从基于手动设计特征的传统方法逐渐演变到基于卷积神经网络的方法。本节对医学图像分割和结直肠息肉分割的国内外研究现状进行了简要综述。
1.2.1传统医学图像分割方法研究现状
传统的医学图像分割方法通常依赖于边缘检测、模板匹配技术、统计形状模型、活动轮廓等。
基于边缘检测的分割方法首先对医学图像进行灰度化、滤波、增强等操作,然后利用Canny算法、Sobel算法、Prewitt算法等边缘检测算法进行边缘检测,得到边缘强度图像,最后通过Marr-Hildreth算法、LoG算法等边缘增强算法来增强边缘强度图像,以便得到更理想的目标区域。Zhao等人[4]使用数学形态学边缘检测算法来检测具有椒盐噪声的CT图像中的肺部边缘。De等人[5]提出一种融合矢量量化和边缘检测方法的分割方法。如Zhang等人[6]提出了一种新的MRI图像边缘检测分割算法。基于边缘检测的分割方法不仅适用于医学图像分割,在自然图像分割和工业图像分割等领域也被广泛应用。但是,这些方法对细胞核和眼球血管等图像的分割质量较差。同时,容易受到图像亮度和对比度的影响,导致分割结果出现边缘断裂和分割错误现象。
基于模板匹配的分割方法通常包括以下几个步骤:在具有代表性的目标图像上标记处目标区域的位置和形状,得到匹配模板,接着通过计算像素的相关性来实现模板和待分割图像的匹配,筛选出匹配程度最高的区域,最后根据匹配结果将目标区域从原始图像中分割出来。常见的基于模板匹配技术的分割方法有基于灰度值的模板匹配、基于相关系数的模板匹配、基于相似度度量的模板匹配、基于归一化互相关的模板匹配。如Chen等人[7]首先对CT图像的每个像素应用低级分割,再应用模板匹配技术实现胸部目标区域的分割。Lalonde等人[8]使用基于Hausdorff的边缘图模板匹配技术实现椎间盘检测。基于模板匹配技术的医学分割方法通常对光照、噪声干扰比较敏感,在实际应用中需要进行一定的图像预处理和图像优化。
...........................
第2章相关工作
2.1结直肠息肉相关知识
结直肠息肉是在结直肠表面隆起的肿物,早期结直肠息肉没有明显的症状,但是随着息肉的增大,可能会出现腹痛、便血、便秘等症状,严重的患者还可能出现贫血、消瘦、肠梗阻等并发症。医学界已经认定结直肠息肉的发生和多种因素有关,例如:高脂、高热量食物、长期饮酒和抽烟等不良习惯都会增加结直肠息肉和结直肠癌的发病率[51]。在临床医学中,结直肠息肉的种类繁多,根据息肉的形状可以分为带蒂息肉和无蒂息肉,根据息肉的性质,可以分为炎症性息肉、增生性息肉、腺瘤性息肉,其中腺瘤性息肉是临床上最常见的息肉,如果不及时切除,随着病情的恶化,很有可能发展成结直肠癌。
结直肠息肉筛查的黄金标准是光学结肠内窥镜检查,通过内窥镜可以直接观察到肠内息肉的大小、形态、数量等信息[52]。在临床检查中,光学结肠内窥镜仪器大致可以分为两种:一种是金属硬管的内窥镜,一种是纤维结肠内窥镜。金属硬管内窥镜对患者带来的痛苦比较大,已经被放弃使用。目前,绝大部分医院都采用柔性的纤维结肠内窥镜,如图2.1中的(a)所示,纤维结肠内窥镜是一支细长可弯曲的仪器,直径大约1厘米,末端装有一个带有光源的微型电子摄影机,医生将结肠镜通过肛门进入直肠或者大肠,以检查直肠或者大肠部位的溃疡性结肠炎、息肉等肠道疾病。图2.1中的(b)是结肠镜检查示意图,其检查过程大致如下:在检查前,患者清理肠道,以保证肠道干净,便于观察。
...........................
2.2卷积神经网络
卷积神经网络是一种具有强大的特征提取能力和特征学习能力的深度学习算法,在人脸识别、自动驾驶汽车、目标检测、图像分类和智能医疗等计算机视觉任务领域有着广泛的应用。卷积神经网络的核心思想是利用卷积层、池化层、全连接层、激活函数等结构对输入的图像进行特征提取和分类,其结构如图2.2所示。本节将详细介绍卷积神经网络的这些组件。
2.2.1卷积层
卷积层是卷积神经网络的核心运算单元,主要由卷积核构成,每个卷积核代表一组可学习的权重,卷积神经网络正是利用不同的权重值从原始输入数据中提取特征信息,以完成分类、回归等任务。在计算机视觉任务中,卷积神经网络的输入一般是三维张量,其大小可以表示为C×H×W,H表示张量的高度,W表示张量的宽度,C表示张量的通道数。如图2.3所示,卷积核按照设定好的步长在输入特征图上进行滑动窗口计算,特征图中每个元素的特征值和卷积核中对应位置的特征值相乘,最后将乘积累加运算的值保存到一组二维的特征图中。
2.2.2池化层
在卷积神经网络中,池化层的计算过程可以概括为是对输入图像或特征图的每个局部区域进行统计操作,然后输出一个代表该区域信息的单个值域向量。在卷积神经网络中通常使用最大池化和平均池化等方法。以最大池化为例,如图2.4所示,输入的特征矩阵是一个4×4的矩阵,池化窗口的大小为2×2,步长为2。池化卷积核在输入的特征矩阵上滑动窗口,对于每个窗口取最大值,得到池化后的结果。平均池化和最大池化的计算过程类似,平均池化对每个窗口包含的元素求平均值来代表整个窗口的特征值。池化层在卷积神经网络中可以压缩数据和参数,减少过拟合,提高模型的泛化性。
............................
第3章 基于双分支多尺度特征融合的结直肠息肉分割网络 ............ 24
3.1 引言 .................................... 24
3.2 基于双分支多尺度特征融合的网络 ................................ 25
第4章 基于多尺度特征边界图推理网络的结直肠息肉分割网络 .... 46
4.1 引言 ................................ 46
4.2 基于多尺度特征边界图推理网络 ................................. 47
第5章 总结与展望 ............................... 66
5.1 总结 ............................... 66
5.2 展望 ........................................ 67
第4章基于多尺度特征边界图推理网络的结直肠息肉分割网络
4.1引言
Transformer凭借多头自注意力和多层感知机描述特征之间的全局依赖关系和捕获全局上下文信息,完全突破了卷积神经网络感受野的局限性[45][67][94][95]。但是,它在捕获低级特征信息和细节信息方面不充足,限制了局部特征的学习。
目前,结合卷积神经网络和Transformer的息肉图像分割方法已经成为主流架构之一。从多尺度特征的角度分析,结合卷积神经网络和Transformer息肉分割方法忽略了探索尺度内局部特征和全局特征之间的关联以及多尺度特征之间的交互,导致遗漏微小的息肉。事实上,结直肠息肉具有多变的大小、形态、位置和颜色等特性,多尺度特征交互可以有效地捕获尺度的差异,解决复杂的息肉尺度变化问题[96]。对此,本文设计了一种基于多尺度特征边界图推理网络的结直肠息肉图像分割网络(Multi-scale Feature Boundary Graph Reasoning Network,MFBGR)。
首先,考虑到空间信息和远距离特征依赖关系都是必不可少的,MFBGR对卷积神经网络提取的最深三层的局部特征信息使用少量的Transformer块,将尺度内的局部空间信息特征关联到尺度内的全局特征,使网络更专注于局部细节信息和全局上下文信息,提升对体积较小息肉的检测率。相对于高级语义特征信息,浅层次的高分辨率特征图往往对网络性能的贡献较小,也会占用大量的计算资源[97]。考虑到网络性能与模型复杂度之间的平衡,MFBGR对卷积神经网络提取的最高三层的特征使用Transformer块。同时,受到尺度间相互作用的启发,考虑到尺度差异和全局信息的必要性,设计了跨尺度特征融合模块,对于Transformer块生成的不同尺度的全局上下文信息,跨尺度特征融合模块对其尺度变换交互和级联式融合,以实现目标对象的尺度差异学习和探索目标区域的共识区域。为了从息肉区域和边界之间捕获有价值的信息,在跨尺度特征融合模块之后引入边界图推理模块[82],边界图推理模块利用图卷积实现卷积神经网络的低级局部特征和跨尺度特征融合模块的高级语义信息之间的传播,以进一步细化边缘信息。卷积神经网络主干分支提取的特征虽然缺少远距离特征依赖关系,但是其中包含的空间、位置和纹理等信息是非常重要的。

医学论文参考
医学论文参考

.............................
第5章总结与展望
5.1总结
在临床实践中,结直肠息肉的形态、大小和位置往往是复杂多变的,这给息肉分割带来了巨大的阻碍。开发自动、精准和稳健的结直肠息肉分割方法可以为医生提供病灶区域的信息,提高医生对患者的诊断和治疗效率。近年来,卷积神经网络和Transformer在结直肠息肉分割领域取得了较好的效果,但是也存在一些问题。例如,卷积神经网络和Transformer的结合方式简单,忽略了不同特征信息之间的联系,影响对多变化息肉的检测等。针对上述问题,本文对结直肠息肉分割技术展开深入的研究,主要的工作内容可以总结如下:
(1)本文提出了一种基于双分支多尺度特征融合的结直肠息肉分割网络。首先,网络并行地使用卷积神经网络和Transformer双分支提取多尺度和多级别特征信息。其次,设计了特征超解码器融合多尺度和多级别特征信息,以提升网络对复杂场景的理解能力,同时生成初始分割预测图。接着,设计了多尺度特征聚合模块来交互卷积神经网络提取的中级和高级特征信息,以促进网络在多尺度特征之间探索目标区域,之后,使用极化自注意力模块从空间和通道两个角度关注息肉区域和减少冗余信息。最后,三个递进的反向注意力融合模块自底向上逐步细化分割边界。与目前主流的结直肠息肉分割方法相比,本文提出的基于双分支多尺度特征融合的结直肠息肉分割网络无论从客观还是主观方面都取得了优异的分割结果,所设计的功能模块减少了分割错误,提升了分割的准确率。
(2)本文提出了一种基于多尺度特征边界图推理网络的结直肠息肉分割网络。首先,Transformer块在卷积神经网络主干分支提取的多尺度特征内部捕获局部-全局线索。其次,设计跨尺度特征融合模块对Transformer块生成的多尺度全局信息进行尺度变化交互和级联式融合,以捕获跨尺度特征之间的相关性,解决分割目标的尺度变化问题。最后,将传统的边界细化或增强思想推广到图卷积推理层。图卷积推理层接收卷积神经网络主干分支提取的低级特征信息和跨尺度特征融合模块的融合特征,或者中间预测结果,在图顶点之间进行跨域特征信息的传播,探索目标区域和边界区域之间的信息,实现了更精确的边界分割。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 15800343625