基于改进U-Net的多注意力视杯和视盘分割

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:35266 论文编号:sb2025022111023453123 日期:2025-03-08 来源:硕博论文网

本文是一篇计算机论文,本文结合使用Dice Loss和Focal Loss作为模型的损失函数,以缓解样本中前景区域和背景区域不平衡问题,同时解决正负样本不均衡问题并且快速聚焦于难分辨样本,从而使得模型的参数达到最优以预测得到接近真实结果的分割结果。
第一章绪论
1.1课题研究背景和意义
2023年6月发布的《青光眼综合防治管理白皮书》显示,我国是世界上盲和视觉损伤患者最多的国家之一,我国人群青光眼患病率达2.58%,到2020年预计患者数量达到2180万,约占世界青光眼患者的四分之一,致盲人数可达567万。青光眼发病大多数慢性隐匿,早期诊断困难。同时,大量患者的青光眼疾病意识不足,我国青光眼的社会认知度低,三分之二的青光眼患者初诊时已发展到了中晚期。在发达国家青光眼的未及时诊断率达50%,发展中国家未及时诊断率可达90%。青光眼是导致全球失明的第二大原因,仅次于白内障,也是造成不可逆转性失明的主要原因[1]。这种疾病会对视力造成逐渐且不可逆的损害,如果得不到及时治疗,最终可能导致完全失明。鉴于青光眼对视力造成的不可逆转的损害,其早期发现和及时干预尤为重要。
青光眼筛查的一项关键技术是评估视神经头(optic nerve head,ONH),采用二元分类法区分青光眼患者和健康受试者[2]。基于此目前已提出了许多临床测量方法,包括CDR、神经视网膜边缘区域与视盘区域面积比(rim-to-disc area ratio,RDAR)、视盘直径等测量指标,其中CDR是最常用的指标之一。因此为了准确计算CDR以筛查青光眼,需要对眼底图像进行准确的视杯和视盘分割。但现有的图像分割方法在实际应用中仍面临一些挑战和问题。首先,传统的视杯视盘分割方法主要依赖于图像处理和计算机视觉技术,如阈值分割、边缘检测、区域生长等。这些方法在一定程度上可以实现对眼底图像视杯视盘的分割,但它们通常对眼底图像的质量要求较高,对于图像中的噪声和光照变化较为敏感,这限制了它们在实际临床环境中的应用。其次,一些基于机器学习和深度学习的方法虽然在准确性上有所提高,但它们往往需要大量的标注数据进行训练,而高质量的标注数据获取成本高昂且耗时。此外,这些方法在面对不同来源和不同质量的图像数据时,可能会出现过拟合现象,影响分割效果。再者,现有的分割方法在处理具有复杂背景或病理特征的眼底图像时,仍然存在一定的困难。例如,视盘区域的血管交叉、阴影和反光等特征可能会干扰算法的判断,导致分割结果不准确。
..............................
1.2国内外研究现状
现有的视杯视盘分割方法主要分为三类,即改进模型结构,引入注意力机制和预处理眼底图像。
在改进模型结构方面,主要采用CNN(Convolutional Neural Networks)进行分割,Ronneberger等[3]提出了U-Net框架,U-Net以全卷积神经网络(FullyConvolutional Networks,FCN)为基础,引入了编码器-解码器架构。由于下采样过程中不可避免的会丢失部分边缘特征,U-Net在上采样过程中采用跳层连接将编码器部分的特征图与解码器部分的特征图进行拼接,确保通过上采样恢复的特征图中保留必要的低级语义信息。He等[4]提出了深度残差学习框架来解决增加网络深度可能出现的退化问题并简化了网络训练过程。基于此Xie等[5]提出了ResNeXt模型结构,该结构是通过重复一个聚合了一组具有相同拓扑结构变换的构件来构建的。这项创新引入了一个新的维度,称为基数维度,代表着转换集的大小。大量证据证明了基数是除深度和宽度以外的重要因素,并通过实验强调了增加基数被证实是提高准确性的更有效的途径。Ganesh等[6]应用ResNeXt结构来优化Y-Net[7],并引入了基于类激活图(Class Activation Mapping,CAM)和聚合变换的ROI分割分层。Fu等[8]将多尺度输入集成到U-Net框架中,以促进不同层次的感知领域的融合。此外,还引入了侧输出层来解决模型训练中的梯度消失问题,为了将OC和OD之间的径向关系转换为空间关系,对眼底图像应用了极坐标变换。这种变换不仅方便了转换,而且通过插值平衡了OC区域与OD区域的比例。Liu等[9]采用增强的U-Net模型来检测眼底图像中的OD区域。“补丁级”对抗网络在增强真实值与基于CNN的分割网络输出之间的高阶一致性方面发挥了至关重要的作用。Liu等[10]提出了新颖的区域到边界的深度学习模型,其模型结构为U形,网络的最后一层包括一个生成目标概率图的分支以及一个获得相应的有符号距离图的分支,结合区域和边界特征以得到最终结果。Xie等[11]提出了CANet(Context aware network),包含双流金字塔模块和上下文感知模块,通过多分辨率输入版本来避免原始图像中的局部细节丢失,并且引入了链式残差池化模块以有效抑制复杂背景的影响。但这些工作仍然存在一些问题,如难以同时捕捉到全局和局部信息,在处理具有复杂背景和数据不平衡的医学图像时,分割精度较低,以及由于医学图像具有噪声、模糊、对比度低等特点,在特征提取上可能面临挑战,难以有效提取关键信息等。
........................
第二章相关理论与原理基础
2.1眼底图像介绍
ONH由OC和OD区域组成,其结构变化是评估青光眼损伤程度的标准方法之一,ONH的结构变化会导致OC区域相对于OD区域扩大,也即视杯垂直直径与视盘垂直直径的比值增大。为了量化OC区域和OD区域的直径,需要从视网膜图像中准确分割OC和OD区域,由于OC区域和OD区域不规则的圆盘形状、OD区域的边界不确定以及可变的成像条件使得视杯视盘分割任务具有挑战性。图2-1显示了ORIGA[38]数据集中正常人和青光眼患者的OC区域和OD区域以及神经视网膜边缘(Rim)区域,其中绿色圆圈围成的区域是OC区域,蓝色圆圈围成的明亮中心区域是OD区域,绿色圆圈与蓝色圆圈围成的区域是Rim区域。

计算机论文怎么写
计算机论文怎么写

.......................
2.2眼底图像预处理
由于不同来源的原始眼底图像数据之间存在极大的差别,因此在对原始眼底图像进行杯盘比预测之前需要对原始眼底图像进行图像预处理以将其格式调整为标准图像格式,进而得到精确的分割结果。
2.2.1 OD定位技术
现有的方法大多是直接采用简单的U-Net对OD区域进行定位并分割,这种方法对于质量较高的原始眼底图像数据能够得到较好的图像分割效果,但是真实的原始眼底图像数据往往不具备较高的图像质量,且不同来源的原始眼底图像数据差异极大,因此需要更为有效的方法来对原始眼底图像进行处理。
U-Net由于其对称的U形结构以及跳层连接的引入能够有效地保留图像的空间信息,这对于精确定位OD等解剖结构至关重要。当图像亮度增强后,可以提高网络对图像中细节的识别能力,从而在OD定位任务中获得极大的提升,其具体原因如下:
(1)增加图像对比度:对图像的亮度进行增强能够增加眼底图像中OD区域与背景区域的对比度,从而使得U-Net能够更准确地从眼底图像中定位并分割OD区域。
(2)增强细节信息:通过对图像的亮度进行增强,能够使得图像中如血管和OD区域边缘等细微结构变得更加清晰,从而使得U-Net能够对OD区域进行更准确地定位并分割。
(3)降低亮度影响:在实际采集得到的原始眼底图像中,由于光照不均等因素可能会导致得到的眼底图像总存在过亮或者过暗的区域,因此对眼底图像进行亮度增强能够缓解这些干扰因素对U-Net进行OD区域定位带来的不利影响。
............................
第三章 眼底图像预处理 ........................... 20
3.1 引言 ............................ 20
3.2 OD定位及图像增强方法 .................... 20
第四章 杯盘比预测模型 .................... 28
4.1 引言 .................................... 28
4.2 模型结构 ......................... 28
第五章 总结与展望 ................ 48
5.1 总结 ...................................... 48
5.2 展望 ................................. 49
第四章杯盘比预测模型
4.2模型结构
U-Net以及基于U-Net进行改进构建的模型在生物医学图像分割领域取得了巨大的成功:
(1)医学图像的特点是器官结构固定,往往缺乏丰富的语义信息,因此需要同时考虑高级语义特征和低级细节,所以U-Net的跳层连接能够很好的发挥作用。
(2)医学图像的数据较少,获取难度大,使用大型网络进行学习很容易过拟合,并且虽然大型网络有更强的图像表述能力,却并不适合医学图像结构固定、内容较少的特点。U-Net通过使用跳层连接将编码器中的低级特征和解码器中的高级特征进行拼接,从而能够在较少的训练数据下获得更好的性能。
(3)医学图像数据通常存在噪声、伪影和不同的成像条件等问题。U-Net通过使用反卷积层进行上采样,避免了精细的空间信息的损失,从而能够获得更好的泛化性能。
(4)医学图像数据通常具有较高的分辨率和尺寸。U-Net通过在编码器中使用池化层进行下采样,在解码器中使用反卷积层进行上采样,从而能够有效地处理大尺寸图像。
因此本文基于U-Net模型框架,对其结构进行改进并引入多种注意力机制,同时使用混合损失函数以提高模型分割精度。

计算机论文参考
计算机论文参考

.............................
第五章总结与展望
5.1总结
青光眼是一种不可逆的致盲性眼病,早期难以发现,2020年《中国眼健康白皮书》指出,主要致盲性眼病疾病谱已由过去的沙眼、白内障转变为青光眼、眼底病等年龄相关、代谢相关性眼病。我国青光眼患者数量庞大,且青光眼患者数量呈年轻化趋势,与其他慢性病共患病比例高,但是我国目前青光眼未及时诊断率极高,因此需要进行大规模青光眼筛查以进行及时治疗。
本文基于U-Net模型结构,通过使用ResNeXt块对模型主干网络进行改进,在深度和宽度维度以外引入了基数维度,增加基数比增加深度和宽度更加高效,尤其是在增加深度和宽度开始带来负面提升时。通过使用分组卷积使得模型的总参数量减少,且能够学习到更为广泛、更加多样化的特征集,增强了模型的表征能力。本文将注意力门引入了提出的模型中,用于强调通过跳层连接传输的显著特征同时有效抑制其中的不相关的信息和噪声,使得模型能够更准确地辨别图像前景和背景,且由于注意力门使用了软注意力,能够通过前向传播学习得到注意力的权重。同时本文引入了CBAM以提高模型准确性,卷积运算通过整合跨通道和空间信息来提取有价值的特征,CBAM的引入增强了这一过程,强调了在通道和空间维度上有意义的特征。CBAM先使用通道注意力模块进行处理以聚焦于图像中有用的信息,随后使用空间注意力模块进行处理以聚焦于特征图空间内部的关系,对于使用到的两种不同的注意力模块的顺序,由于两种不同的注意力其各自的作用是不同的,因此序列化地使用两种注意力机制,其效果比并行化使用两种注意力机制效果更好,CBAM将最大池化和平均池化分别应用于输入特征图以分别导出最大池化和平均池化特征。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
相关计算机论文论文
QQ 1429724474 电话 18964107217