基于深度学习的眼底图像视杯视盘联合分割算法探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:28666 论文编号:sb2023101917014951227 日期:2023-10-27 来源:硕博论文网

本文是一篇计算机论文,本文利用深度学习技术对眼底图像进行分析,可以自动检测和诊断青光眼,从而实现高效、低成本的筛查。本文方法可以应用于人群中的早期筛查和跟踪,对预防和治疗青光眼有重要意义。
1绪论
1.1研究背景及意义
青光眼是一种常见的眼部疾病,它会对视力造成不可逆的损害,已经成为全球致盲的主要原因之一[1]。通常,眼科医生会使用专业设备拍摄患者的眼底图像,然后通过分析图像中的视杯和视盘等关键区域来评估患者的眼部健康情况,并帮助诊断青光眼以及制定相应的治疗计划。不幸的是,青光眼的早期症状并不明显,这使得它很难在早期被发现。尤其是对于老年人来说,如果延迟诊断,就可能导致永久性的视力丧失。因此,早期发现这种不可逆的青光眼疾病至关重要。青光眼患者早期通常没有症状,直到疾病进展到中晚期时,患者可能会出现视力下降和视野缺失等症状。图1.1显示了正常眼和不同时期青光眼所看到的视野区别。

计算机论文参考
计算机论文参考

.........................
1.2国内外研究现状
视杯视盘分割是医学图像处理领域的一个重要研究方向,其主要目的是自动化地分割眼底图像中的视杯和视盘区域。目前,该领域的研究主要分为两类:传统方法和深度学习方法。
1.2.1传统方法
早期的工作主要是使用传统方法进行视杯视盘分割,传统方法包括通常基于水平集、活动轮廓、主动轮廓、阈值分割、超像素分类、模板匹配等图像处理技术[4]对眼底图像进行处理,以实现视杯视盘的自动或半自动分割。这些方法已经得到了广泛应用,并取得了一定的成果。例如,王莹等人[5]提出了一种基于双层水平集的方法,用于分割眼底图像中的视杯和视盘;Mittapalli等人[6]和Joshi等人[7]提出了新颖的活动轮廓模型,来对视盘进行分割;郑姗等人[8]提出了一种基于多相主动轮廓的模型,可以同时对眼底图像中的视杯和视盘进行准确的分割。通过引入椭圆约束,该方法能够更好地适应眼底图像中的不同形状和尺寸;Agarwal等人[9]提出了一种基于图像直方图的技术用于研究图像的一些统计特征,例如均值和标准差。该技术利用图像处理方法,通过建立视杯和视盘之间的关系来确定它们的分割阈值,并且采用一种与图像质量无关、不受噪声干扰的自适应阈值方法对视盘和视杯进行分割;Cheng等人[10]提出了基于超像素分类的方法,用于视杯和视盘的分割。作者从超像素计算中心环绕统计数据,并将它们与视杯和视盘分割的直方图统一起来。最后通过包含视杯分割的位置信息来结合视杯的先验知识。基于分段的视杯和视盘分割,并计算杯盘比以进行青光眼筛查;Xu等人[11]提出了一种超像素分类的方法,用于视杯的定位和分割;Aquino等人[12]和Yu等人[13]都提出了基于模板匹配的方法,用于从眼底图像中分割视盘。Lu等人[14]提出了一种基于圆形变换的技术,用于视盘的检测和分割。这种技术利用圆形变换来同时捕捉视盘的圆形形状和跨越视盘边界的图像变化;Morales等人[15]提出了基于数学形态学和PCA的视盘分割方法,该方法利用不同的操作,例如广义距离函数(GDF)、分水岭变换的变体、随机分水岭和测地线变换等帮助更准确地检测和分割视盘区域;Zheng等人[16]提出的方法利用了一个能量函数,该函数能够自然地适应于具有图形切割的全局优化框架,以自动分割彩色眼底照片中的视杯和视盘;Chakravarty等人[17]提出了一种视杯视盘联合分割框架,该框架使用了有趣图像的监督深度估计和视盘、颜色边界处的颜色梯度,以模拟视盘和颜色边界之间基于深度的交互,从而实现视杯和视盘的联合分割;吴骏等人[18]提出了一种基于多特征融合的方法,用于视杯和视盘的自动化分割。该方法采用多阶段分割的策略,能够有效地提高分割的精度。
............................
2相关理论与技术简介
2.1视网膜眼底图像与数据集
2.1.1视网膜眼底图像
视网膜眼底图像是通过专门的眼底照相机拍摄的照片,可以显示眼底的各种结构,如视网膜、视神经乳头(又称为视盘)、黄斑和视网膜中央动静脉等[40]。这些结构的状态和形态可以提供非常重要的医学信息,可用于诊断眼部疾病,例如青光眼、黄斑变性和糖尿病视网膜病变等。视网膜眼底图像可以呈现为彩色或黑白形式,彩色眼底图像包含了更多的细节信息,可以用于更细致的分析,而黑白眼底图像则可以更好地突出结构的对比度,适用于一些特定的诊断任务。图2.1显示了眼底照相机以及彩色眼底图像基本结构。

计算机论文怎么写
计算机论文怎么写

现代医学影像学和计算机科学技术的发展,使得视网膜眼底图像的自动分析和诊断成为可能。通过图像分析技术,可以从视网膜眼底图像中提取各种医学特征,例如杯盘比(Cup-to-Disc Ratio,CDR)、黄斑中心凹度等。这些特征可以用于判断眼底疾病的严重程度和进展情况,从而帮助医生做出更准确的诊断和治疗计划。同时,计算机视觉技术可以自动检测和识别眼底图像中的异常区域,提高疾病的检测和诊断效率。
............................
2.3深度学习模型
2.3.1卷积神经网络
卷积神经网络(CNN)是一种最初用于图像分类任务的神经网络[3],其优点在于它能够自动从数据中提取出有用的特征,对于图像分类、目标检测和语义分割等任务具有很好的效果。它主要由卷积层(Convolutional Layer)、池化层(Pooling Layer)和全连接层(Fully Connected Layer)组成。下面对CNN的主要组成部分进行简要介绍。
(1)卷积层
卷积层是深度学习中的基本层级,通常用于处理图像、音频等数据类型。它是CNN的核心部分,主要作用是提取数据中的特征,通过对输入数据进行卷积运算来获得输出特征图。随着卷积层的层数增加,网络可以学习到更加复杂和抽象的图像特征。
(2)池化层
池化层(也称为下采样层)负责减小卷积特征的空间大小,通常跟在卷积层后面。池化层通过降维来减少输入中的参数数量,进而简化了卷积网络计算时的复杂度。池化操作可以视为卷积操作的一种简化形式,它可以有效地减少计算负担并提高模型的计算效率。常见的池化方式包括最大池化和平均池化等。其中,最大池化将局部区域内的最大值作为输出发送到输出矩阵,这种方式得到的特征数据对纹理信息更加敏感;在平均池化中,当卷积核在输入中移动时,它会计算感受野内的平均值以发送到输出矩阵,这种方式得到的特征数据对背景信息更加敏感。
然而,池化层的使用也有一定的缺点。由于池化操作丢失了一定的信息,因此在某些情况下可能会影响模型的准确性。此外,在一些场景下,池化操作可能会导致特征图的分辨率过低,使得模型难以学习到细节信息。因此,在一些最新的深度学习模型中,池化层已经被逐渐替换或减少使用[37]。
............................
3基于CTH-Net的视杯视盘联合分割算法..........................19
3.1引言........................................19
3.2 CTH-Net算法框架....................................20
4基于CSTH-Net的视杯视盘联合分割算法.......................31
4.1引言............................................31
4.2 CSTH-Net算法框架...................................31
5总结与展望..................................42
5.1总结...............................42
5.2展望....................................42
4基于CSTH-Net的视杯视盘联合分割算法
4.1引言
在第三章中,本文研究了CNN与Transformer结合的混合网络用于眼底图像视杯视盘分割,取得了较好的效果。虽然目前CNN和Transformer在提取图像特征方面都有着各自的优势,但也存在很多不足和挑战。其中Transformer应用到图像领域的主要挑战在于:Transformer基于全局自注意力的计算导致计算量较大(例如ViT ),往往需要减小输入图像分辨率的大小、增大下采样的步长,但是这样就造成图像分块阶段损失了图像细节信息。
为了解决这个问题,滑动窗口Transformer(Shifted Window Transformer,SwinTransformer)[36]相比之前的ViT 做了改进。相比于ViT ,Swin Transfomer计算复杂度大幅度降低,具有输入图像大小线性计算复杂度。整个Swin Transformer架构,和CNN架构非常相似。Swin Transformer随着深度加深,逐渐合并图像块来构建层次化Transformer,可以作为CV领域通用的Backbone,应用于图像分类、目标检测和语义分割等任务。
受文献[38]与文献[58]的启发,本章提出了一个基于CNN与Swin Transformer的混合网络(CNN-Swin Transformer Hybrid Network,CSTH-Net),用于眼底图像视杯视盘分割。CSTH-Net使用了双编码结构,即含有CNN与Swin Transformer两个分支编码器。其中,CNN分支通过卷积来捕获详细的局部特征信息;Swin Transformer分支主要采用自注意力的方式,并增加了滑动窗口的形式来获取全局特征信息。它们共同作用得到不同特征度的眼底图像的特征信息。最后,通过特征融合模块将图像的全局信息与局部信息有机地结合起来,可以在不损失图像细节的同时捕捉到图像的全局信息与局部信息。此外,CSTH-Net还使用了跳跃连接技术,将编码器多尺度特征与上采样特征进行融合,可以更好地捕捉图像的不同尺度信息,进一步提高了分割的准确度和效率。本章设计的算法比第三章取得了更好的分割性能。
.............................
5总结与展望
5.1总结
由于青光眼病程长、隐蔽性强,而且早期没有明显的症状,因此大多数患者在发病初期并不知道自己患有青光眼,错过了最佳治疗时机。目前,青光眼的诊断主要是通过眼压测量和视神经检查等方式进行,这些方法都需要专业医生进行操作,而且成本较高,难以实现大规模筛查。针对这一问题,本文以目前的研究工作为基础,探索了使用深度学习技术进行大规模筛查青光眼的方法。本文利用深度学习技术对眼底图像进行分析,可以自动检测和诊断青光眼,从而实现高效、低成本的筛查。本文方法可以应用于人群中的早期筛查和跟踪,对预防和治疗青光眼有重要意义。本文的具体工作如下:
(1)提出了一种基于CTH-Net的视杯视盘联合分割算法,该算法融合了CNN在捕捉局部特征方面的优点,以及Transformer在处理全局上下文和长距离依赖方面的优势。通过将两个模型架构进行高效混合,能够有效地同时利用局部信息和全局上下文信息,从而提高模型的精度和鲁棒性。此外,该混合模型还通过引入ASPP模块,能够有效地扩展感受野,提高模型对不同尺度的特征的提取能力。
(2)提出了一种基于CSTH-Net的视杯视盘联合分割算法,该算法使用了双编码结构,特征融合模块和跳跃连接技术。双编码结构能够更好地处理眼底图像分割中的长距离依赖性问题和不同尺度信息捕捉问题。特征融合模块可以在不损失图像细节的同时将图像的全局信息与局部信息融合,从而提高分割的准确度和效率。同时,跳跃连接通过将编码器多尺度特征与上采样特征进行融合,可以更好地捕捉图像的不同尺度信息。实验结果表明,CSTH-Net在各项性能指标上都优于其他先进模型,验证了该模型的有效性和实用性。
这两种算法都应用于青光眼的视杯视盘联合分割任务中,可以提高诊断的准确性和效率,为眼底图像分割领域的研究和应用提供新思路。未来的研究可以进一步探索如何将这些算法应用于实际临床场景中,并研究如何结合其他影像学方法进行多模态信息融合,进一步提高青光眼的早期诊断和治疗效果。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217