视网膜血管精准分割方法思考

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:35969 论文编号:sb2024050614195852353 日期:2024-05-21 来源:硕博论文网

本文是一篇计算机论文,本文基于以上背景,设计了三种不同的网络模型,并在公开的眼底视网膜数据集DRIVE和CHASE_DB1进行了大量的实验,实验证明了所提方法的有效性。
第1章 绪论
1.1 课题的背景与意义
随着社会的发展,人们的生活方式与以往发生了很大的不同,生活节奏的加快导致缺少运动、作息不规律、压力较大等现象越来越普遍,因此各类疾病的患病人数不断增加[1]。据世界卫生组织的数据显示,全球约有1.35亿人患有糖尿病,预计到2025年这一数字将增加至3亿人。糖尿病视网膜病变(Diabetic Retinopathy, DR)是糖尿病最常见的并发症之一,主要致病原因是糖尿病患者形成微血管瘤导致毛细血管闭塞,最终生成新血管进而引起视网膜脱离,DR也是当今社会处于工作年龄的成年人失明的主要原因[2],[3]。心血管类疾病带来的危害也不容小觑,有关数据统计,心血管类疾病致死人数占全球总死亡人数的三成以上,是人类因疾病死亡的最主要原因。在国内,由于大量使用烟草、膳食结构不合理、运动较少等原因,心血管类疾病的发病率和致死率高居榜首,每五例死亡中就有两例死于心血管病。据推算,2020年,国内心血管疾病患病人数将达到了3.3亿[4],[5],[6]。眼科疾病的发病率也高居不下,截止到2021年国内眼科患病人数累计超十亿,最主要的三种眼科疾病是白内障、视网膜脱落和断裂、青光眼[7],其中青光眼患者已接近2200万,而青光眼极有可能引发不可逆失明等病症。另外,据世卫组织统计,在2018年全球有将近3亿人的视力受到损害,而这些人中超过半数的病例都是可以预防的[7]。
眼底可以作为疾病筛查和诊断的重要依据,因为糖尿病、眼科病、心血管病等疾病与眼底视网膜血管的形态结构变化存在密切联系。正常的眼底视网膜图像如图1.1(a)所示,主要包括黄斑、视乳头、视网膜和视网膜中央动静脉等结构,而糖尿病患者的眼底会出现血管末端病变出血,眼底图像中会出现边界不清晰、形状不统一的暗红色区域[9]、高血压患者和冠心病患者会出现视网膜动脉硬化、青光眼患者视盘中的血管形态会产生一定的病变[10]等。因此视网膜血管作为全身血管中唯一可以无创观察的部分[11],医生可以在病人无需经历手术的情况下,通过对眼底视网膜图像中血管性状的变化进行病情诊断[12],[13]。
...............................
1.2 国内外研究现状
目前,有许多研究人员提出了使用计算机进行视网膜血管分割的算法,根据算法的类型可以分为非深度学习算法和深度学习算法[15]。以下对这两种类型的方法分别进行介绍:
1.2.1 基于非深度学习的视网膜血管分割算法
非深度学习的算法依赖人工选择特征,之后通过选择适合的分类器对眼底视网膜图像进行血管分割。1989年,Chaudhuri等人首次提出使用高斯滤波器分割眼底视网膜图像,该方法将血管的特征进行编码,使用二维高斯滤波器来匹配编码后的特征,从而解决类似于血管与背景对比度低的问题[16]。Azzopardi等人提出了一种选择性响应血管的B-COSFIRE(Blood-Combination of Shifted Filter Responses)滤波器来自动分割血管树,该方法通过计算高斯滤波器输出的加权平均值来实现定向选择,并通过简单的移位操作实现平移不变形。作者再模型中使用了两个B-COSFIRE滤波器,对称滤波器和非对称滤波器,通过对两个滤波器的响应结果相加,并设置阈值来分割血管[17]。在此基础上,Li等人提出了一种结合多尺度匹配滤波和双阈值的分割方法,该方法将三个尺度匹配滤波的响应相乘,由于血管结构在不同尺度下对匹配滤波具有较好的响应,因此使用多个尺度可以达到增强血管的目的,从而达到很好的分割效果[18]。
.................................
第2章 相关研究基础
2.1视网膜血管分割研究基础
2.1.1 数据集介绍
本文所采用的实验数据是眼底视网膜血管分割领域普遍使用的公开数据集DRIVE与CHASE_DB1,其标签分别是由医学专家通过眼底视网膜图像手工进行血管分割得到。但是专家分割血管的过程费时费力,因此目前应用于视网膜血管分割领域的数据集数量很少,而且每个数据集中的图像的质量也一般,这也增大了使用深度学习模型进行视网膜血管分割的难度。以下分别对两个眼底视网膜数据集进行介绍:
1) DRIVE
DRIVE(Digital Retinal Images for Vessel Extraction)是眼底视网血管分割领域最常用的数据集[37],DRIVE数据集的照片来自荷兰的糖尿病视网膜病变筛查项目。该项目一共筛查了400名糖尿病患者,患者的年龄在25岁到90岁之间,共拍摄了400幅图像,在其中随机选择了40张图像,每一张图像都进行了JPEG压缩,使得数据保持轻量化的同时保证重要部分不丢失细节。拍摄图像所使用的机器是佳能CR5非散瞳3CCD相机,每一幅图像的大小与格式相同,分辨率为584×565,格式为tif。
在DRIVE数据集中每幅眼底视网膜图像都有对应的标注图像和掩膜图像,其尺寸与眼底视网膜图像相同,格式都为gif。标注图像是由经验丰富的眼科医生指导分割的,并且每一个像素点的值都至少要70%的人同意确认,保证了所有血管都能够尽量分割正确。掩膜图像可以滤掉眼底视网膜图像中四周的黑色区域,以减少无关信息的干扰。数据集可分为两部分,分别用于训练和测试,每部分包含20张图像。训练集中眼底图像的序号为21-40,每张图片有一个对应的标注图像,标注图像文件夹命名为1st_manual。测试集中图片的编号为1-20,每张图片包含两张对应的标注图像,文件夹分别命名为1st_manual和2nd_manual。文中在DRIVE数据集上的所有实验在测试时使用的标注图像文件夹都1st_manual。该数据集中原始眼底图像、标注图像与掩码图像如图2.1所示。

计算机论文怎么写
计算机论文怎么写

..............................
2.2 经典卷积神经网络介绍
卷积神经网络(Convolutional Neural Network,CNN)是受生物学中感受野的启发而被提出来的,在CNN的内部结构中,由于其参数之间的共享性和层间连接的稀疏性保证了其消耗小、性能高的优势[39]。因此,CNN常被应用于图像分割、图像分类、语音识别等任务中,是深度学习中最具代表性的算法之一[40]。CNN主要由四部分结构组成,分别是卷积层(Convolutional Layer)、池化层(Pool Layer)、激活层(Activation Layer)和全连接层(Fully Connected Layer),下文将对这四部分结构详细介绍。
2.2.1 卷积层
卷积层的主要组成部分是卷积核(滤波器),其作用是通过卷积操作获取输入数据所包含的特征信息[41]。在计算机中,输入的图像是以矩阵的形式存在,卷积核也是以矩阵的形式存在。在进行卷积操作时,首先是将卷积核与图像的左上边角重叠,然后将重叠部分对应的矩阵数值相乘并将乘积相加,和为卷积核在该位置卷积的结果。之后将卷积核向右方以设置的步长移动,每移动一次就进行一次卷运算,当卷积核的右边缘与图像右边缘重叠时,卷积核回到最左边,向下一单位重复以上步骤,直至将整个矩阵完全计算完毕。在实际应用中,一般输入的图像是多通道的,如普通图像包含RGB三个通道,有些高光谱图像包含二百多个通道。为了能直观描述整个卷积的过程,图中使用一个通道的图像矩阵。
卷积层的目的是从输入特征图中提取特征,在卷积神经网络中,层数较浅的卷积用来提取边缘的低级特征,如位置信息、细节信息等,层数较深的卷积层在浅层卷积得到的特征图上进一步提取,从而得到较为复杂的语义信息。在不断的训练过程中,为了更有效地提取数据集的特征,卷积核的参数会随着训练不断调整并逐渐拟合数据。
................................
第3章 基于迁移学习的多尺度多网络融合的视网膜血管分割方法 ............................... 19
3.1 引言 .................................... 19
3.2 数据预处理 ................................... 19
第4章 基于双向跳跃连接和特征金字塔通道注意力的视网膜血管分割方法 ................ 33
4.1 引言 .................................... 33
4.2 算法设计 ...................... 34
第5章 引入坐标注意力和有效特征融合模块的嵌套U-Net视网膜血管分割方法 ........ 47
5.1 引言 .................................. 47
5.2 算法设计 ...................................... 47
第5章 引入坐标注意力和有效特征融合模块的嵌套U-Net视网膜血管分割方法
5.2 算法设计
5.2.1 嵌套U-Net结构
眼底视网膜图像中的血管呈现树形非结构化的特征,血管之间相互连接,彼此之间存在关联关系,如何获取这种关联的上下文信息关系着能否精确的分割血管。在ResNet、DensesNet、VGG等经典网络中,经常使用1×1或者3×3的卷积核获取上下文信息,优点是消耗低,效率高,缺点是在高分辨率特征图上感受野太小,只能获取局部上下文信息。如果想要在高分辨率图像中获取全局上下文信息,最直接的办法是使用空洞卷积扩大感受野,但是多次使用空洞卷积会消耗计算资源和存储资源。
为了解决以上问题,文中提出了残差U型结构(residual U-block,RSU)和残差膨胀注意力U型结构(Residual Dilation Attention U-block,RDAU)。RSU结构可以在计算资源消耗较小的情况下同时获取局部上文信息和全局上下文信息[61],RDAU结构使用了坐标注意力机制以对血管区域进行重点关注。RSU和RDAU的具体结构如图5.1(a)(b)所示,都由三个部分组成。
如图5.1所示,RSU和RDAU的第一部分结构都是由一层普通的3×3卷积构成,其主要目的是提取局部的上下文信息。通过卷积层改变了输入特征图的通道数目,但特征图的尺寸大小并未改变。RSU的第二部分结构是由与U-Net类似的对称编码器解码器结构,将第一部分结构输出的特征图整体输入输出,用以提取全局的上下文信息。文中使用了编码器解码器层数不同的残差注意力U型结构,层数越深,就代表可以接受越大尺寸的特征图,并且在下采样的过程中就可以提取更多尺度不同的上下文信息。而RDAU相比于RSU,使用膨胀卷积替代了普通卷积,并且减去了上采样和下采样操作,同时为了更好的对特征图中的血管区域投入更多的注意力,使得模型对血管区域实现更精细的分割,还使用了坐标注意力机制,下文会对坐标注意力详细介绍。RSU和RDAU的第三部分结构相同,都是通过相加的操作将第一部分获取的局部上下文信息和第二部分获取的全局上下文信息融合,整个过程如公式(5.1)所示:

计算机论文参考
计算机论文参考

.............................
第6章 总结与展望
6.1 总结
眼底视网膜血管的形态与结构对多种疾病的筛查、诊断具有重要作用,但由于医生经验不同、成像时光照不一、毛细血管与眼底背景的对比度较小等原因,人工进行视网膜血管分割难以满足要求,使用机器学习进行精确的眼底视网膜血管分割成为计算机视觉任务的重要课题。
本文以视网膜血管分割任务为研究目的,使用深度学习的方式进行视网膜血管分割任务。文中客观的描述了视网膜血管分割任务的背景与意义,总结了目前国内外视网膜血管研究现状,并概述了相关研究所需的理论基础。文中提出了三种方法应用于视网膜血管分割领域:
1) 提出了基于迁移学习的多尺度多网络融合的视网膜血管分割方法,该方法使用不同深度的卷积层提取不同层次的特征,使用了不同尺度的图像块获取不同粗细的血管特征,将得到的不同层次、不同粗细的血管特征进行融合,从而进行精准的视网膜血管分割,为了减少模型的训练时间,还利用了迁移学习的方法,使得模型仅仅迭代10个周期就达到了最好的分割效果。
2) 提出了基于双向跳跃连接和特征金字塔通道注意力的视网膜血管分割方法,该方法在普通U-Net的基础上,添加了反向跳跃连接,增强了高低级特征之间的交互。并在模型中增加了特征金字塔通道注意力模块,利用不同膨胀率的空洞卷积获得不同的感受野,从而提取不同尺度的血管特征,并且通道注意力可以对包含丰富特征的通道进行加权,从而提升血管像素点的分割精度。
3) 提出了一种引入坐标注意力机制和特征融合模块的嵌套U-Net视网膜血管分割方法,用以进行精准的视网膜血管分割。文中将RSU和RDAU进行两级嵌套形成U型网络,该网络能够有效的提取同层次特征图的局部和全局上下文信息,又能融合不同层次的局部和全局上下文信息。同时为了使得模型对血管区域投入更多的关注,还添加了坐标注意力机制,用以增强了对血管区域的特征表示。最后提出了一种特征融合模块,该模块将高低级特征分别处理,尽可能多的融合高低级特征包含的不同信息。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217