面向全监督和半监督的医学图像语义分割探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:42525 论文编号:sb2024041812030052231 日期:2024-05-06 来源:硕博论文网

本文是一篇软件工程论文,本文构建了一种残差多层级多尺度语义分割框架,该框架通过堆叠残差多尺度语义分割网络为整体框架提供脑肿瘤病灶区域的先验知识,并在其特征提取部分嵌入残差多尺度特征融合模块来捕获脑肿瘤核磁共振数据的上下文特征信息,辅助框架更准确的定位病灶区域,进而获得更好的分割结果。
第一章绪论
1.1课题背景与研究意义
医学图像对疾病的诊断、治疗和评估有重要意义,临床诊断人员根据医学图像所呈现的病灶区域可以对疾病进行定性和定量分析。随着医疗技术的进步,各种新型的医疗成像设备越来越受欢迎。临床广泛应用的医学成像类型主要为计算机断层扫描(CT)、磁共振成像(MRI)、正电子发射断层扫描(PET)、X射线和超声成像(UI)。此外,医学图像还包括一些常见的RGB图像,如显微镜检查和视网膜眼底图像。目前,量化医学图像中出现的病灶区域主要通过经验丰富的临床医生根据其专业知识从医学图像中手动分割病灶区域,然而这种方式不仅会耗费大量的人力,而且主要取决于医生的专业能力和经验,不同医生之间分割的病灶区域也存在较大差异[2]。因此,自动化医学图像处理的相关工作已成为计算机视觉领域关注的热点[1]。
随着计算机技术的不断发展,研究人员开始重视并使用计算机实现医学图像病灶区域的提取,以便为患者提供更精细的治疗方案[3]。因此,研究者们提出了许多医学图像语义分割方法,这些方法一般可以分为:传统机器学习方法和深度学习方法[4]。传统机器学习方法主要依靠经验丰富的领域专家手工设计特征提取器来实现图像语义分割任务[5],因此这类方法在特征提取阶段存在明显的人工偏好,当面对复杂的医学图像高分辨率,高对比度或多个成像序列时,通常分割准确性很低,并且很难推广到其他医学图像数据集上[6]。
近年来,随着深度学习的不断发展,各种基于深度学习的图像语义分割方法不断推陈出新,这类方法可以从海量图像中自动学习特征并通过复杂的函数映射完成目标的自动识别[7],已被广泛应用于图像识别领域。与传统机器学习相比,深度学习在任务精确度和运行速度方面具有一定的优势,可以准确地帮助临床诊断人员确认病灶区域,定量评估病灶区域在治疗前后的区别,大大减少了临床诊断人员的工作量。然而,在深度学习在医学图像语义分割领域中还存在3个挑战[8]:(1)病灶区域有极大的随机性,同时其边缘形态也是不规则的。(2)针对特定疾病和器官组织的图像样本数量有限。(3)医学图像在捕获过程中可能会因为采样伪影、空间混叠和噪声等因素而导致结构不清晰。
..............................
1.2国内外研究现状
1.2.1图像语义分割方法
图像分割是计算机视觉研究中的一个经典问题,已成为图像理解领域的研究热点,它根据图像灰度、颜色、空间纹理和几何形状等特征将其划分为若干区域,并使用不同的颜色标注不同区域,以此将每个区域的类别标注结果可视化。因此,同一区域的特征具有一定的相似性或一致性,但不同区域的特征之间会具有明显的差异性。
过去数十年间,图像语义分割任务的实现主要依赖于手工标注,然而手工标注费时费力,自动化程度低下,当面临大规模部署和实时性处理等场景时难以满足应用需求[3]。因此,研究者们提出了使用计算机辅助图像语义分割的智能方法,这些方法一般可以分为:传统机器学习方法和深度学习方法[4]。传统机器学习方法主要通过图像处理知识和数学知识来实现图像语义分割任务,例如,基于阈值的图像分割方法[137]、基于区域的图像分割方法[138]和基于边缘检测的图像分割方法[139]等。虽然这类传统机器学习方法计算简单,分割速度快,但是它们在细节上比较粗糙。此外,这类方法主要依靠经验丰富的领域专家手工设计特征提取器来实现图像特征的提取[5],存在明显的人工偏好,难以广泛应用于其他图像数据集[6]。与此同时,随着深度学习方法在计算机视觉领域取得的显著成功,研究人员也不断尝试将深度学习技术应用于图像语义分割任务中。
.................................
第二章基础理论和相关技术
2.1深度学习在图像语义分割中的应用
深度学习是机器学习和人工智能领域兴起的一种研究趋势,它使用深度神经网络来模拟人脑的学习过程,并从大规模数据(声音、文本、图像等)中自动提取特征信息。近年来,随着计算机软硬件的快速发展,许多研究者尝试将深度学习技术应用至图像领域。
2.1.1深度学习理论基础
卷积神经网络是由深度学习中的经典模型,它的出现使端到端的图像处理成为可能。2012年,Hinton等人[27]提出的深度卷积神经网络AlexNet在图像处理领域中取得非凡的成绩。自此,深度卷积神经网络被广泛应用于计算机视觉的各个领域中,包括图像特征的提取和分类、模式识别等。深度卷积神经网络的基本思想是共享前一层网络中不同位置特征映射的权值,并利用空间相对关系来减少参数的数量,以提高训练性能。深度卷积神经网络主要是由卷积操作、池化操作、激活函数、归一化操作等组成的。
(1)卷积操作[28]:卷积操作是深度卷积神经网络实现图像处理任务的关键,深度卷积神经网络依靠卷积操作可以实现高效地进行图像特征信息的提取。卷积操作通过对输入的图像特征进行滑动窗口式的卷积运算,得到相应的特征映射,达到深度卷积网络提取图像特征的目的。
(2)池化操作[29]:池化操作是深度卷积神经网络中常见的一种操作,它通过模仿人类的视觉系统来降低数据的特征维度,有效减少模型参数和计算成本,并降低过拟合现象。
(3)激活函数[30]:激活函数是卷积神经网络中不可或缺的部分。激活函数通过提供模拟复杂非线性数据集所必需的非线性特性,解决了一般般性模型的拟合能力不足的问题,同时也可以实现数据的约束或者转化。在深度卷积神经网络中,通常会引入非线性激活函数来处理实际的复杂问题,达到对非线性复杂数据的拟合的目的,提高模型的效果。
...................................................
2.2医学图像语义分割方法
随着深度学习技术在计算机视觉领域取得的显著成功,研究者们也不断尝试将基于深度学习的图像语义分割方法应用于各种医学图像领域,包括:三维脑肿瘤核磁共振图像、二维视网膜眼底图像、三维骨骼X射线图像等。

软件工程论文怎么写
软件工程论文怎么写

在中枢神经系统中,脑肿瘤占所有中枢神经系统肿瘤的40%—50%[30],其病灶区域的正确分析可为其诊断和患者生存周期提供有价值的信息。因此,科研人员尝试使用深度学习技术帮助医学工作者准确实现病灶区域分割。其中,Nyul等人[141]设计了一种新颖的脑肿瘤病灶区域的分割框架,该框架首先使用标准化归一化方法对脑肿瘤核磁共振数据进行预处理操作,并训练了两种卷积神经网络架构,一种用于低胶质脑肿瘤病灶区域分割,另一种用于高胶质脑肿瘤病灶区域分割。此外,提出了使用小的内核和更多的卷积层,这需要更少的权值来训练。此外,该框架还在训练过程中采用了正则化操作和数据增强方法来降低模型出现过拟合问题的概率,在BraTS2013和BraTS2013脑肿瘤核磁共振数据集的分割挑战赛中取得了不错的结果。Pereira等人[74]观察到可以通过增加特征压缩后特征图的通道数来实现对特征图的线性重组,从而增强语义分割模型对有用特征的鉴别能力。因此,Pereira等人[74]设计了一种用于图像特征重组和空间自适应的特征校准SegSE模块,该模块通过考虑通道特征和空间相关性来重新校准特征图。实验证明,SegSE模块可以有效实现脑结构核磁共振数据特征的重新校准,在脑肿瘤病灶区域语义分割、脑卒中半暗带估计及缺血性脑卒中损伤预后预测任务中取得了具有竞争力的结果。Havaei等人[25]设计了一种用于脑肿瘤病灶区域的双分支架构,该架构可以通过双分支架构对脑肿瘤病灶区域的局部特征和全局上下文信息进行学习,并采用两阶段训练步骤来解决脑肿瘤数据集上的不平衡分布问题。与大多数卷积神经网络不同,该架构使用全连接层作为卷积神经网络的最后一层,该设计加速了模型的运算。该架构在BraTS2013脑肿瘤核磁共振数据集上的运算速度相比于其他先进的结构加快了30倍。
...................................
第三章残差多层级多尺度语义分割框架.........................25
3.1脑肿瘤核磁共振数据语义分割问题描述..........................25
3.2残差多层级多尺度语义分割框架结构....................27
3.3残差多尺度特征融合模块...............................29
第四章基于协同交叉学习的半监督语义分割框架...................44
4.1基于协同交叉学习的半监督语义分割框架结构............................44
4.2全局特征提取分支..............................45
4.3局部特征提取分支........................47
第五章总结与展望........................................59
5.1研究内容总结......................................59
5.2后续工作展望................................60
第四章基于协同交叉学习的半监督语义分割框架
4.1基于协同交叉学习的半监督语义分割框架结构
为了实现准确的心脏核磁共振数据的半监督语义分割,第四章节提出了一种基于协同交叉学习的半监督语义分割框架。如图4-2所示,基于协同交叉学习的半监督语义分割框架由一个全局特征提取分支和一个局部特征提取分支构成。

软件工程论文参考
软件工程论文参考

..................................
第五章总结与展望
5.1研究内容总结
过去数十年间,医学图像语义分割任务的实现主要依赖于手工标注,然而手工标注费时费力,自动化程度低下[3]。随着深度学习技术在计算机视觉领域取得的显著成功,研究者们也不断尝试将深度学习应用于医学图像领域。本文调研了用于医学图像的语义分割方法,并根据脑肿瘤核磁共振数据及心脏核磁共振数据的特有属性改进了深度学习模型。
脑肿瘤是大脑中异常细胞的癌变或非癌性生长,占所有中枢神经系统肿瘤的40%—50%[30]。然而,由于多模态脑肿瘤核磁共振数据的低对比度,边界不明确,结构不均匀,噪声等问题,从多模态脑部核磁共振数据自动化提取病灶区域是医学图像研究中最具挑战性的任务之一。具体来说,从多模态脑部核磁共振数据自动化提取病灶区域的困难为:(1)脑肿瘤病发区域的随机性及多样性[76]。脑肿瘤可能以不同形状、大小的形式出现在脑部的任意区域。由简单的深度卷积神经网络很难准确定位脑肿瘤的病发区域,从而导致脑肿瘤的语义分割结果的精确度较低。(2)脑肿瘤病发区域边界的不规则性[77]。恶性肿瘤病灶区域的形状则是不规则的,呈浸润性地生长,表面凹凸不平,与周围其他组织的边界极不清楚。
心血管疾病是导致人类死亡的最主要突发疾病。然而,心脏核磁共振数据受血液流动等影响会导致心脏核磁共振数据出现伪影,很难精确提取心脏的特定组织。总体而言,从心脏核磁共振数据自动化分割病灶区域的问题有:(1)心脏核磁共振数据由于受心脏舒张、收缩以及血液流动等影响,会导致心脏核磁共振数据出现弱边界、伪影及局部梯度极大值区域等现象。同时,人们感兴趣的目标组织如心室、心房等区域灰度相似且相互连通,很难精确提取特定组织[41]。(1)心脏核磁共振数据由于受心脏舒张、收缩以及血液流动等影响,会导致心脏核磁共振数据出现弱边界、伪影及局部梯度极大值区域等现象。同时,人们感兴趣的目标组织如心室、心房等区域灰度相似且相互连通,很难精确提取特定组织[41]。(2)由于心脏结构中细小组织的形状大小多变的特性,现有方法往往会产生一些不符合目标组织相对位置特性的异常点[79]。(3)大量高质量有标注的心脏核磁共振数据的稀缺极大地限制了基于数据驱动的深度卷积神经网络的应用[23]。受上述问题启发,本文提出了一种残差多层级多尺度语义分割框架和基于协同交叉学习的半监督语义分割框架。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217