基于集成学习和深度学习的应用研究

论文价格:免费 论文用途:其他 编辑:chenhuixia 点击次数:148
论文字数:52120 论文编号:sb2015010913290311687 日期:2015-01-09 来源:硕博论文网

第一章绪论

为了更好的研究脑部的记忆和识别机制,脑科学家们需要在三维空间实现神经系统的重建,而其基础是二维空间上神经细胞的分割效果。因此,精确、可靠地实现二维空间的分割,尤其是细胞膜的分割,是影响三维空间重建的关键因素之一。另外,神经细胞的分割同时也具有重要的临床医学价值,比如研究发现,视网膜的衰退,起因便是神经细胞中的感官细胞的减少。目前,拥有较高分辨率且能提供大量显微图像的电子显微镜是脑科学家们研究神经细胞的主要工具。显微图像数量较大,如果采用人工分割方式,不仅枯燥、繁琐,且需要大量的时间、精力。所以,借助现代信息技术手段,利用图像处理、机器学习等方法,实现神经细胞的自动化分割,是必然的选择。但是,不仅神经细胞中存在细胞核、线粒体和各种囊泡等形状大小各不相同的组织,而且神经细胞相互之间具有错综复杂的拓扑结构。此外,EM成像也存在边界丢失、模糊等质量问题。这些因素的存在,使得神经细胞的自动化分割是一项充满挑战性的任务。
.........

第二章集成学习和深度学习简介

2.1集成学习和随机森林
如何进行集成学习?集成学习有效的两个前提:首先是弱分类器的准确率大于随机猜测,否则的话集成后的误差反而会增加;然后是弱分类器之间性能差异大,否则集成效果不理想。根据基本分类器之间的种类关系,集成学习可以分为两种,异态集成学习是指弱分类器本身便不相同。不同基本分类器的形成通常由以下五种方法来获得基本分类器的种类不同,即其本身的构成算法不同。对训练数据进行处理,交叉验证等。对输入特征进行处理,挑选出不同的输入特征子集用于训练出不同的分类器。对输出结果进行处理,比如纠错码方法。引入随机扰动。基分类器的整合常用方法有简单投票、贝叶斯投票、基于不同特征子集的整合以及基于D-S证据理论的整合。

2.2深度学习和卷积神经网络
深度学习对比传统的浅层学习区别主要是:浅层学习更多的是关注模型的分类或者预测,模型学习中使用的特征是根据先验知识人工设计预定义好的;而深度学习强调模型能够直接对原始数据进行特征学习,深度学习通过多层最少五层隐含层节点能够学习出更好的特征,可以提高分类或预测的准确率。浅层学习算法在样本有限和计算单元有限的情况下,对于复杂函数的表示能力也是有限的,这样对于复杂分类问题,就会制约其泛化能力;而深度学习通过非线性网络结构的学习能够实现复杂函数逼近,在少量样本的情况下,依然能够学习出数据集的本质特征。深度学习具有广阔的应用场景,目前已被成功用于图像识别,语音识别,自然语言处理以及搜索广告CTR预估等。

第三章基于层次级特征和随机森林的细胞图像分割......15
3.1问题分析........15
3.2方法流程......16
3.3预处理........17
第四章基于深度学习和集成学习的层次级视网膜图像分割...........29
4.1问题分析......29
4.2方法流程........30
第五章总结与展望.........43

第四章基于深度学习和集成学习的层次级视网膜图像分割
 

4.1问题分析
基于监督学习分割视网膜图像的相关方法通常由两部分组成:特征提取和分类。在特征提取阶段,根据特征提取方式的不同通常又可划分为两种:基于手工设计的和基于特征学习的。基于手工设计进行特征提取的相关方法,在分类之前,必须认真仔细的对特征进行预定义。这样将使得特征提取过程耗时,而且需要专家针对特定图像有一定的先验知识,才能有针对性的设计出具有区别力的特征。而且,不容忽视的是手工设计的特征针对性较强,对于具有不同特性的数据库可能涉及到特征重定义的问题。一种很自然的思路是使用相关机器学习方法进行特征的自行学习,这就是基于特征学习相关方法的思路。相较而言,基于特征学习的方法能够直接从原始图像进行特征提取,其中的经典算法卷积神经网络可被视为基于监督学习的一种优秀的特征提取器其能够提取出复杂的具有尺度和旋转不变性的特征,而且所提取的特征具有一定的普适性。

4.2方法流程
图4-1给出了本文所提方法的整体流程图,如图中所示该方法主要有三部分组成:图像预处理,层次级特征提取集成分类。其中图像预处理阶段包括:图像增强和基于超像素的样本点选择。设计卷积神经网络结构时,输入的大小和层次的多少都要考虑,有两方面的折中。首先,当输入空间的维度增加时,数据就变得比较稀疏,使得人工神经网络准确学习出决策边界就比较困难。因此卷积神经网络的输入窗要尽可能的小以降低训练复杂度,同时输入窗又要尽可能的大,包含足够信息来描述数据。鉴于视网膜图像中血管的平均宽度以及病灶区的平均区域大小。
..........

第五章总结与展望

基于机器学习的模式识别系统通常由两部分构成:特征提取和分类。针对特征提取,本文既尝试了手工设计新的特征,又研究了学习来的特征的优势。由于一般情况下,集成分类器优于单个的基分类器,本文选择集成分类器作为模式识别器。总之,本文主要研究集成学习和深度学习及其应用研究,并针对细胞膜的分割和视网膜的分割分别提出了对应的解决方法,现将主要研究工作总结如下:
1) 提出一种基于层次级特征和随机森林的细胞膜分割方法。鉴于细胞显微图像的局部聚族性,首先定义和提取了层次级特征HLFs层次级特征可被视为一种更合理、更自然的特征表示方法。
2) 提出了一种基于卷积神经网络和随机森林的层次级视网膜图像分割方法。由于CNN能够自行从原始图像学习到具有普适性的特征,传统分类器又具有优越的分类性能。这就很自然的想到整合CNN和RF两种分类器的优势,使得整个模式识别系统的流程都是全自动的和可训练的.
..........

参考文献(略)


QQ 1429724474 电话 18964107217