基于图的半监督学习与排序模型的视觉显著目标计算机检测分析

论文价格:免费 论文用途:其他 编辑:硕博论文网 点击次数:
论文字数:52145 论文编号:sb2020012622024729291 日期:2020-02-10 来源:硕博论文网
本文是一篇计算机论文,本文主要研究内容有:基于全局和局部一致性排序模型的显著目标检测、基于先验正则化图排序的显著目标检测方法和基于先验正则化多层图排序的显著目标检测方法、基于多尺度协同正则化排序的显著目标检测方法和基于图的多视角半监督学习的显著目标检测方法。

第一章绪论

1.1视觉显著目标检测的研究背景和意义
近些年,伴随着人类的发展、科技的进步,网络世界和人们实际生活中的数据量成爆发式的增长,这些海量数据包含了大量的图片、视频、语音和文本信息等,这些数据的大小、形态、质量各不相同,计算资源有限,如何从这些海量数据中提取有用的信息并进行有效的应用给人们带来了巨大的挑战。
首先,人们研究人类视觉系统是如何理解世界的呢?大量的生物学、认知心理学、神经科学的研究者们对人类感知过程和大脑对信息的处理进行深入的研究得出:人类视觉系统只关注特定的、感兴趣的区域并对该区域进行详细的处理,对其它部分视而不见,这称为人类视觉注意机制。这是人类在复杂世界中能够高效感知的重要机制之一,这个特定的、感兴趣的区域被称为注意区域。受到人类和灵长类生物视觉注意机制的启发,研究者们为使得计算机具有类似的视觉感知能力和视觉注意机制,把使用计算机模拟人类视觉系统选择引起视觉注意的注意区域的过程定义为视觉显著性检测。视觉显著性检测又可以粗略的分为人眼关注点检测和显著目标检测两大类别:人眼关注点检测主要是跟踪人眼的关注点的变化;显著目标检测主要是为了准确地检测出突出的目标在什么位置,这可为许多后续更高级的视觉任务提供帮助。本文关注显著目标检测研究,这已经成为计算机视觉研究领域的一个重要分支,这为解决这类视觉问题提供了有效的途径。
........................

1.2半监督学习方法
随着信息技术的发展,数据大量存在,如果对数据进行大规模的标记,耗时耗力。传统的机器学习技术一般只用有标记的样本进行有监督的学习或者利用无标记的样本进行无监督的学习,而在实际情况下,很多数据是有标记样本和无标记的样本并存,为了更好的利用这些数据,半监督学习技术应运而生。利用少量的标记数据,利用大量的未标记数据的自身特性,辅助提高学习的预测性能,这是半监督学习的核心内容。半监督学习除利用一部分有标签的数据信息外,还需要充分利用无标签数据自身可能存在的特性,发挥无标签数据对学习模型的促进作用,如何利用这大量的未标记样本来提高学习性能是半监督学习的重点关注问题之一。自我学习可以看作是半监督学习的雏形,早在19世纪60年代开始就提出自我学习的训练,将初始分类器用于无标签样本,再把预测的样本加入继续训练,不断迭代,充分利用了无标签样本的信息。
图1.1输入图像及其显著目标
........................

第二章视觉显著目标检测的研究现状

2.1引言
在视觉显著目标检测研究中,首先介绍视觉注意,视觉注意是人类视觉系统识别场景相关部分的一种重要机制。人类视觉系统在面对复杂的自然场景时,具有能够快速定位并选择感兴趣目标的能力,这就是人类的视觉注意机制。在对自然界的视觉信息处理中,大脑和视觉系统协同工作以识别相关区域或目标,这些区域即是图像中的显著目标。显著目标检测研究是利用计算机模拟人类视觉系统,定位到“感兴趣”区域或自动裁剪图像中的“重要”区域。显著目标检测研究可用作多个研究方向的预处理过程,如目标识别算法可以利用显著性检测的结果,定位目标的位置;图像检索中可以利用显著目标检测结果减少杂乱背景的影响等。
图像显著目标检测是指利用计算机模拟人类视觉系统,检测出图像中显著的区域或目标。它起源于神经生物学和认知心理学等交叉学科的发展,后在计算机视觉研究领域得到了深入的发展。1985年Koch等人提出一个神经生物学模型,该论文中提到选择性视觉注意力的转移问题,这奠定了显著目标检测研究的理论基础。Itti等人在1998年提出了第一个应用到真实场景的图像视觉显著目标检测模型称为Itti模型。随着Itti模型的建立,作为计算机视觉的研究热点,视觉显著目标检测研宄得到越来越多的学者进行研究。
..........................

2.2显著目标检测方法的分类
近些年来,一些高性能的显著目标检测方法相继被提出来。大致可以分为基于频域的计算方法,基于对比度的计算方法,基于稀疏理论的方法,基于图模型的方法和基于深度学习的方法,下面对各个分类的方法进行简单的介绍。
2.2.1基于频域的计算方法
基于频域的计算方法,2007年侯晓迪提出的频域残差法来计算显著图,该文重点关注图像中不显著的部分,认为图片中的显著性区域和其它的部分有着不同的特征分布,.因此想办法突出显著部分,抑制不显著的部分。文章通过分析周期信号的频谱图,证明了图像中的不显著部分对应幅度谱中的尖峰所对应的图像中的重复部分,并且频谱图中循环部分越多,幅度谱的尖峰值越大,用低通滤波器平滑幅度谱发现,原始图像的幅度谱峰值越大,平滑后峰值降低的越多。最后,使用光谱滤波抑制重复部分,在频域中,使用幅度谱与高斯核函数卷积,等价于图像显著性检测器。在此基础上,复旦大学Guo等人也提出相位谱方法等。
表2.2预测的样本和实际的样本之间的关系表
..........................

第三章基于全局和局部一致性排序模型的显著目标检测...................14
3.1引言...................14
3.2相关工作..................14
第四章基则化图排序的显著目标检测......................29
4.1引言......................29
4.2相关工作.......................30
第五章基于多同正则化排序的显著目标检测.................51
5.1引言................51
5.2多尺度协同正则化排序模型.................51

第六章基于图的多视角半监督学习的显著标检测

6.1引言
同一个研究对象获得多个不同的视角进行描述,这多个描述就是该研究对象的多个视角,称为多视角数据。与单一视角数据相比,多视角能够更全面系统的获取数据本质信息。多视角学习被广泛提出用来深入了解和分析多视角数据。在视觉显著目标检测研究中,同一张图像可以分别使用颜色、纹理、形状等多种不同的特征来描述,从而获得多视角特征数据。为捕获不同视觉特征信息以获得更准确的显著物体,本章提出一种基于多视角半监督学习的显著性优化方法。首先对现有的基于图的显著性方法进行总结归类,提出一个通用的基于图的显著性优化框架。然后,将单一图模型扩展到多视角情况,提出了基于图的多视角半监督学习的显著目标检测方法。最后,给出了一般模型的一个具体实现,并推导出求解该模型的有效更新算法。在多个基准数据集上的实验结果表明了该模型的有效性。
..............................

第七章总结与展望

7.1文总结
随着科学技术的发展,利用计算机模拟人类的视觉处理机制,即计算机视觉研究技术越来越成熟。人眼能够快速获取场景中显著目标,过滤掉多余信息,使得人们能够更集中注意力去观察和处理有效信息。经过几十年的发展,视觉显著目标检测日趋成熟,基于图的半监督学习方法作为有效的机器学习方法,该类方法不需要经过大类的训练,通过少量有标签节点,充分利用图中无标签节点自身特性,帮助学习从而优化结果。本文提出全局和局部一致性排序的显著目标检测模型、基于先验正则化图排序的显著目标检测方法和先验正则化多层图排序的显著目标检测方法、多尺度协同正则化排序的显著目标检测模型和基于多视角半监督学习的显著目标检测模型等。
本文的主要研究内容和创新点如下:
1.本文对传统的基于随机游走理论的显著性区域检测方法进行研究,提出一种基于全局和局部一致性排序模型,并将之应用于显著目标检测。首先建立马尔科夫链上的随机游走模型,计算转移节点到吸收节点的吸收时间,捕获全局信息,利用流形模型获得局部信息,将此两种信息应用于全局与局部一致性排序模型,分别使用背景信息、前景信息作为查询节点分两步获得最终的显著性值。实验结果表明,该方法可以有效获得图像的结构信息,获得更准确的显著图,提高了显著性检测的精确度和准确度。
2.通过对传统的基于流形排序的显著目标检测方法进行研究并充分利用先验信息,提出一种基于先验正则化图排序的显著目标检测方法和基于先验正则化多层图排序的显著目标检测方法。图像显著目标检测的任务是获得图像每个像素点的显著值,因此,可以将显著目标检测问题看作是一个图上的节点的排序问题来进行优化求解。在很多基于排序的显著目标检测方法中,将图像每个像素点的显著值归一化到[0,1]区间的某个值,越大越显著,越小越不显著。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217