本文是一篇计算机论文,本文提出了联合三边滤波模块及其变体,其本体用于融合纹理特征和深度特征,使融合过程具有内容自适应性,且通过学习得到的滤波核在空间上具有特殊性。联合三边滤波模块的变体用于融合跨尺度的深度特征,实现低分辨域和高分辨域之间的双向指导,减少尺度间误差累积。
1 绪论
1.1 研究背景与意义
随着计算机视觉技术的飞速发展,虚拟现实、无人驾驶和即时定位系统等高级视觉任务逐渐被应用于人们的生活中,此类任务需要计算机对感知空间进行三维结构重建。不同于传统的纹理图像(如彩色图像和灰度图像),深度图像记录了拍摄设备与目标物体之间的距离,是一种反映场景内几何关系的图像。相应地,由纹理图像和相应的深度图像组成的数据对被称为RGB-D数据,其被广泛应用于计算机视觉任务中。随着成像技术的发展,使用手机就可以轻易获得高质量的纹理图像。然而,作为现代多媒体中的关键成分,深度图像的获取仍然较困难,目前获取深度图像的方法有两种:
一是基于立体匹配技术,其原理是匹配像素级的视差,并结合相机参数转化为深度信息。近几年,深度卷积神经网络让该领域算法[12,44,64]的性能得到显著提升,但立体匹配无法完全解决低纹理和遮挡区域在匹配过程中所产生的歧义问题。
二是使用传感器直接获取深度图像。目前,主流的深度传感器类型是ToF传感器,它向外发射红外脉冲波,并接收被物体反射回的脉冲波。根据发射阶段和反射阶段之间的红外相位差来计算像素级深度值。虽然这种方法避免了立体匹配算法的高匹配难度和高计算复杂度问题,但受限于传感器的成本,其获取的深度图像分辨率较低且易受到噪声污染。因此,深度图像增强处理需求极为迫切,以满足高级视觉应用的要求,即对深度图像做超分辨率重建和去噪。
..........................
1.2 国内外研究现状
对于一个低分辨率深度图像,有无穷多个高分辨率深度图像可以通过下采样的方式与之对应。因此,深度图像增强任务是一种病态逆问题,需要在模型中显式或隐式地引入先验来重构高分辨率深度图像。
基于学习的深度图像增强算法是单彩色图像增强算法的扩展领域,它通过训练数据学习了从低分辨率深度图像到高分辨率深度图像的映射,该领域代表性工作如下。Li等人[31]提出了一种拼接算法将深度图像增强建模为马尔可夫随机场(Markov Random Field,MRF)标记问题。Xie等人[62]在低分辨域中通过马尔可夫随机场优化得到高分辨率的深度边缘,并引入由该边缘指导的双边滤波器。Ferstl等人[10]通过稀疏编码学习先验,并在马尔科夫随机场中作为高阶正则化的各向异性指导信息来指导深度锐化边缘的重建。随着深度卷积神经网络(Deep convolutional neural network,DCNN)的发展,Dong等人[6]首先构造了三层卷积神经网络来进行单纹理图像增强。Huang等人[21]在此基础上提出了由密集残差模块构造的金字塔结构模型。Song等人[50]将多尺度特征融合策略融入深度监督网络,深度图像增强被划分为多个视图合成子任务。Song等人[51]提出了一种渐进式残差学习模型,其中包含加权注意力融合模块和多阶段融合模块。然而,当上采样尺度较大时(如放大尺度为16倍),单深度图像增强模型会导致微小的细节和结构发生扭曲或消失。
随着上采样系数的增长,增加跨域的高分辨率先验指导(如纹理图像)的深度图像增强算法比单深度图像增强算法获得了更好的性能。本文主要研究先验指导的深度图像增强,目前该领域提出的方法可以分为三类,分别是基于局部像素域的方法、基于全局像素域的方法和基于学习的方法。
..........................
2 相关理论与技术简介
2.1 联合滤波器相关模型
在早期的研究中,联合滤波器及其变体,例如联合双边滤波器和联合三边滤波器,提供了随像素位置变化而变化的滤波核。基于以上传统非线性滤波模型,本文将此概念引入卷积神经网络,可以自适应地学习纹理指导信息,重建高质量的深度图像边界。
2.1.1 联合双边滤波器
传统的滤波器,如均值滤波器、中值滤波器和高斯滤波器等,在去除图像噪声的同时,损失了大量的细节信息,造成图像过度模糊。
机器学习是一门研究如何使计算机模拟或实现人类学习行为来解决问题的学科,深度学习是机器学习研究中的新兴领域,它代表在多层神经网络上利用机器学习算法解决图像、文本信息的算法集合。深度学习的核心是分级式特征学习,通过分层网络获取分层次、非互斥的特征解决实际问题。
早期人工神经网络由多个被称为Logistic回归模型的神经元组成,将这些单元组合起来并分层,形成一个神经网络模型。卷积神经网络继承了这种分层结构,通过增加隐含层来构建更深的网络。其作为一个特征提取器,通常由卷积层、池化层和全连接层等基础层构成。卷积神经网络的第一层称为输入层,中间各层称为隐含层,最后一层称为输出层。
..............................
2.2 基于深度学习深度图像增强方法
三大基础层之一为卷积层,由一个小矩阵构成卷积核,又称滤波器,在每个图像矩阵上按步长扫描,图2.1所示为卷积计算过程。图中黄色区域表示滑动的卷积核,每次滑动到一个位置,将两个矩阵对应的位置相乘并相加,得到特征矩阵的一个元素,即做矩阵的内积运算。由于卷积操作会导致结果图像比原图像小,不利于下一步的计算,需要每次卷积前在原图像矩阵外补一层零,称为Padding操作。该操作可以横向、纵向以及四周补零,其尺寸由卷积核的大小、移动步长和原图像大小决定。Padding可以使卷积操作覆盖整个图像矩阵,从而保持输入图像与输出图像尺寸的一致性。
三大基础层之二为池化层,它可以扩大卷积神经网络的感受野,实现降维操作,在网络面临巨大计算量时,池化层的引入可以解决学习过程漫长和过拟合的问题。根据池化的计算方法不同,池化操作分为最大池化和平均池化。如图2.2所示,平均池化的卷积核中每个权重值均为0.25,滑动步长为2,经过一次卷积,图像变为原来的1/4。最大池化中的卷积核仅有一个权重值为1,其余各权重均为0,即选择卷积核对应区域中的最大值作为池化结果,滑动步长为2,输出图像为原图像的1/4。
计算机论文怎么写
.................................
3 纹理特征和梯度特征交替指导的深度图像增强模型 ................................ 14
3.1 引言 ................................... 14
3.2 纹理特征和梯度特征交替指导的深度图像增强网络框架 ......................... 14
4 基于神经网络化联合三边滤波器的深度图像增强模型 ............................ 33
4.1 引言 ..................................... 33
4.2 基于神经网络化联合三边滤波器的深度图像增强网络框架 ..................... 34
5 总结与展望 ........................................ 55
5.1 工作总结 ........................................ 55
5.2 未来展望 ...................... 55
4 基于神经网络化联合三边滤波器的深度图像增强模型
4.1 引言
在实际应用中,迫切需要对低分辨率原始深度图像进行八倍及八倍以上倍率的上采样。单深度图像增强方法在上采样系数较大的情况下,其重建结果的细节和局部结构容易发生扭曲或丢失。为提高性能,研究人员提出从高分辨率纹理图像中提取信息,以指导深度图像增强重建任务。以此为前提,本文提出使用纹理图像的多尺度特征作为模型的指导域。在早期的研究中,联合双边滤波器及其变体,例如联合三边滤波器,基于纹理图像边界和对应的深度图像边界具有一致性的假设,利用指数函数计算各邻域像素的滤波核权重。该滤波核的核权重随像素位置的变化而变化,自适应地融合了纹理指导信息,重建了高质量深度图像边界。虽然这些非线性滤波器具有坚实的理论基础,但手工设计的浅层模型仍无法描述低分辨率深度图像和高分辨率纹理图像之间复杂的映射关系。
计算机论文参考
近年来,由于模型表达能力增强,深度卷积神经网络在彩色图像增强[4,57,72]和纹理图像指导的深度图像增强[22,61,73]等方面取得了显著进展。在最新的卷积神经网络方法中,常用通道合并来实现特征重用。考虑到传统联合三边滤波器,本文认为对特征进行简单的通道合并并不能自适应地调整指导特征对图像所有位置的影响,且这类模型在测试阶段,卷积核的参数是与输入内容无关的。为了缓解这个问题,一些模型采用注意力机制重新调整特征,例如通道注意力机制[53,71]和空间注意力机制[25,41]。然而,自适应地融合指导信息不能通过简单的调整目标域特征来解决,还需要考虑到指导域特征。除此以外,对于8或16等上采样系数较大的模型,从低分辨域到高分辨域的前向学习,会出现随着尺度增加误差逐渐积累的问题。
.........................
5 总结与展望
5.1 工作总结
在实际应用中,深度图像的大尺度重建需求容易导致细节丢失和结构扭曲。相较于黑盒模型训练方式,本文围绕显式引入先验的主题,提出了嵌入纹理图像梯度域的指导和自适应跨域特征融合策略的模型,其显著提升了算法的鲁棒性和可解释性。具体的工作总结如下:
(1)利用纹理图像与深度图像之间边缘相关性,提出纹理特征和梯度特征交替指导的深度图像增强模型。模型包含三个分支,分别学习纹理域、梯度域和深度域的特征,整体采用渐进式重建模式,每个阶段对深度图像进行2倍上采样。每一个上采样阶段内部,首先由纹理特征对梯度特征和深度特征进行指导监督,再由梯度特征和深度特征相互指导,进一步地优化深度特征。在无噪声数据和有噪声数据上进行实验,从主观和客观层面证明本文提出的模型能够保留更多的结构信息,验证了纹理特征和梯度特征中的先验很好地指导了深度图像重建。
(2)考虑到纹理图像先验对深度图像重建的指导意义,模拟传统联合三边滤波器,提出基于神经网络化联合三边滤波器的深度图像增强模型。模型包含两个分支,分别处理纹理特征和深度特征。本文还提出了联合三边滤波模块及其变体,其本体用于融合纹理特征和深度特征,使融合过程具有内容自适应性,且通过学习得到的滤波核在空间上具有特殊性。联合三边滤波模块的变体用于融合跨尺度的深度特征,实现低分辨域和高分辨域之间的双向指导,减少尺度间误差累积。此外,为了提高模型效率,设计了子网络来表示核生成函数。通过在合成数据集和真实数据集上的实验证明,本文提出的方法在模型复杂度较低的情况下,仍然达到了最优性能,且在视觉效果上也保留了更多的细节信息。
参考文献(略)