基于生成对抗网络的图像超分辨率重建

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:35633 论文编号:sb2023122116253951617 日期:2023-12-27 来源:硕博论文网

本文是一篇计算机论文,本文在对生成对抗网络和注意力机制的超分辨率重建算法的研究基础上,提出了基于混合注意力和生成对抗网络的超分辨率重建算法HA-ESRGAN,并通过具体实验、部署、应用与测试验证了该算法的良好性能,其超分重建所得图像的整体质量有所提升,但仍然存在一定的改进空间。
1. 绪论
1.1. 选题背景
图像是人们在日常生活中的获取信息的重要媒介之一,由于图像具有直观,形象,美感等特点,人们可以通过图像记录细节,保存并传达信息。随着手机、数码相机等硬件设备的发展,图像的清晰度也越来越高,色彩、纹理等细节也更加丰富,人们能从中获取的信息也越来越多。而评判图像质量的重要标准之一正是图像的分辨率,图像的分辨率是指图像单位英寸中实际包含的像素点个数,一般情况下高分辨率图像具有更高的像素密度、更精细的纹理和更好的视觉效果。受硬件和技术的限制,人们获取的图像在大多数情况下很难达到预期的分辨率,一方面是因为硬件条件不足导致生成的图像清晰度过低;另一方面是因为在成像过程中会受到多方面因素的影响,例如光学模糊,运动模糊和环境干扰等,这些因素都会降低图像的质量。且人们很难在现有硬件层面直接对低分辨率的图像进行复原,例如修复老旧设备所拍摄的照片,修复网络传输中因压缩数据而产生的低清晰度图像等。为了解决上述问题,图像的超分辨率重建技术应运而生。
首先,作者所在课题组中的个性化陶瓷定制平台需要处理大量用户上传图像以进行瓷器的个性化定制,经常会遇到用户上传的图像分辨率过低的情况,清晰度较低的图像刻印到瓷器上会严重影响用户的实际体验,因此需要利用图像超分辨率重建技术对清晰度过低的图像进行图像复原,提升图像的质量以满足客户的实际需求。其次,随着互联网技术的发展,人们接触的网络平台越来越多,许多网络平台以图像为媒介进行信息传递,例如电商平台,视频平台,聊天平台等,比较典型的有淘宝,抖音和微信。互联网厂商为了降低网络带宽,会对图像先进行压缩处理再进行传输,导致用户接收到的图像质量有所下降,出现模糊和失真等现象,因而用户无法从图像中获得有价值的信息。针对以上这些生活和工作中遇到的问题,作者认为图像的超分辨率重建是一个值得深入研究的课题,它可以帮助我们提升生活和工作中遇到的图像的清晰度,同时在医疗诊断、生物特征识别、遥感应用、多媒体等领域也有着广泛的应用。
..............................
1.2. 国内外研究现状
Toraldo [6]于20世纪60年代首先提出了超分辨率重建的概念,随着技术的更迭,许多研究人员对超分辨率重建算法的原理和方法进行了深入研究,在理论研究意义和实际应用价值两方面均取得了重大进展。按照图像的域空间和重建算法原理的不同,可以将图像超分辨率重建算法划分为频域法和空域法,而空域法又可以划分为基于插值的算法、基于重建的算法和基于学习的算法,算法分类结果如图1-1所示: 

计算机论文怎么写
计算机论文怎么写

频域法[7-10]在超分辨率重建领域初始阶段的应用较为广泛,其主要原理是对多张图像在频域空间的信息进行建模和求解,以增强图像的高频细节,进而提升图像的分辨率。频域法的原理易于推导,且算法的时间复杂度较低,但由于无法充分利用图像的先验信息,导致其反向求解过程中的适用性和准确性较差,因此只能应用在退化过程较为简单的超分辨率重建场景中。为了克服频域法的缺陷,人们更加侧重于对空域法的研究和应用。
............................
2. 相关理论知识
2.2. 常见超分辨率重建算法介绍
2.2.1. 基于插值的超分辨率重建算法
基于插值的方法是图像处理领域中较为常见的图像缩放算法,该方法的基本原理为假设图像像素值变化是连续的,根据原始图像中部分区域的像素值,通过不同的插值算法来拟合目标图像中指定位置的像素值。相比于基于学习的超分辨率重建算法,基于插值的方法的算法原理和实现方式较为简单,但由于没有引入额外信息,导致重建所得图像的边缘较为模糊、纹理细节不够丰富。常见的基于插值的方法有最近邻插值、双线性插值和双三次插值算法。
(1) 最近邻插值
最近邻插值法是将目标图像的像素点映射到原始图像中,在原始图像中寻找距离目标位置最近的整数像素点,再将该点的像素值作为最终输出,如图2-2所示。

计算机论文参考
计算机论文参考

图2-2中P(x,y)为目标图像中的待求像素点,1Q、2Q、3Q和4Q是与P点相邻的四个整数像素点,若满足2 1y −y y−y和1 2x −x x −x两个条件,可知1Q离P最近,则P和1Q的像素值相等,同理可知在剩余的三种情况中,P点的像素值依次与2Q、3Q和4Q相等。最近邻插值法的原理较为简单,计算量很小,但未考虑到相邻像素之间关联性,易导致图像的灰度变化不连续,产生锯齿现象。
................................
2.3. 生成对抗网络介绍
为了解决机器学习模型计算量偏大和建模复杂度过高的问题,Ian等人于2014年提出了生成对抗网络(Generative Adversarial Nets,GAN)。GAN采用基于博弈论的训练方式对数据进行建模,和其他图像生成模型相比,所生成的图像质量有明显的改善。近些年来,许多学者将生成对抗网络应用到图像处理领域,包括图像生成[46-48]、图像风格迁移[49-51]、目标检测[52-53]和图像超分辨率等,并取得了良好的成效,因此研究生成对抗网络在图像生成领域的应用具有重要的现实意义。
GAN主要由两个部分组成:生成器(Generator)和判别器(Discriminator),如图2-10所示。生成器接收一个大小固定的随机向量Z作为输入,而生成器的输出可以看做是一个分布函数G(z)。假设真实样本的分布函数为()tG z,GAN的主要目的是在给定一定量的训练样本情况下,让生成器和判别器进行对抗训练,使得生成器的输出G(z)趋向于真实样本的分布()tG z。生成器的主要职责是尽可能生成接近于真实图片的图片样本来欺骗判别器;而判别器的主要任务是尽可能分辨出真实图片和由生成器生成的虚假图片;当判别器已经无法区分图片样本是来自真实图片还是虚假图片时,说明生成器和判别器已经达到了纳什平衡状态。
人类的视觉注意力机制是指人类可以通过快速扫描所看见的图像,重点关注特定的目标区域,以获取更多关注目标的细节信息,而忽略次要信息。深度学习中的注意力机制[54]是一种选择性信息筛选机制,按照重要程度对信息进行划分并分配相应的权重,以提高神经网络筛选重要信息的能力。按照注意力关注的域,可以将注意及机制划分为空间注意力[55]、通道注意力[56]、层注意力[57]、时间注意力[58]和混合注意力[59-61],接下来本文主要对空间注意力、通道注意力和混合注意力机制进行介绍。
..........................
3.基于混合注意力和生成对抗网络的超分辨率重建算法 ................... 24
3.1.引言 ...................................... 24
3.2.退化模型的设计 ....................... 24
4.超分辨率重建算法的部署和应用 .......................... 43
4.1.个性化陶瓷定制平台介绍 ..................... 43
4.2.常见部署方式介绍 ............................. 44
5.总结和展望........................................ 54
5.1.主要工作总结 ......................... 54
5.2.本文创新点 .................................. 55
4. 超分辨率重建算法的部署和应用
4.1. 个性化陶瓷定制平台介绍

计算机论文参考
计算机论文参考

传统陶瓷定制周期长、人力成本高,且应用场景有限。随着互联网技术的高速发展,为陶瓷定制提供了更加快捷高效的途径,可以将日常生活中的照片、涂鸦和图案绘制到陶瓷上,以陶瓷为载体来保存日常生活中值得记忆的场景和传递人们内心的情感,既有使用价值又有纪念意义。
个性化陶瓷定制平台是一款基于三维建模技术和Web技术构建的小程序应用,主要为用户提供瓷盘、杯子、餐具等种类的个性化陶瓷定制服务,其功能界面如图4-1所示。用户既可以选择默认样式的瓷器,也可以上传自定义图像进行陶瓷定制,对图案的大小和位置进行调整,程序会以3D形式实时预览陶瓷的定制效果。定制完成后,用户可以将定制后的陶瓷产品加入购物车并提交订单进行支付,还能实时追踪订单信息。
................................
5. 总结和展望
5.1. 主要工作总结
图像作为传递信息的重要媒介,其质量影响着信息传递的效率,而图像分辨率作为评判图像质量的重要指标而为人们所悉知。图像超分辨率重建技术主要通过算法建模的方式来提升图像的分辨率,在日常生活和专业领域中有着广泛的应用。虽然研究人员提出了许多方法来提升超分辨率重建模型的性能,包括对数据预处理、训练方法、网络结构和损失函数的改进,但这些方法在处理现实世界中较为复杂的退化过程时,往往会出现性能下降的问题,且现有的方法难以充分利用图像的通道信息、空间信息和全局信息,为此,本文提出了一种基于二阶退化和混合注意力机制的图像超分辨率重建算法HA-ESRGAN来改善重建图像的效果,主要工作总结如下:
(1)首先介绍了图像超分辨率重建的基本概念,并从生活工作中的实际需求和专业领域的应用价值来论述本课题的研究背景及意义,然后介绍了近年来较为流行的图像超分辨率重建算法,对算法的基本原理、网络结构和损失函数进行分析和总结,再根据上述背景知识来确定本文的主体研究内容和主要目标。
(2)对图像超分辨率重建技术所涉及的相关理论知识进行了详细阐述,首先介绍了图像超分辨率重建的基本原理,侧重于分析图像退化模型的具体流程,之后按照重建方式对超分辨率重建算法进行分类叙述。接下来阐述生成对抗网络和常见注意力机制的基本原理,并介绍常见的图像质量评估指标。
(3)深入研究了基于生成对抗网络和注意力机制的超分辨率重建算法,对目前超分辨率重建算法采用的退化模型、网络结构和损失函数所存在的问题进行分析,由此提出了HA-ESRGAN模型,HA-ESRGAN的主要创新点包括二阶退化模型、多尺度混合注意力残差组、基于Unet结构和谱归一化层的判别器和多层VGG感知损失,接着对HA-ESRGAN的设计理念、网络结构、算法原理和训练方式进行介绍。最后通过消融实验来验证本文所提出的各个改进点的有效性,并在相同的实验条件下将本文所提出的HA-ESRGAN模型与多个先进模型进行对比实验,实验结果表明HA-ESRGAN模型在客观指标和主观视觉效果上均优于其他对比模型。
参考文献(略)


上一篇:学生在校学习行为特征建模及推广
下一篇:没有了
如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
相关计算机论文论文
QQ 1429724474 电话 18964107217