基于Transformer的多视角指静脉特征识别算法探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:33636 论文编号:sb2023090215090450970 日期:2023-09-08 来源:硕博论文网

本文是一篇软件工程论文,本文首先介绍了生物特征识别,并对指静脉识别系统及算法进行了系统的分析和讨论,另一方面,本文详细介绍了Transformer的发展,对Transformer的原理进行了分析。
第1章 绪论
1.1 研究背景和意义
当今社会,个人身份认证与识别与我们的日常生活与工作息息相关。例如:学生在进入学校时,需要提供学生证等证件证明自己的学生身份;客户在银行办理存取款业务时,需要输入银行卡密码;在乘坐交通工具时,需要提供身份证才能取票和进站;在网上商城选好商品后,需要输入账号和密码才能进行支付。随着现代高新技术与经济的发展,社会各阶层对信息的安全性要求越来越高,提高身份认证与识别技术已成为人们关注的热点。
传统的身份认证与识别方式主要分为两种[1]:一种是基于用户身份标示物的身份识别,如钥匙、身份证,出入证等可以证明个人身份的物品。然而这些身份认证标示物携带不方便,一旦容易遗失或被盗,则需要用户花费大量的时间与金钱来补救。另一种是基于身份标示知识的身份识别,如账户名、账户密码和口令等。虽然标示知识无需携带,且相比于标示物有着更高的安全级别,但也存在着容易遗忘和被黑客破解的问题。随着科学技术的发展,传统身份识别的固有缺陷[2]使得其往往使用于安全性要求不高的场合,而安全、消费及国防等需要信息安全高要求的地方,则开始更多的关注并使用更为安全、方便、可靠、有效的生物特征识别技术。
生物特征识别技术是通过计算机利用人体所固有的生理特征或行为特征来进行个人身份认证的技术。近年来,生物特征识别技术得到了广泛的发展与应用。中商产业研究院的调研数据[3]显示,2016年生物识别市场为126亿美元,2021年的生物特征识别市场则已经翻了一番达到了286亿美元。随着人工智能市场的加速发展,生物识别技术的应用领域将逐步扩大,进入大规模应用阶段,预计2022年的市场规模将达到340亿美元。从2016到2022年的全球生物识别技术市场预测如图1.1所示。

软件工程论文怎么写
软件工程论文怎么写

...............................
1.2 国内外研究现状
与其他生物特征识别技术相比,指静脉识别技术有着高安全,高隐私等优良特性,国内外研究人员都对其进行了大量的研究。目前,指静脉识别技术主要可以分为传统的指静脉识别方法和基于深度学习的指静脉识别算法,下面将详细介绍。
1.2.1 传统的指静脉识别方法
传统指静脉识别的关键在于指静脉特征的提取,现有的指静脉特征提取算法主要分为以下几类:基于静脉纹路特征提取的方法,基于局部二值化的特征提取方法,基于不变特征提取的方法。
(1)基于静脉纹路特征提取的方法
基于静脉纹路的方法是根据静脉的形状和方向等信息,使用各种算法从手指静脉图像中提取完整的静脉纹路,然后进行纹路匹配。原始的重复线跟踪方法由Miura等人[14]提出,从图像中随机的像素点出发,逐像素检测静脉纹路,通过多次对静脉模式追踪,最终获得指静脉纹路特征。然而原始的重复线跟踪方法存在着鲁棒性差、复杂度高等缺点,后续的工作[15]改进了原始的重复线追踪方法,提高了算法的效率和鲁棒性。在指纹识别及虹膜识别的先前研究中,Gabor滤波器能够有效的从图像中抓取纹理特征,所以也被研究人员使用于手指静脉图像识别上。结合静脉模式的特点,Yang等人[16]使用一组具有八个方向的Gabor滤波器提取指静脉纹路信息,并使用重建算法获得指静脉纹路。文献[17]通过Gabor滤波器选择手指静脉的纹理特征,以提取静脉的局部方向和频率信息。在指静脉图像中,指静脉纹路的灰度值往往比图像背景较低,导致指静脉横截面的曲率较大,因此研究人员可以通过手指静脉图像的曲率变化来提取指静脉纹路。Miura等人[18]通过计算手指静脉图像局部最大曲率来提取指静脉纹路。Song等人[19]则基于最大曲率法提出了平均曲率方法来提取指静脉纹路。文献[20]提出了一种结合最大曲率和离散化的方法,提高了识别性能。Qin等人[21]使用区域生长的方法来提取静脉纹路,获得了很好的效果。
...............................
第2章 相关理论
2.1 Transformer相关理论
在自然语言处理任务中,Transformer模型往往由一个编码器模块和一个解码器模块组成,具有多个相同架构的编码器/解码器。每个编码器和解码器都由一个Self-Attention层和一个前馈神经网络(Feed-forward Neural Network,FFN)组成,而每个解码器还包含一个Encoder-Decoder Attention层。用于计算机视觉(Computer Vision,CV)任务时,大部分基于Transformer的模型都采用Transformer的编码器模块。 这样的Transformer可以被视为一个新的特征选择器,如图2.1所示。

软件工程论文参考
软件工程论文参考

..............................
2.2 指静脉识别原理和性能评估概述
指静脉图像的采集需要使用到手指静脉采集设备,手指静脉采集设备包括用于放置手指的NIR(近红外)组件部分,然后使用电荷耦合器件(CCD)预处理器照相机来获得手指静脉的图像,在NIR光穿过手指时,静脉相比于骨骼和肌肉等组织,会吸收更多的NIR光,这会使得静脉显得更暗,可以从静脉变暗产生的阴影图像获得手指静脉的特征。手指静脉图像采集主要使用光投射法、光反射法和双向辐射法这三种方法。其中,光透射法可以有效的捕获高对比度图像。因此,目前大多数的手指静脉成像设备采用光透射方法。当前,除了二维的单视角手指静脉采集装置,三维的手指静脉采集装置也有着发展,相比于二维手指静脉采集装置,三维手指静脉采集装置可以方便地采集到手指静脉的多视角图像。
2.2.1 指静脉图像预处理
手指静脉图像在采集过程中,由于采集的时间和光照不同,且在图像采集设备的优化过程中,也存在着低对比度、平移、旋转变化和噪声等影响,会影响到指静脉图像的特征提取和匹配。这些影响在图像采集过程中难以解决,而特征提取的性能良好与否又取决于手指静脉图像的质量,所以在进行下一步之前,对图像进行预处理是必不可少的。图像的预处理过程大致分为三步,分别是:(1)图像质量评估,(2)感兴趣区域(ROI)提取,(3)图像归一化、滤波和增强等操作。
(1)图像质量评估
在图像预处理的第一个阶段,需要对采集到的手指静脉图像样本的质量进行评估,检查手指静脉图像样本是否适合进行下一步。当前,为了提高手指静脉识别系统的性能,研究人员已经提出了多种质量评估方案。其中部分工作有着非常不错的效果,在SVM算法的基础上,杨等人[49]结合指静脉图像的对比度、信息容量和梯度等信息对手指静脉图像的质量进行评估,选择高质量的指静脉图像。秦等人[50]利用Radon变化,通过将原始静脉图像投影到Radon空间,使用Radon空间的曲率预测指静脉图像的质量分数,这种图像质量评估算法有效的提高了手指静脉系统的性能。文献[51]中则提出了一种基于静脉层次特征的质量评价方法,该方法也取得了不错的效果。如果能从手指静脉图像中提取到稳定而显著的特征,则可以认为该图像有着高质量,基于此,黄等人[52]考虑到指静脉的识别策略和特征提取方面,提出了一种基于结构和纹理信息融合的方法,该方法获得了不错的效果。
................................
第3章 数据的采集与预处理 ........................... 15
3.1 多视角手指静脉数据库的建立 ..................... 15
3.1.1 静脉图像采集平台的构建 ....................... 15
3.1.2 数据预处理 ............... 17
第4章 基于改进注意力机制的单视角手指静脉识别 ............................ 23
4.1 引言 ................................. 23
4.2 改进的注意力机制 ...................... 24 
第5章 基于局部注意力Transformer的多视角手指静脉识别 ..................... 34
5.1 引言 ................................ 34
5.2 多视角指静脉识别算法 ........................ 35
第5章 基于局部注意力Transformer的多视角手指静脉识别
5.1 引言
血管在可见光下很难观察到,但静脉结构可以通过波长约为850nm的红外线捕捉到。目前,大多数手指静脉识别工作开发了各种带有单目摄像头的静脉成像传感器来收集静脉图像,位于手指下方的摄像头捕捉到红外线穿过用户手指的静脉图案,然后提出了各种方法来从生成的静脉图像中提取静脉图案以进行匹配和验证。然而,基于静脉的生物特征识别面临着严峻的挑战,因为静脉图像的质量受到各种因素的影响,例如环境光照[91]、环境温度[69]、成像手指组织中的光散射[92,93]和用户行为[69]。其中,一些因素,例如环境照明、环境温度和光散射通常会导致获取的图像中出现额外的噪声、不规则阴影和静脉图案缺失。另外一些因素,例如用户行为,通常会导致旋转和平移变化。如图5.1所示,在采集过程中,用户的手指可能会沿X/Y/Z轴平移和旋转,为了方便起见,沿三个轴的平移表示为X/Y/Z-shift。在这些平移中,Y 偏移和 X 偏移导致手指区域在 2D 图像上的位置偏移,而 Z 偏移导致手指区域在2D图像上的比例变化。沿三个轴的旋转分别表示为滚动(Roll)、俯仰(Pitch)和偏航(Yaw)。在实际应用中,偏航会导致单视角图像上手指区域的旋转,俯仰会导致手指区域的弯曲和变形,这可能会导致单视角图像中的静脉图案变形。与俯仰和偏航不同,手指滚动改变了 3D 静脉血管在 2D 平面上的投影视图,因此在不同投影视图下从同一手指采集的 2D 图像有着不同的静脉图案,这将导致探头图像与注册图像之间的不匹配。为了解决上述问题, 本文研究了基于Transformer的多视角指静脉识别,基于手指静脉的多视角图像,构建了基于Transformer的多视角识别模型。

软件工程论文参考
软件工程论文参考

..................................
第6章 总结与展望
6.1 总结
当前,生物特征识别被广泛地应用于自动化的身份认证中,其中,手指静脉识别在身份验证拥有着众多的优势,越来越受到研究者的关注。另一方面,Transformer架构在自然语言处理、计算机视觉、音频处理等人工智能领域中都取得了巨大的成功。本文首先介绍了生物特征识别,并对指静脉识别系统及算法进行了系统的分析和讨论,另一方面,本文详细介绍了Transformer的发展,对Transformer的原理进行了分析。基于此,本文基于Transformer对单视角和多视角指静脉识别进行了研究,主要工作如下:
(1)介绍了深度学习的相关知识。主要围绕本文提出的算法,详细介绍了Transformer的理论知识,同时分析了当前的一些Transformer架构的优缺点。
(2)建立了一个可供研究的多视角手指静脉数据库。因为目前并没有公开的多视角手指静脉数据库,而数据对于深度学习是极其重要的,因此本文设计并实现了一种手指静脉采集原型装置,该装置利用单个摄像头和LED组,沿手指旋转进行多视角图像采集。这使得可以捕捉隐藏在人类皮肤下的所有静脉图案,以形成手指特征的完整表示。
(3)研究了基于改进注意力机制的单视角指静脉识别算法。当前,基于深度学习的指静脉识别的主流是CNN,而Transformer已经在越来越多的领域中赶上甚至超过CNN,因此本文研究了将Transformer引入单视角指静脉识别的相关问题。提出了改进的注意力机制,它能够在同一Transformer层中同时捕获图像的全局细粒度注意力和全局粗粒度注意力,能够提升模型性能,还提高了模型计算效率。经过在数据集CIFAR10和MNIST预训练之后,加入改进的注意力机制的ViT和TNT相比于原始的ViT和TNT,在两个公共指静脉数据库和本文自建的指静脉数据库上均有着1个点左右的性能提升。这表明本文提出的算法在降低Transformer在指静脉识别任务中的计算复杂度的同时,还能提升手指静脉识别率。为将Transformer引入手指静脉识别任务中提供了一种思路。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217