基于标签增强的掌静脉识别算法探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:33566 论文编号:sb2023091916452351066 日期:2023-09-28 来源:硕博论文网

本文是一篇软件工程论文,本研究提出基于标签增强的多尺度Transformer(LE-MSVT)模型,以实现手掌静脉的有效识别。
第1章 绪论
1.1 研究背景
1.1.1静脉识别的兴起

软件工程论文怎么写
软件工程论文怎么写

自古至今,身份信息安全对每个朝代,每个社会组织以及每个个体而言都是一个不可忽视的问题。身份认证是信息互联的透明度和人间互信的关键点,其目的是建立起系统与访问者之间的信任关系。最早的身份认证是由春秋战国时期推行的“照身贴”,到隋唐时期朝廷为官员分发作为身份信息的“鱼符”“龟符”,再到今日具有IC卡芯片的二代身份证,身份信息载体随着时代的前进而不断的推陈出新。在新时代下,数字化身份制度也带来了新挑战,当数以亿万计的人们与数不胜数互有关联的机器和设备相连时,人们的所有身份、联系、隐私、数据完整性和交易都必须得到最佳的管理和保护。如果没有身份认证的合法性,没有数据的保护和完整性,就没有可持续的业务。如何确保受保护的资源不被非法窃取,一直以来都是一个亟待解决的重要社会问题。
不幸的是,传统的身份认证将逐渐退出历史舞台。传统的建立身份信息的机制主要有两种:基于知识(如密码)和基于令牌(如钥匙,身份证)[1],都存在易丢失,易盗用和被复制等问题,密码容易泄露,易被攻击,且更容易记错和记混淆等,身份证和钥匙等外信息载体容易丢失,被伪造等,这些物理上的信息判别载体引起的一系列问题不能满足未来需要。传统的身份认证方式更是由于无法区分冒充者与真实拥有者,进而产生不容小视的经济损失。我国就发生过已逝世之人仍然从事社会活动这样的情况,数亿的公共福利被假冒者所领取。传统身份认证方式由其局限性被不法分子钻了空子,为我们带来诸多不便和安全隐患,难以满足社会的需求。因此,寻找更安全的更可靠的身份认证方式已是迫在眉睫。
...........................
1.2 研究现状
1.2.1掌静脉图像采集
手掌静脉成像的原理是:在医学光谱(700~900纳米)下,手掌静脉血管中的血红蛋白的近红外吸收率比周围组织的近红外吸收率强[11]。当近红外光在血管中被吸收时,血管形成阴影,这就是手掌静脉图像。对于镜面反射和散射,近红外不能深入皮肤,在这种情况下,850纳米的近红外成像的光学穿透深度估计为3.57毫米,这样的照明显示出在成像时对皮下静脉提供更高的对比度[15]。
图像采集是识别的基础。Kang和Yan[16][17]采用多光谱相机(AD-080GE)和940纳米的主动红外照明来建立自己的手掌静脉数据库,Wang[18]使用一个近红外充电耦合器件(CCD)相机和一个850纳米的发光二极管(LED)红外光源来捕捉手掌静脉图像。Sierro等[19]提出了另一个手掌静脉图像原型,它也使用了一个CCD相机,但主动光源不同,它是基于三种波长,蓝色照明增强了皮肤表面结构,而另外两种主要显示静脉结构。Antonio[20]使用商用超声成像机来捕捉三维手掌静脉图案。研究人员必须做实验来选择近红外或红外作为光源,Wang等[21]给了研究人员很好的建议,Dong等[22]提出了一个基于图像质量的多光谱自适应手掌静脉捕捉系统。从以前的工作[23]来看,研究人员更喜欢850纳米的光。
手掌静脉成像有非接触图像法和接触图像法。接触式的采集方法不能避免卫生问题,非接触式方法则带来了一个旋转和平移的问题。有些采集器让用户把手放在容器里,有些则放在容器外面,容器可以消除可见光的影响,但是有些用户不喜欢把他们的手放在容器里,因为降低了用户的舒适度。一个开箱即用的非接触式设备是掌静脉图像采集设备的未来。
..........................
第2章 相关理论基础与数据库介绍
2.1 标签分布学习
标签分布学习是一种新型机器学习范式,传统的单标签和多标签学习都可以看为该范式的特例。标签分布学习将不同标签对示例的重要程度用标签分布来显式刻画,已经在多个应用领域中取得很好的效果。然而,现有的多数数据集中却仅具有简单的逻辑标签而非完整的标签分布,因此可以通过挖掘训练集中蕴含的标签重要性信息,恢复出每个示例的标签分布。将逻辑标签提升为标签分布的过程定义为标签增强.
2.1.1标签分布学习
对数据的标记方式主要有两种,一是样例分配单一的标签;二是样例分配多个标签。假设训练集中的所有可训练数据的监督信息采用第一种标签称为单标签学习,如果训练集中可训练数据允许使用第二种标签则被称为多标签学习,多标签学习能够处理一个样例属于多种类别的多义性问题。
对于一个示例x,将一个实数值????????????赋予每个可能的y,????????????表示y描述x的重要程度,且????????????[0,1],假设标签集合为完备集,即用集合中的所有标签一定可以正确地描述一个样例,因此∑????????????????=1。????????????称为y对x的描述度。对一个样例,所有标签的描述度构成一种类似概率分布的数据结构,所以被称为标签分布,而在以标签分布标注的数据集上学习的过程就称为标签分布学习(label distribution learning, LDL)[65]。
....................
2.2 卷积神经网络
卷积神经网络的结构由输入层(Input Layer)、卷积神经层(Convolutional Layer)、池化层(Pooling Layer)、全连接层(Fully Connected Network)及输出层(Output Layer)构成。其中卷积神经网络层、下采样层、全连接被合称为隐含层。在卷积神经网络中,卷积神经层与下采样层的连接方式是局部连接的形式,即每层的神经元只连接输入层中的跟它相近的几个节点。而全连接层中采用的是全连接的方式,即每一个神经元与输入层中的所有节点连接。
2.2.1输入层
输入层(Input Layer)通常是输入卷积神经网络的原始数据或经过预处理的数据,可以是图像识别领域中原始三维的多彩图像,也可以是音频识别领域中经过傅里叶变换的二维波形数据,甚至是自然语言处理中一维表示的句子。以图像分类任务为例,输入层输入的图像一般包含RGB三个通道,是一个由长宽分别为H和W组成的3维像素数值矩阵H×W×3,卷积网络会将输入层的数据传递到一系列卷积、池化等操作进行特征提取和转化,最终由全连接层对特征进行汇总和结果输出。根据计算能力、存储大小和模型结构的不同,卷积神经网络每次可以批量处理的图像个数不尽相同,若指定输入层接收到的图像个数为N,则输入层的输出数据为N×H×W×3。
2.2.2卷积神经层
卷积层(Convolutional Layer)通常用作对输入层输入数据进行特征提取,通过卷积核矩阵对原始数据中隐含关联性的一种抽象。卷积操作原理上是对两张像素矩阵进行点乘求和的数学操作,其中一个矩阵为输入的数据矩阵,另一个矩阵则为卷积核(滤波器或特征矩阵),求得的结果表示为原始图像中提取的特定局部特征。卷积层的输出形状由输入形状和卷积核窗口形状决定。此外还有卷积层的两个超参数,填充和步幅。它们可以对给定形状的输入和卷积核大小改变输出形状。下图2.1表示卷积操作过程中的不同策略。

软件工程论文参考
软件工程论文参考

........................
第3章 基于标签增强的多尺度掌静脉识别算法............................ 18
3.1 引言 ............................... 18
3.2 LE-MSVT方法结构 ................................... 19
3.3 多尺度静脉Transformer ............................ 19
第4章 基于标签增强的混合自注意力掌静脉识别算法....................... 37
4.1 引言 .................................... 37
4.2 多路注意力混合Transformer ................................ 37
4.3 基于注意力机制的标签增强算法 ............................... 43
第5章 工作总结与展望.............................. 51
5.1 工作总结 ....................................... 51
5.2 工作展望 ................................. 52
第4章 基于标签增强的混合自注意力掌静脉识别算法
4.1 引言
虽然图神经网络可以学习到标签分布,相比于传统方法提升还是很显著的,这是由于GCN擅长于编码图的结构信息,能够学习到更好的节点表示,但是图神经网络的缺点也是很显而易见的,第一,图神经网络训练必须把全部节点都放入内存和显存中,这会很浪费内存和显存,而且处理不大图;第二,GCN在训练中还必须了解图的组成情况(包括预测的节点),但这在实际某些项目中并无法做到。所以,文章中提出了通过对注意力机制的标签增强来找到一种解决方案。首先,文章中注意到核心的问题就是通过实例捕捉和探索标签之间的相关性,本文提出了一种基于注意力机制的标签增强(AttentionLE)方法来恢复静脉分类的现实标签分布。本文的AttentionLE让模型对重要信息重点关注并充分学习吸收来学习有效的标签相关矩阵,以指导各实例之间的权重信息传播,从而提取输入图像和不同类别的多个训练图像之间的关系信息,并产生标签分布向量。由此产生的向量进一步与单次标签相结合,计算出这种输入图像的现实标签分布。其次,本文提出了多路注意力混合模型(RMT)来增强自注意力的建模能力,在一个并行设计中把全局自我注意,通道注意与空间注意结合起来,通过对跨层间连接建模以扩大感受野,本文提出跨分支的多向互动,在Transformer,深度卷积,通道与空间维度上提供互补的线索,以实现不同路径上的有效特征混合。最后,RMT被纳入AttentionLE,得到本文的LE-RMT,并以端到端方式训练得到的LE-RMT模型,以进一步提高RMT分类器的特征表示能力。本文在三个公共手掌静脉数据库上进行了大量实验,实验结果表明,所得到的RMT优于其他静脉识别方法,并在现有方法中取得了最佳性能,AttentionLE同样可以极大地提高RMT在其他基于深度学习的分类器中的性能,并比GCNLE取得了更好的改进效果。
.............................
第5章 工作总结与展望
5.1 工作总结
随着社会的不断向前发展,面向核心应用的信息安全是国家中长期科学和技术发展规划中的优先发展主题。掌静脉识别作为近年来兴起的一种生物特征识别技术,已经成为当前世界上研究热点和重大开发领域,它是具有高精度、高稳定性、抗仿冒攻击能力强,活体检测等优点的智能感知技术,具有广阔的发展潜力和市场前景。本文对掌静脉的标签增强算法,特征提取与识别算法展开了研究,主要工作如下所述。
第一,基于深度学习的静脉识别,作为一个有监督的训练过程,本文通过图神经网络与注意力机制学习到更良好的标签信息,GCNLE算法学习到的标签为模型训练提供更多监督信息的标签之间的相关性。这种相关性的有效捕捉会使样本间具有相关性信息的静脉特征被有效利用,从而提高静脉图像的分类性能,通过对LE算法的进一步研究,本文发现注意力机制也可以通过实例间关系反映到标签信息,进而为先进的分类器提供更多的监督信息。
第二,基于多尺度提取静脉特征的方法(MSVT)考虑到多尺度场景下静脉特征间相互关系与关联,通过多尺度Transformer模型利用多尺度静脉特征的识别,学习不同尺度特征具有关联,通过不同尺度图像同时学习不同尺度间同一位置间,同一尺度不同位置间以及不同尺度不同位置间关系。为掌静脉采集过程中遇到的尺度不一问题构建一个能够通过使用局部感受野和共享权重来捕捉局部结构,并能对图像中的长距离像素依赖性进行建模的静脉多尺度Transformer模型,以反复学习不同尺度的标记之间的信息交互,从而学习更平滑的多尺度信息。 
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217