第一章绪论
1.1研究背景和意义
进入21世纪,随着计算机和互联网的快速发展,信息安全越来越受到关注,各国也越来越重视社会的公共安全。现如今生活中采用的识别方法大多数为磁卡、密码等,这些方法都存在着很多问题。随着人工智能技术的发展,人们开始将研究目标转向生物体征(由DNA决定,具有唯一性)。
生物识别技术分为生物特征标志和行为特征标志两类。像虹膜,人脸和指纹等生物特征标志,像步态,书写笔迹,和习惯性动作等行为特征标志,它们都可以通过计算机图像处理技术来自动识别。与人体的其他生理特征相比,人脸部图像具有容易采集,不接触获取等优点,更容易被公众接受,更容易推广实施。
随着年龄的增长,人的面部会发生一些变化,在光照等外部条件发生变化时,一个人的面部特征也会发生巨大变化,但是人类依然可以通过人脸进行识别是否是同一个人,说明了我们每个人的脸部都有着独一无二的特征信息,通过提取人脸部的特有特征信息,通过对比这些特征就可以很容易判断是否是同一个人。
人脸自动识别主要有以下三个过程。首先,采集人脸图像样本。如今,许多搞科研的机构、很多知名的大学都建立了自己的人脸识别图像库,例如现在使用比较广泛的FERET人脸数据库和ORL人脸数据库;其次,通过合适的方法对人脸特征进行提取,然后将提取的人脸特征数据导入人脸特征数据库;最后,进行特征匹配。当识别某个人的身份信息时,数据库中的特征数据与要识别人的人脸特征进行逐一匹配,以实现身份识别。
...........................
1.2国内外研究现状
1.2.1人脸检测
人脸自动检测的目标是就是不在人为控制下通过机器自主找出图像中所有的人脸对应的位置,人脸检测算法的最多的输出是每个人脸的外接矩形在图像中的对应坐标,可能还包括置信度或者姿态如倾斜角度等其他信息。
虽然人脸部都是由眉毛、眼睛、鼻子和嘴巴等部位组成,看似是一个刚体(即在任何情况下其形状和大小都不会改变的物体),虽然这些结构是确定性的,但由于面部姿态和面部表情的变化,不同的人的外观,会受到光照,遮挡等多种情况的影响,在这样的条件下要想准确的检测出一个人脸的准确位置是一项相当困难的任务。
早期的人脸自动检测算法使用模板匹配技术来将检测到的图像中的每个面部与人脸模板进行匹配。通过这样的匹配方式来确定该位置处是否是人脸,等同于区分图像中某个区域是否是人脸和非人脸的二分类判别。
早期的人脸识别方法主要分为两种,一种是基于几何特征的人脸识别方法,还有一种是基于模板的匹配方法。常采用的几何特征有人脸的五官如眼睛、鼻子、嘴巴等的局部形状特征,脸型特征以及五官在脸上分布的几何特征。提取特征时,往往要用到人脸结构的一些先验知识。在这种基于几何特征的识别中,归结为特征矢量之间的匹配,基于欧式距离的判决是常用的识别方法。识别采用的几何特征是以人脸器官的形状和几何关系为基础的特征矢量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等。但是这种方法有着以下几个问题,从图像中抽取稳定的特征比较困难,特别是特征受到遮挡时这种情况更为明显,对强烈的表情变化和姿态变化的鲁棒性较差,一边几何特征只描述了部件的基本形状和结构关系,忽略了局部细微特征,造成部分细节信息丢失,只适用于粗分类。模板匹配方法是一种经典的模式识别方法,这种方法大多是直接计算两幅图像之间的匹配程度,由于这种方法要求两幅图像上的目标要有相同的尺度取向和光照条件,所以预处理要做尺度归一化和灰度归一化操作。
...............................
第二章传统的人脸检测和识别算法
2.1传统的人脸检测算法
自动人脸检测是人脸识别任务中的第一个环节和在人脸自动识别中占有举足轻重的作用。人脸自动检测是指通过计算机计算确定一个图像中所有人脸的位置,包括人脸的大小(即人脸外接矩形框)或者是姿势。理论上,人脸检测本质上是对一副输入图像进行特征提取,一个好的特征提取方法提取的特征需要满足下面三个条件:特征之间必须相互独立,这些特征的的类内距离尽可能小同时类间距离尽可能大,向量拥有的维度越小越好。
人脸检测算法主要有一下几种:
2.1.1基于直方图粗分割和奇异值特征的人脸检测算法
此方法适用于复杂背景下的人脸检测。其原理主要是人脸图像经过灰度处理后,在灰度基本均匀的平面上,眼睛,鼻子和嘴巴构成一定结构分布特征。检测基本步骤如下:首先,根据平滑直方图粗略地分割图像,然后根据某个灰度空间定位人眼以确定人脸的区域。具体方法如下:1、用高斯函数平滑直方图;2、对双眼进行定位;3、基于奇异值特征的人脸验证。该方法对人脸有相当高的检测率,但是缺点是耗时较长,平均每个图像的检测需要10到15秒。该人脸检测算法适用要求比较苛刻,要求待检测图像中的人脸姿势和表情等都要比较固定,才有较好的检测效果,当用于检测的图像中的环境光照变化很大导致脸部出现阴影(尤其是眼睛的区域)时,图像中的人脸很难被检测到。此方法不适用于非控制条件场景下的人脸检测。
...........................
2.2传统的人脸识别算法概述
人脸自动识别从本质上来说就是三维塑性物体在二维投影图像上的匹配问题,它的困难点主要表现在:人脸的塑性形变(如面部表情,面部动作等)具有不确定性,人脸模式具有多样性(如胡须的有无和长短,头发的长短和多少,是否戴眼镜,带什么样的眼镜等),图像采集场景的不确定性(如光照强度,相机拍摄角度等)。由于这些不确定因素,因此困难点主要在于人脸特征的有效提取。
关于传统人脸特征的自动提取与识别的方法大体分为如下几种:
2.2.1基于几何特征的人脸识别算法
最早、最传统的人脸识别算法大都是基于几何特征的,需要与其他算法结合才能获得更好的识别效果。人脸由眼睛,鼻子和嘴巴等部分构成。世界上千千万万的人脸都是由这些部件的差异决定的。因此,对这些器官的形状和他们之间结构关系的几何特征描述可以用作识别不同人脸的重要特征。该算法过程主要如下:首先,根据人脸侧面轮廓曲线确定多个重要点,然后从这些用于人脸自动识别的重要点中计算导出一组特征度量如距离、角度等。获得到人脸侧面轮廓的最创新方法是由jia等人根据正面灰度图中线附近的积分投影来模拟人脸的侧面轮廓图。
对于传统的几何特征方法的缺陷,提出来可变形模板法。它通过设计一个可变形模板然后定义一个函数,通过调整模板参数使得函数取得最小值。该方法确实比较好,但还是存在两个影响其推广使用的问题,第一个问题是函数中各种加权系数只能由个人经验所确定,很难推广,第二个问题是能量函数的优化需要很长时间,难以用作实际应用。同时,一般几何特征仅仅描述了眼睛,嘴巴和鼻子等器官的基本形状与其结构之间的关系,这些方法忽略了局部的精细特征,它导致了一些重要信息的丢失,因此它只适用于粗略分类,现有的特征点检测技术还不能满足实际应用中的准确率要求,其计算量也是较大的,难以投入到实际工程中去。
.............................
第三章基于深度卷积网络的非限定条件下的人脸检测算法......................13
3.1深度卷积网络概述......................13
3.1.1卷积操作......................13
3.1.2池化操作......................13
第四章基于深度卷积网络的非限定条件下的人脸识别算法...................24
4.1引言.....................24
4.2本文提出的人脸识别算法.....................24
第五章面向视频监控的人脸卡口检测与识别系统实现和性能分析...................31
5.1数据库和实验环境...................31
5.2评价指标...................31
第五章面向视频监控的人脸卡口检测与识别系统实现和性能分析
5.1数据库和实验环境

...............................
第六章总结与展望
卷积神经网络由一个或多个卷积层和全连接层组成,同时也包括池化层,激活层和其他的层。与其他深度学习结构相比,例如深度置信网络、深度神经网络等等,卷积神经网络拥有更少的参数在图像和语音识别方面能够给出更优秀的结果。卷积神经网络常用的训练方法是反向传播算法。
主要工作:人脸检测方面,提出一种网络使得其在非限定条件下对人脸检测达到比较好的结果。本文使用的基础网络是基于VGG16网络结构,在VGG16的最后卷积层后面添加扩张卷积和适当的添加inception结构设计的。结合FPN算法,在网络的中间部分增加特征金字塔结构,利用底层特征高分辨率和高层特征的高语义信息的特点,通过融合这些不同层的特征实现预测的效果。并且在每个融合的特征层和剩余的高层没有进行特征融合的层上都进行单独的预测。人脸识别方面,主要是设计一种可以只用小规模数据集训练的网络实现更好地提取鲁棒的人脸特征。它是一种适用于在非限定条件下拍摄的人脸自动识别的更深更宽的网络,通过增量学习,使用全连接层权值分解的训练方法使得模型更适用于人脸卡口场景。
参考文献(略)