视频监控之人数统计方法概述与实现

论文价格:免费 论文用途:其他 编辑:lgg 点击次数:91
论文字数:36490 论文编号:sb201406071111349839 日期:2014-06-12 来源:硕博论文网

1 绪 论


1.1 课题的背景及意义
随着国内社会经济的不断飞速发展,大型运动场,中心广场,公共娱乐场所,大型会议中心,购物中心等设施越来越多。人数统计在以上不同的场合下能够发挥不同的作用。对于商场而言,不同时段、不同地点的人群分布,运动方向等信息可以给管理人员提供商业抉择,从而加大对用户的吸引力,提升销售额。对于公共服务场所,利用人数统计系统了解和分析人群行为和习惯,评估服务设施的方便性以及利用率,如座位、电话亭、卫生等设施,从而提升建筑物的设计质量和提高人员的工作效率,以及对人流量的监控。同样对于公共交通而言,人流量统计可以实时获取乘客数量和分布数据,合理的分配和管理资源,并提供可靠的安全保障。特别是对于大型公共聚集场所,安全问题比较突出,在我国已发生多起人群拥挤踩踏事故,其中主要发生学校、体育场所、音乐会等人群聚集地[1]。根据相关统计,当人群密度高达 0.15 米2/人时,人群就很容易失去控制。这就给出了人群密度与人群灾难的量的关系,为借助于数字图像处理方法实现对人群的自动实时监测提供了依据。通过对人群流量的实时统计,可以减少和避免以上事故的发生。综合上述,通过对人群流量的统计,可以为社会提供巨大的商业利润,同时也为人们的生活提供更加安全而优质的服务环境。
……………


1.2 国内外研究概况


1.2.1 计算机视觉和视频监控
随着信息化时代的到来,计算机视觉技术也在不断的进步。计算机视觉技术是一门新兴学科,一种基于数字图形图像处理技术。该技术是通过计算机来模拟和代替人类的视觉功能,主要的研究目的是使计算机智能的通过二维图像认知三维信息,也就是让计算机能够感知现实物体的形状、位置、运动、纹理等视觉信息,并通过这些信息去模拟人的思维理解和处理实际情况中的问题[3]。计算机视觉处理技术是一门综合性很强的交叉学科,涉及到数学、信号处理、物理学等诸多领域。其中,智能视频监控的应用越来越受到重视,计算机视觉在这方面的研究也越来越广泛。在当前社会上,视频监控主要还是由人工来进行监控安全隐患或者异常状态,并进行分析,其缺点是很难实时而有效的进行安全监控和检测,远远达不到安全监控所要求的水准。而智能视频监控技术能够利用计算机视觉计数对拍摄到的图像序列进行动态的智能分析和处理,对视频中的大量信息通过计算机的数据处理功能进行动态的理解和分析,帮助用户去除干扰信息,提供用户所需要的准确结果[4]。智能视频监控技术能够充分利用计算机视觉技术以及图像处理的方法建立一个智能的管理系统,在没有人为干预的情况下,通过对视频中的图像序列进行智能分析来实现行人的准确检测和实时跟踪,从而进一步的对人群精确统计[5]。通过视频监控平台,基于视频图像处理的人数统计系统,相对于传统的统计方法具有很强的适用性,开发成本低,使用的周期长,实时性和准确性也很高,国内外都对此进行了大量的研究。
……………


2 人数统计相关技术概述


2.1 图像预处理
在获取视频图像过程中,由于受到光线、背景以及硬件条件等许多不可避免的外界因素的影响,会对后续的图像数据分析造成严重的影响。因此,在获取图像以后,需要对图像进行预处理是非常必要的。图像预处理也可以理解为增强图像的有用信息,改善图像中的视觉效果。预处理的过程主要包含形态变换、图像平滑、图像增强、图像分割等步骤[20]。其中频率域法和空域法是增强图像的两大方法。根据本文的实际需求,下面详细介绍了图像平滑、对比度增强以及边缘检测几种方法。图像平滑主要目的是消除噪声,减少对图像处理的影响。图像中的噪声种类很多,例如椒盐噪声和高斯噪声,其中椒盐噪声是一种黑白相间的亮暗点噪声,主要由图像传感器、传输信道以及解码处理等产生。而所谓高斯噪声是指它的概率密度函数服从高斯分布。噪声对图像信号幅度和相位的影响比较复杂,不同噪声与图像信号之间的关系不同,有的相关有的独立不相关。因此,对图像中不同种类的噪声应该采取不同的方法,才能获得比较满意的效果。
……………


2.2 人脸检测方法
人脸所蕴含的信息非常丰富,是一种很复杂、多维的非刚性模式。人脸具有结构的恒常性,很强的可变性以及丰富而细致的模式变化,包含丰富的模式特征,如图2.11 所示。90 年代以后,国内外对人脸检测的研究取得了很大的成果。当前的人脸检测方法主要以检测准确度和实时性的提高为目的,主要分为以下四类。基于先验知识的方法是将面部各个器官之间的关系编码准则化的一种人脸检测方法。这些规则能有效的捕捉面部特征之间的关系[28]。例如,图像中检测到的人脸的眼睛是对称关系,眼睛正下方有鼻子和嘴巴等。这些关系主要体现在位置和距离上,因此,该方法适用于人脸的定位。对输入图像的某部分区域,先查找面部局部特征或者人脸上各个器官(如眼睛、鼻子、嘴等)的特征,然后计算这些特征之间的相对位置以及距离关系,最后依据人脸器官的对称性、灰度差等先验知识来判断该区域是否符合准则[29]。Yang 和 Huang 等人通过一种马赛克方法实现了在复杂背景下的人脸检测。该方法主要根据面部灰度分布的规则,对样本的低分辨率到高分辨率是否满足规则作为判断依据[30]。Chetverikov 等人利用人脸亮度分布形成的斑点和条带信息,实现人脸检测。人的面部中包含两个黑点和 3 个亮点,条带则是人脸的轮廓、嘴唇、鼻梁等。用这些斑点之间的位置关系以及条带的分布来判断候选区域是否是人脸[31]。基于知识的方法的缺点在与人脸的所有知识很难全部转化为准确的规则,而且规则有失一般性,会导致特殊情况下的人脸不能被检测到。而且采用几何知识很难去检测不同姿态的人脸。
……………


3基于肤色信息与矩形特征的人脸检测
3.1 基于 AdaBoost 算法的人脸检测 ..... (17)
3.2 YIQ 颜色模型分割人脸区域 ..... (21)
3.3 基于肤色特征和改进的 AdaBoost 算法的人脸检测 .... (25)
3.4 实验结果及分析....... (27)
3.5 本章小结 ...... (28)
4 多目标跟踪与计数方法
4.1 Camshift 算法原理 ......... (29)
4.2 多级特征融合的 Camshift 的目标跟踪算法 ..... (33)
4.3 多目标跟踪与计数......... (35)
4.4 实验结果及分析....... (37)
4.5 本章小结 ...... (39)
5 系统的设计与测试分析
5.1 系统总体设计..... (40)
5.2 系统详细设计..... (41)
5.3 实验测试与分析....... (44)
5.4 本章小结 ...... (46)


5 系统的设计与测试分析


5.1 系统总体设计
系统的硬件环境为:一台普通的 PC 机(CPU: Intel i5 2.40GHz,内存 2GB )、一个高清摄像头(用于原始视频数据的采集)。软件环境为: 系统在 Windows 7 操作系统上运行,通过 VS2005 来搭建运行环境,对视频的编解码以及常用的图像处理采用 OpenCV 库来实现。其中 OpenCV 是一种开源的计算机视觉库,实现了图像处理以及计算机视觉等方面的许多基础算法。OpenCV 中的函数主要分为 3 类,如图 5.1 所示。人数统计系统主要分为三大部分:视频素材采集、图像处理以及数据分析。体系结构如图 5.2 所示。视频素材采集系统:视频素材主要来源于公共场所内的摄像头,对于获取到的视频数据,由该系统发送给图像处理子系统进行处理。图像处理系统:对于获取到的每一帧图像进行相应处理,处理得到的信息用于检测人脸以及多目标的跟踪,并为人数统计系统提供良好的交互界面。数据分析系统:按照需求可以对图像处理系统存储到本地的数据做进一步分析处理。
……………


结论


通道出入口等近距离环境下的人数自动统计技术是当今世界计算机视觉研究的热门领域之一。但由于在实际应用中受到各种内在因素以及外界因素的影响,准确而实时的进行人数统计变得比较困难。在了解了国内外研究的基础上,本文通过对人脸的检测及目标跟踪计数等人数统计关键技术进行了深入研究。本文的研究内容主要分为以下三个方面:
(1) 人脸检测:对 AdaBoost 训练分类器的过程做了改进,基于人脸样本的重要性高于非人脸样本这一思想,对迭代过程中的不同样本的权值更新方法采取不同的样本赋予不同权值的算法,加强了分类器对人脸检测的准确性。同时,为了减小分类器对图像的扫描时间,在采用 AdaBoost 算法进行人脸检测之前,先建立基于 YIQ颜色空间的肤色模型,对图像中的类肤色区域进行分割,采用面积法去除非人脸区域,最后 AdaBoost 不必对整个图像进行扫描,只用对分割出来的区域进行扫描即可,极大地减少了检测时间。
(2) 目标跟踪计数:在检测出人脸区域以后,选取这些人脸作为跟踪目标。为了准确地跟踪目标,提出了一种结合色度特征空间和纹理特征空间构造概率反向投影图,然后利用 Camshift 算法进行跟踪,加强了跟踪的鲁棒性。为了实现对多目标的跟踪及计数,采用多个 Camshift 跟踪器跟踪,并对多目标跟踪过程中出现的遮挡等问题给出了有效的解决方案,实现了对监控区域中多人脸的跟踪计数。
(3) 设计并实现了视频监控中的人数统计系统,并对实验结果进行分析,验证了本文方法的可行性。
……………
参考文献(略)


QQ 1429724474 电话 18964107217