1绪论
研究背景及意义
视觉对于人类来说是观察外在世界和认知外在世界最重要的手段,相比于其他感觉器官人们更容易通过眼睛快速获取想要的信息。经科学统计,人类得到的百分之八十的信息都是通过视觉获取的,因此对于视觉的研究可以追溯到很古老的时期。随着科学的日益发展,现代文明对人类视觉的产生做了如下解释:物体通过可见光的反射在人眼的视网膜上形成图像,同时细胞的感光机能将其转化为脉冲神经信号并通过神经触体直接传到大脑皮层上,然后人类的大脑就会对传来的信号做出反应并形成视觉。通过上述理论可以看出,整个视觉的形成过程不光有对物体信息的获取和传输,更有大脑对其的理解与存储。因此对于整个视觉系统的研究是一个及其复杂的过程,它不仅融合了光学、神经学甚至还涉及到医学和心里学。虽然对视觉的研究看起来如此的困难,但是这并不能阻碍人们实现模拟人眼视觉功能的梦想,尤其是计算机的诞生更是为实现这一梦想提供了可能。随着计算机的出现,现在人们对视觉的研究更注重的是怎样用计算机来模拟人眼的功能,因此计算机视觉这门学科也就应运而生了,它的出现标志了人们对视觉的研究已经从理论走向了实践。
随着时代的发展,传统的测量方法己经不能满足人们对测量物体体积的精度和效率的需求,同时对于一些质地柔软或者处于人工无法测量位置的物体来说,传统的测量方法也无能为力。现代测量技术要求精度高、速度快、柔性化和通用性好,所以新测量技术的研究已越来越受到人们的重视。针对不同的应用需求,目前人们己开发出了各式各样测量设备:三坐标测量机,它采用传统的接触式测头,测量时需要测头与物体表面的接触,这大大限制了测量效率;机械测量臂,它采用坐标测量机的测量原理,在一定程度上克服了坐标测量机控制复杂的缺点,但测量速度还不能满足脱离手动、快速测量的要求;雷达测距仪,它主要利用物体对信号的反射、吸收等特性使信号被物体调制,然后通过分析被调制的信号来计算被测物体的信息。这些设备虽然各具特色,但通常都造价昂贵、操作困难,并且只是适用于某一领域,因此很难开展广泛的应用。随着计算机软硬件的高速发展,人们发现生活中遇到的各种困难可以通过计算机进行很好的解决,而上述所遇到的问题同样可以通过计算机视觉理论加以解决。
计算机视觉理论的主要研究内容是如何利用计算机来模拟人的视觉系统,这其中既包括对物体图像信息的采集和传输,又包括对获取的信息进行处理和存储。通俗来讲,它是通过摄像头作为“眼睛”来获取物体中的各种信息,并保存成图像或图像序列经由数字信号传播到计算机这颗“大脑”中进行识别、分析和处理。由于其具有灵活、可靠、自动和非接触等特点,目前己广泛应用于国防、医疗、电子自动化等领域。作为一门新兴的学科,计算机视觉理论由于其应用前景甚为广阔而受到了各领域专家的重视,并在近几年内并得到了高速的发展,是国内外计算机领域中研究的重点方向。鉴于其在各领域应用中的重要性及其对科学和经济的巨大影响,世界上的一些发达国家比如美国、欧盟等,均已将对其的研究列为“重大挑战”。目前人们对计算机视觉理论的研究主要从两方面入手:一是从仿生学的角度,参照人类视觉成像的整个原理,将成像过程细分为各个模块,并对每个模块加以研究并用计算机实现相应地功能;二是从工程学的角度,即不关心人眼的构造和成像的原理,只考虑整个过程的输入和输出,用一些可以实现的手段去实现整个系统的功能。此外,人们对计算机视觉理论研究的内容也主要分为两个部分:第一部分的内容是搭建起整个计算机视觉系统并完成人们所希望的各种视觉任务,这其中包括由各种图像采集设备对物体的信息进行采集,由计算机完成对物体三维信息的重建以及对物体做出识别、分析和解释;第二部分的内容是用计算机进一步模拟人脑在接受视觉信息后的处理功能,使机器人等能够拥有像人类一样的快速、敏锐、准确的视觉感应。利用计算机视觉技术来实现对物体体积的测量可以克服上述遇到的所有困难:首先基于计算机视觉的测量技术是属于光学应用的一种,具有测量速度快、不与物体接触等优点,因此它可以对那些质地柔软易形变或者表面光滑怕划伤的物品进行很好的测量,同时对于那些位于矿井下或者核环境下等危险区域中的物体,也能够轻松地测量其三维信息;其次基于计算机视觉的测量技术对设备的要求很低,通常一组高精度的摄像机和一台普通的计算机就可以组成一套完整的测量系统,整个系统的造价成木低廉,安装调试容易,并且操作简单易学,十分适合应用于各个领域中,相对于传统的测量方法具有绝对的优势。
2计算机立体视觉的发展及其应用
1.2.1计算机立体视觉的发展
对计算机视觉理论的研究最早能够追溯到上世纪五十年代,那时作大部分都集中在对二维图像信息的处理。1965年Roberts首次在“积木世界”的实验环境下对计算机视觉进行了实验,成功对“积木世界”中的各个物体进行了识别,标志着计算机理解三维世界时代的到来。但是“积木世界”并非日常生活中的复杂环境,因此人类对计算机视觉的研究仅仅只是个开始。为了解决计算机视觉在复杂环境一「无法通用这一难题,Waltz和Huffman等人对Roberis提出的三维积木世界又进行了深入的研究.
2 双目立体视觉......... 15-26
2.1 摄像头标定......... 15-21
2.1.1 摄像头的成像......... 15-17
2.1.2 传统摄像机标定......... 17-21
2.2 极线几何理论与极线......... 21-24
2.2.1 极线几何理论......... 22
2.2.2 极线校正理论......... 22-24
2.3 三维重建......... 24
2.4 本章小结......... 24-26
3 基于极线校正的摄像......... 26-38
3.1 摄像机标定算法......... 26-27
3.2 摄像机标定过程......... 27-31
3.2.1 摄像头的标定......... 27-28
3.2.2 摄像机标定实验......... 28-31
3.3 基于极线校正的摄像头......... 31-34
3.3.1 极线校正在模型......... 31-32
3.3.2 理想双目立体成像......... 32-33
3.3.3 极线校正的实现......... 33-34
3.4 理想双目成像模型下的摄像机......... 34-36
3.4.1 摄像机重标定的实现......... 34-35
3.4.2 摄像机二次标定的实验......... 35-36
3.5 本章小结......... 36-38
4 标靶参考点的自动......... 38-45
4.1 标靶上参考点......... 38-39
4.2 参考点坐提取的具体.........39-43
4.2.1 提取标靶图像......... 39-41
4.2.2 特征提取后噪声......... 41-42
4.2.3 伪参考点的最终......... 42-43
4.3 参考点提取的实验......... 43-44
4.4 本章小结......... 44-45
结论
本文主要对双目立体视觉理论及其各项技术进行了研究,对摄像机标定算法、极线几何理论和三维重建技术做了重点的讨论和分析。本文的工作如下:完成了摄像机标定算法的实现、完成了极线校正算法的实现以及完成了三维重建算法的实现,并在以上算法实现的基础上设计了一套完整的基于双目立体视觉的规则目标体积测量系统。该系统对于设备的要求很低,只需要一台计算机和两台摄像头即可完成对系统的架构;此外该系统的操作十分简单,只需要将物体摆放在拍摄位置,通过对系统进行就可以计算出该物体的长宽高以及物体的体积;最后该系统具有较高的精确性,可以比较准确地测量出物体的长宽高及其体积。
本系统最大的特色在于将极线校正理论应用到了摄像机的标定过程中去,从而实现了对摄像机内外参数的重新标定,同时对原先的双目成像模型进行修正,使得处于一般位置下的两台摄像机也能够组成理想的双目立体成像模型,从而为后续操作的实现打下了坚实的基础。经过对原先的双目立体视觉模型的修正,使得物体与两个摄像头的成像关系更符合三维重建技术的要求,同时极线校正也在很大程度上减少了镜头畸变对整个成像关系的影响,从而大大增加了三维还原的精确性与可靠性。同时由于待测物体都是规则的盒状物体,因此如果限定摄像头对物体的拍摄角度,就可以直接利用图像上物体顶点所处特殊位置来直接获取其坐标信息,从而避免了双目立体视觉中最困难的一步:图像匹配过程。虽然通常的图像匹配算法也适用于木系统,但是如果引入这些算法,不仅会影响整个程序运行的效率,也会大大增加程序的不稳定性。