基于卷积神经网络的燃气表码字识别系统的计算机设计与实现

论文价格:免费 论文用途:其他 编辑:硕博论文网 点击次数:
论文字数:31566 论文编号:sb2019030113183925137 日期:2019-03-12 来源:硕博论文网
本文是一篇计算机论文,本文设计并实现了基于卷积神经网络的燃气表码字识别系统。此系统首先采集、整理、构建了燃气表码字数据集,然后使用该数据集分别训练了用来识别燃气表完整码字和不完整码字的机器学习模型。

第一章  绪论

1.1  研究背景及意义
早在上世纪末,中国建设部便制定了 21 世纪能源供应事业的远景规划,具体是在小康住宅区实现水表、电表、燃气表等仪表信息全部出户,完成资源供应计量的信息化管理。2002 年 3 月又成立了编制小组,制定了三表计量出户智能系统装置的行业标准。 

字轮式仪表因其结构简单、稳定、耐寒、防尘和其计量功能不受电磁场影响等优势。自诞生以来在天然气计量领域始终是不可或缺的一部分,
字轮式燃气表如图 1.1所示。据统计,我国很多城镇家庭都安装了字轮式燃气表,截止 2015 年,其安装数量已超过 3500 万台。但是,字轮式燃气表信息的采集和输入等操作需要人工参与,这需要花费大量的人力和时间成本,非常不利于计量信息的自动化管理,以至于燃气表数据自动化采集识别和在线仪器监控等自动化操作需要花费大量的成本。
....................

1.2    燃气表码字识别的国内外研究现状 
早在上世纪 20 年代德国学者 Tausheck 就提出了光学字符识别(Optical Character Recognition,OCR)的概念[2],OCR 指的是用电子设备,如扫描仪或相机等拍摄图像,检查已获取图像上的字符,通过亮度、灰度等信息确定其形状,然后用机器学习等算法将图中文字符号形状转换成可以直接被计算机处理的文本的过程。显然,转换后的文本或者文字较图像字符来说容易编辑和使用,非常有利于促进信息的处理和交互。近年来,为了提高字轮式仪表的信息自动化管理程度,结合机器学习算法针对仪表码字识别的研究也成为了计算机图像处理方向的一个重要且热门的研究课题。目前,关于码字识别的研究方法主要有两大类,一种是传统机器学习方法,如支持向量机(Support Vector Machine,SVM)、遗传算法(Genetic Algorithm,GA)模板匹配等一系列方法,另一种则是基于神经网络的深度学习方法,主要是基于卷积神经网络(Convolutional Neural Network,CNN)的码字识别算法。
在 Tausheck 提出的 OCR 思想引导下,美国学者 Handel[3]真正将光学识别文字的技术应到生产实践中,人们也因此享受到了光学字符识别技术给生活带来的便利,OCR 技术也随着时间的推移不断发展,使之成为了机器学习领域研究的重要课题,这也为我们开启了使用图像处理技术识别图像中字符研究的大门。 
码字识别归根结底就是图像中的数字字符识别,说到数字字符识别就不得不说一下,1998 年来自美国国家标准与技术研究所(National  Institute  of  Standards  and Technology,NIST)的 Le Cun[4]等整理的手写数字数据集 MINIST。该数据集的诞生使得图像中的字符识别技术特别是数字字符识别技术得到突飞猛进发展,在短短十几年间,MINIST 手写数字字符的识别技术就取得了令人瞩目的成绩。 
...........................

第二章  基于卷积神经网络的燃气表码字识别系统设计实现

2.1  数据采集前端模块
1、摄像头

为了更有效的采集燃气表码字数据,降低数据预处理的复杂度,减少数据传输的信息量,本文对前端燃气表码字数据采集模块中的摄像头和燃气表做了针对性的处理。
首先在燃气表表面上加装一个除了对燃气表码字的部分透光外为黑色的塑料外壳,然后将工业摄像头固定于外壳表面如图 2.2 所示,调整镜头广角范围,使摄像头能够采集到清晰的燃气表码字图像。
增装黑色外壳可以使得拍摄时燃气表码字区域的光照相较于没有外壳时更加均匀,以尽可能减少图像采集时因为光照不均匀而产生的噪声。调整加装工业摄像头的广角中心,以使得采集的数据质量更高。上述两者相结合,使得码字数据定位和分割更具优势,有效地降低了数据预处理的复杂度,间接地减少了数据传输过程中的数据量,提高了传输效率。
............................

2.2  RS485 通信模块
RS485 是半双工,多点通信的标准,其作为前端采集模块与计算机之间连接和通信的桥梁,不仅接收来自计算机的采集码字图像的控制指令并将其发送至单片机,而且接收来自单片机的压缩码字图像数据并将其发送至计算机,其重要性自然不言而喻。基于数据传输质量和传输效率的考虑,本系统设计通信模块时需要从传输距离、抗干扰性和传输速度以及成本等几方面入手,筛选合适燃气表码字识别系统的中间模块。
RS485 最大理论传输距离为 10.8 千米,而生活小区的大小、小区与后台计算机间的传输距离约在 1 千米到 5 千米之间,因此其能够满足数据传输要求,而且单模光纤的数据传输距离已经达到了 50 千米,更是弥补了特远传输距离的缺陷。RS485 的抗噪性能相对其他通信模块要好很多,而且其传输速度高达 10Mbps。
计算机后台是整个系统的控制中心,也是码字图像识别算法实现的重要构件。其主要功能有,一是向 RS485 通信模块发送数据采集指令,二是接收由 RS485 通信模块发送来的码字图像数据,三是对码字数据进行预处理,四是训练模型并识别码字图像数据。
识别码字图像的卷积神经网络模型参数量巨大,故而模型在训练参数和识别过程中的计算量都非常大,所以为提高码字图像数据的处理效率,本系统使用了 Intel i7-7700 作为计算机的 CPU,NVIDIA1080 作为计算机的 GPU。
............................
第三章  基于卷积神经网络的燃气表完整码字识别算法 ........................... 17
3.1  燃气表码字数据采集和预处理 ........................... 17
3.1.1 数据采集和标注 .............................. 17
3.1.2 数据预处理 ................................. 18
第四章  基于 Grid Loss CNN 的燃气表不完整码字识别算法 ...................... 27
4.1  优化算法 ............................... 27
4.1.1  小批量算法 .................... 27
4.1.2  随机梯度下降算法 ......................... 28

第四章  基于 Grid Loss CNN 的燃气表不完整码字识别算法

4.1  优化算法
几乎所有的神经网络算法都会涉及到优化,例如,卷积神经网络中涉及到的使用优化算法解决参数自动学习的问题。解析优化也经常在其他的神经网络学习算法中被用于设计算法,对于诸多的优化问题,神经网络的参数训练可能是最难的优化问题。众所周知,为了训练好一个神经网络,会投入大量的时间成本和硬件成本,例如比较经典的神经网络 AlexNet、GoogleNet[49][50]和 ResNet[51]在使用 NVIDIA 公司生产的高性能  GPU 的情况下花费了几天到几个月不等的时间才完成了神经网络的参数学习。为解决这个难题,很多学者花费了大量时间、精力来研究它,本小节接下来会介绍神经网络优化问题中常用的几种优化算法。
4.1.1  小批量算法
小批量算法是最常用的神经网络优化算法之一。小批量优化算法中的样本数据都是从训练集中随机抽取的。据统计,自然界中连续排列的样本数据之间的相关性远远高于不连续的样本数据。为了保证小批量样本数据相互间具有更强的独立性,所以让每个小批量中的样本数据都是随机抽取的,然后计算小批量中随机抽取的独立样本数据期望的无偏估计[52],这样用以计算出的模型损失才会更加准确具有说服力。
小批量随机梯度下降优化算法中[53],如果没有重复地使用样本,得到的梯度就是真实泛化误差。一般地,在使用小批量随机梯度下降进行模型参数优化时,都会将原始数据集中的数据样本使用特定的乱序算法将其中的样本数据顺序打乱一次,然后按照此顺序多次使用数据进行模型参数的学习。第一次顺序打乱时,模型参数没有被新数据优化过,所以得到的是真实泛化误差的无偏估计;第二次时,将会有重复的数据对参数进行优化,此时得到的泛化误差估计将是有偏的。
..........................

总结与展望

本文工作总结
本文针对字轮式燃气表码字的识别问题,提出了一种基于卷积神经网络的燃气表码字识别算法,该算法不仅在一定程度上解决了日常生活中字轮式燃气表的计量信息不能进行信息自动化管理的难题,也解决了学术上图像数据不均衡但图像类别间有相关性的深度学习模型训练问题。本文参考了国内外相关研究文献和资料,在前人研究工作的基础上,通过采集燃气表码字数据集,设计并构建含有 InceptionV2 结构的卷积神经网络、码字图像掩模、设计 Grid Loss  损失函数、微调等步骤,完成了含有InceptionV2 结构的卷积神经网络识别燃气表码字图像算法的研究。具体的研究工作如下:
(1)  基于卷积神经网络的燃气表码字识别系统设计
本文设计并搭建了燃气表码字识别系统环境,其主要工作有:首先介绍了由前端图像采集模块、以 RS485 为主的中间通信模块以及计算机组成的硬件系统,然后进一步阐述了系统中每个模块的功能,这不但提高了卷积神经网络模型的运行效率,而且大大提高了基于卷积神经网络的燃气表码字识别模型的训练识别效率。
(2)  基于卷积神经网络的燃气表完整码字识别方
构建燃气表码字数据集,并采用燃气表完整码字数据集训练含有 InceptionV2 结构的卷积神经网络模型,模型识别燃气表完整码字准确率达到 99.97%。主要工作有:第一步,采集燃气表码字数据并对数据进行去噪、归一化的预处理工作,整理数据并构建了燃气表完整码字数据集和燃气表不完整码字数据集;第二步,首先,针对传统卷积神经网络结构中的不足,提出将 InceptionV2 结构与传统神经网络结合,确定了网络模型的基本框架;然后,确定含有 InceptionV2 结构的卷积神经网络的具体实施细节,如学习率初始值及衰减函数和初始化算法、优化算法的选择等;最后,使用燃气表完整码字数据集训练含有 InceptionV2 结构的卷积神经网络模型,并持久化为燃气表完整码字识别卷积神经网络模型。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217