基于数据增广和迁移学习的海参养殖水质氨氮软测量

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:32012 论文编号:sb2022062414442148768 日期:2022-07-11 来源:硕博论文网

本文是一篇计算机论文,本文基于 Early Stopping 可以在训练中阻止过拟合发生的优势,结合 Early Stopping 和数据增广模型的特点,对海参数据生成模型进行优化以维持生成数据稳定性,通过预训练微调的方法在随机配置网络基础上进行优化,构建多隐含层随机网络网络 DeepSCN,提升软测量模型精度,将软测量模型分为迁移模型与直接增广模型两种方式,将实验结果进行对比并得出结论。
第一章  绪论
1.1  研究背景及意义
水产养殖业是中国渔场最主要的一部分,是改变中国传统捕捞渔业的主要方法之一[1]。近年来,由于中国国内外对水产品的需要日益增长,而中国又是主要水产品输出国家,这为我国水产养殖行业提供了机会。截至2018年,中国水产养殖总量约占全球养殖总量的70%[2]。虽然,中国的水产饲养数量居全球第一,但中国设施水产饲养水平仍大大落后发达国家。表现在:当前的环境参数实时控制、饲养设施在线管理、环境恶化辨识等先进信息化技术手段较为滞后、渔民的技术创新能力薄弱。所以,怎样借助当前先进的信息化技术,提升当前水产饲养的科学管理,成为推动当前水产饲养可持续健康发展的关键问题。

计算机论文怎么写
计算机论文怎么写

近年来,随着民众生活水平的提高,海参产业供应量也日益扩大,出现了我国继鱼、虾、贝、藻之后的第五个海洋养殖浪潮,目前海参行业已成为了我国海洋渔业国民经济的主要部分[3]。海参作为世界八大珍品之一,不仅是营养丰富的食品,更是名贵的药材,逐渐得到人们的推崇。海参产业蓬勃发展,不但吸纳了众多渔业从业人员,也为渔民创收开辟了一条新渠道。与此同时,海参饲养水体检测科技的不完备、资源利用效率低下等经济问题,已打破了国内海参产业的发展空间均衡格局[4]。所以,根据我国海参行业目前面临的问题,找到可持续发展措施已经迫在眉睫。
水质条件是所有水产生物赖以生存的基本条件,水质的好坏将直接影响水产品的繁殖性,是保证水产养殖数量与品质的最关键因素。保证养殖水质安全是中国水产养殖管理工作的关键,如果养殖水质污染,引起疾病便可导致水产品大批量死亡,带来不可估量的经济损失。仅2017年,由于渔业灾情造成的水产品产量损失为99.91万吨,直接经济损失高达200.16亿元[5]。养殖水体预测预警可及时获知水体变化状况,指导水体管理工作,防止水体污染。所以,随着中国水产养殖集约化、自动化和信息化水平的迅速发展,做好对养殖水体预测预警方案研发,进而有效预防水体污染、病害风险,从而保障水产品养殖安全就迫在眉睫。
............................
1.2  国内外研究现状和发展趋势
随着中国人民生活水平的日益改善,对海鲜的需要量逐渐增加,海水养殖业技术也得到迅速发展,传统的水产养殖方式对中国海域环境也带来了极大的影响,而集约化海水循环养殖则因其资源节省、收益较高、便于监督管理等优点,已成为中国当今最主要的一种水产养殖方式[7]。在集约化海水养殖过程中,由于高密度的养殖会加大对养殖环境的污染,所以实现对养殖水体不同水质参数实时科学合理的测量非常必要[8,9]。在水产养殖过程中,影响水质的主要参数有水温、pH、溶解氧、盐度、氨氮浓度等[10,11]。其中氨氮浓度是养殖水体的重要污染物之一,其主要来源于饲料、残饵、粪便和水体底层的有机物分解等[12]。当水体氨氮含量过高时,就会形成较强的神经毒素,从而严重影响养殖物种的正常生活状态,降低水产养殖的质量和收益[13,14]。实现对养殖水体氨氮浓度的实时有效的测定,是水产养殖生产管理和科研工作的重要基础。
目前,国内外对氨氮浓度的测定方法有很多种,如电化学分析法,仪器分析法,分光光度计等[15,16]。使用这些方法的好处是测量精度高,但是因为监测流程复杂、检测时间长、成本费用高,使得在水产养殖过程中无法实现对养殖水质氨氮含量的即时检测[17]。国外公司在集约化水产养殖关键技术方面的研发水平较国内领先,具有相当完善的自动化检测水平,并能对水产养殖过程中的温度、pH、电导率、COD、BOD、溶解氧量等重要水质参数实现在线检测[18,19]。如德国WTW的Mnlti350i  手提式多参数水质解析仪、IQ  Sensor  Net在线多参数分析仪,以及美国YSI  6820/6920多参数水质分析仪等,但对于仪表机械的选择、消耗资源与维修设备所需要的成本比较高,导致无法在养殖场中加以普及。所以,在水产养殖过程中怎样精确、高效、低成本的对养殖水体中氨氮含量进行实时监控,仍是目前科学研究的一项热门话题。
.................................
第二章  数据增广及软测量建模相关方法简介
2.1  数据增广方法介绍
在现实的水产养殖中,很少有水质特征几乎一致的情况出现[47]。因此,如果我们仅仅拥有有限的样本,这将不能较好地表达我们所需要的内容,所以会导致我们训练得出的模型的精准性存疑[48]。由于以上原因,考虑去把这些样本做一定的拓展,从而帮助我们得到更加可靠、有代表性的内容信息。接下来就可以采取这些新的数据,来做进一步的建模操作。从而达到优化模型,使其更加准确的目的[49]。为了达到这一目的我们有很多可选方法,例如我们能够在拥有实际水质情况的基础上,了解其特征,接着利用为数不多的样本进行分析处理,如果遇到数据缺乏的区域,我们就能够采取欧式方法,来成功进行样本的拓展,这样就能更好地模拟实际数据[50,51]。另外,由于深度学习领域研究的逐渐深入,也有越来越多的人去研究生成样本的方法,在这其中,生成对抗网络策略就是其中较为重要的方式。Guo Z 等人[52]根据样本不足、并且分布集中,从而产生的部分种类下样本缺乏的情况,采取了 One-shot 的方式,最终得出了一种特殊的样本生成方法,它是通过双生成网络来实现的,这一方法的前提是样本需要有正则化约束。这一方法得到了良好的分类结果。另一方面,Zheng L 等[53]提出了 TrAdaboost 方法,这一方法在原始、生成数据有着相异分布的情况下非常有效,从而解决了传统方法无法解决的问题。它的特别之处在于采取了迁移的学习策略,帮助区分并且获得重要数据,同时还要使用生成的数据来进行相应的处理。这一预测方式与以前的相比,有着更优秀的表现。
除此之外,生成学习也有几种不同方式。其中包括了 Bender G 等人[54]发现的  One-shot方式,也就是我们常说的一次学习形式。在这种情况中,我们仅仅标注拥有的样本其中之一,再以它为基础来进行其他的样本推测。通过这一方式,我们能够识别出会对分类起重要作用的影响因素;此外,Ramesh  A 等人[55]也经过相关研究推测出了自己的方式,即Zero-shot 方式,我们可以理解为零次学习。它与前面的方式不同,会在无样本数据的情况下,并且以额外数据为基础,经常被认为是一种泛化表示。这意味着它将解析一些未被注意的额外问题,并以此为基础,获取更多数据来协助生成样本。
....................................
2.2  生成式对抗网络及其改进
2.2.1  生成式对抗网络(GAN)概述
生成式对抗网络[57,58]是以训练数据为基础的,它需要在其中获取数据分布的相关信息,从而达到得出相似样本的目的。生成模型实际上有非常多的种类,但我们现在所说的这一种在其中具有重要的地位,并且经实验证实有良好的效果。另一方面,它在计算机领域也已经开始大放异彩。接下来本节会介绍其相关信息。
生成对抗网络的出现与博弈论密不可分。在一些情况下,两个人的总体利益是有限的,这意味着一人获得的利益越多,另一人获得的就会越少,这也被叫做二人零和博弈。两人互相博弈的最终目的都是帮助自己获得最佳利益。若在对方决策一定的状态下,己方都会做出最佳判断,这叫做实现了纳什均衡。在 GAN 中,生成器(Generator,G)就是博弈的一方,同样判别器(Discriminator,D)是另一方,他们会通过一次次的博弈,共同进步。
如像上文所说,G 和 D 两者的利益和是 D 输出的概率。它是 D 分析的,输入是从真实样本产生的可能性大小。由于进行训练,此时 G 将持续产生假的样本,但同时它们又与真实样本类似,以此来搅乱 D 的判断。在此时,D 就需要尽量导出小的概率来保护己方收益。在这一不断变化的过程中,G 和 D 都在努力提高相应的能力,并慢慢靠近纳什均衡状态,当实现了这一状态则训练结束。此外,G 和 D 的内部网络结构没有太多的限制,可以选择包括了卷积神经网络在内的许多种。
.................................
第三章  基于改进 TableGAN 的数据增广方法 ...................................... 15
3.1 TableGAN 模型算法概述 ......................................... 15
3.2 TableGAN 的改进算法 ......................................... 16
第四章  基于 DeepSCN 的养殖水质氨氮浓度模型迁移 ........................ 26
4.1 DeepSCN 模型简介 ......................................... 26
4.2  基于 DeepSCN 的养殖水质氨氮浓度建模 ................................. 29 
第五章  总结与展望 ......................................... 42
5.1  总结 ................................................ 42
5.2  展望 ................................. 43
第四章  基于 DeepSCN 的养殖水质氨氮浓度模型迁移
4.1 DeepSCN 模型简介
本文在随机配置网络基础上进行优化,以 Bagging-SCN 为理论基础,构建了深度随机配置网络(DeepS CN)。Bagging 会进行有放回的采样,这也是其最重要的部分,我们常常称之为“自助采样”。因为是存在放回的采样过程,所以重复抽取到某一样本的现象是存在的。举一个简单的例子,比如此次采样的目的是得出我国人口的平均年龄,所以在抽样时我们要从所有样本中随机地选择某一集合,而他们是有相交的可能性的;接着算出均值,最后把这些值再平均,得到最终的预测值。Bagging 集成算法流程及 Bagging-SCN 算法流程如表 4-1 及表 4-2 所示。

计算机论文参考
计算机论文参考

...........................
第五章  总结与展望
5.1  总结
氨氮是养殖水质中最常见的污染物之一,其含量过高不仅阻止生物体内的氨向体外排出,还能从水中向其体内渗透,使水生生物代谢减少或停滞,损害包括鳃在内的一些重要器官,抑制其生长发育,甚至造成死亡。近年来,集约化海水循环养殖模式以其节能、环保、收益高、易监管等优势,成为当今重要的一种水产养殖模式,然而养殖密度的增高会加剧水质的恶化,对养殖水质中氨氮的实时监测就显得尤为必要。
由于水质氨氮极易变化且含量极低,水质氨氮在线快速准确检测一直是困扰水产养殖界的公认难题。目前,针对水质氨氮的测量方法多采用传统滴定法和分光光度计纳氏试剂法,但是此类方法时效性差、人为影响因素大,一旦发现水质氨氮超标问题,往往为时已晚。近年来,国内外众多学者利用软测量建模的方法对养殖水体中氨氮浓度的测量进行研究并取得了一定成果。
然而在训练模型过程中,训练样本数量不足很容易产生过拟合现象,高质量的数据集可以用来提升模型,尤其是学习模型的训练过程。扩大现有数据集是防止过拟合现象发生的有效方法,然而氨氮测定的特殊性使得手动采集水质分批检测标注十分耗费人力物力,相比之下,自动生成数据样本更加可行。不同物种养殖水质检测具有相通性,以此为基础进行迁移学习会取得不错的效果。为解决海参氨氮软测量实验数据量不足的问题,本文以早期大菱鲆养殖水质氨氮软测量数据为基础,通过数据增广与迁移的方式应用于海参养殖水质氨氮软测量中,建立软测量模型,通过实验数据对比得出结果。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217