基于关键点检测的动作训练系统研究与实现

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:32336 论文编号:sb2022011711213043208 日期:2022-01-26 来源:硕博论文网
本文是一篇计算机论文,本文在提出的轻量型人体骨骼关键点检测网络模型的基础上,设计并实现了针对传统武术梅花拳的动作训练系统。该系统实现了标准动作库建立、训练动作采集、动作对齐和姿态分析等功能,能够对训练动作视频中的关键动作信息进行提取并与标准动作库中的模板信息进行比对,并给出改善意见,在一定程度上可以作为梅花拳学习者的辅助训练工具。

1  绪论

1.1  研究背景与意义
随着计算机相关技术的持续迭代,现阶段计算机视觉涉及领域越来广,已经发展成为了一门综合数字图像处理、机器学习、计算机科学等诸多学科的交叉性学科。研究者为了让计算机和人类更顺畅地交流,通过对生物视觉的运行原理进行模拟,对输入的人体图像信息进行分析和识别,进而让计算机更好地理解人类的语言、姿态等信息并做出相应反馈。因此基于计算机视觉获取外界信息并进行分析成为了近年来的研究热点。人体动作识别作为计算机视觉应用领域中的重要研究方向之一,被广泛应用在人机交互、监控、动作分析等领域,具有非常广阔的应用前景和实用价值。
动作分析作为人体动作识别中的重大应用之一,就是通过建立人体运动的几何模型,对视频中的人体进行跟踪、分析,进而研究人体动作的行为特征。其应用场景既可以包含体育锻炼的运动训练过程也可以是医疗中的患者康复训练。在体育训练中,对运动员的动作姿态要求很高,而且在一些运动较为激烈的场景中,大部分动作的停留时间都特别短,人眼判断动作标准性的难度很大。如果能够使用摄像头对人体动作进行采集,通过对视频帧的处理,获取人体动作的关节点位置、角度等参数,可以有针对性的对动作进行分析、判断,为运动员的训练给予更加科学的指导。在医疗领域,大多数病人的康复训练都是由主治医生、护士或者家人进行监督、指导,人力消耗较大。通过人体动作识别技术,可以实时的对病人动作信息进行采集、分析并给予反馈意见,为病人提供更加规范的康复训练指导,以帮助病人更快地康复。
人体骨骼关键点检测作为人体动作识别技术的基础,就是对输入的图像或者视频帧,通过检测网络的特征提取,找出图像中人体的所有关节点位置,描绘出人体的骨架,进而识别人体所处场景的动作姿态。近年来,深度学习技术飞速发展,基于深度学习的人体关键点检测效果也不断提升,但仍有一些关键性难题亟待解决。首先,先前大多数基于人体骨骼关键点识别算法的应用系统研究主要是基于深度图的,对图像视频采集设备的要求比较高,如何通过普通单目摄像头采集的图像进行骨骼关键点检测并进行应用仍有很大的探索空间。其次,为了提升模型精度,现阶段基于深度学习的人体骨骼关键点检测算法网络结构更加复杂,参数量越来越大,如何在保证准确率的同时简化网络架构,减少参数,提升模型实用性成为了一个极具挑战性的课题。
........................

1.2  国内外研究现状
1.2.1  动作训练方面的研究现状
目前传统的动作训练方法主要包含:纸质图示学习、视频录像学习、课堂直接学习,这些方式虽然简单但存在着许多问题比如纸质图示法容易让人产生误解,视频录像法易出现指导动作不完整,课堂学习法花费高、不能随时随地学习等。
随着计算机技术的大力发展,大量新颖而又高效的训练方式喷涌而出。在舞蹈训练方面:D.Alexiadis[1]等基于 Kinect 的人体骨骼跟踪技术,利用黄金标准对舞蹈动作进行评估,并在3D 虚拟环境中提供反馈。李昕迪[2]则利用 Kinect 的人体骨骼跟踪技术结合提出的基于固定轴的关节点角度表示方法,设计了一套舞蹈辅助训练系统,能够准确识别舞蹈姿势的同时对动作准确性给出比对意见。张梦营[3]选取 Kinect 作为人体运动信息的感测载体,设计了一套融合了运动信息采集和动作评价功能的瑜伽教学系统,使得瑜伽爱好者可以随时随地进行学习。毕雪超[4]通过分析现有的人体运动识别算法,针对舞蹈动作识别领域提出了一种基于空间骨架时序图的识别算法,利用 Part Affinity Fields(PAFs)技术对舞蹈演员的骨骼关键点进行提取,然后再使用长短周期神经网络 LSTM 算法对其进行识别,该算法能够有效识别舞蹈动作并给予纠正指导。在医疗康复方面:美国乔治亚理工大学 Venugopalan J 等人提出了一个针对外伤性脑损伤(TBI)患者的康复系统  MotionTalk[5],该系统使用微软的 Kinect 采集运动数据并进行分析,实时监测 TBI 患者的康复训练动作并给予定量评估。黄耀斌[6]为了帮助手部疾病患者恢复手部运动功能,发明了一套针对手部外骨骼的康复训练装备。通过数据手套对人体手部运动数据进行采集、分析,得到手部抓取等动作的特征运动规律,然后对手指的驱动力机构进行优化,复现了人手自然抓握的动作特性。宗驰航[7]根据人体上肢运动模型,基于 Kinect 2.0 传感器设计了一套针对上肢外骨骼的自主康复辅助训练系统,系统能根据患者所处的不同康复阶段,给予相应的训练指导并将训练情况传送到医师处,有助于患者的康复也方便了医师的训练指导。李超洋[8]将深度学习技术应用到医疗恢复领域,提出了一种基于深度学习技术来识别中风病人脑电波信号的方法,并结合脑-机设备、气动康复手套等其他设备实现了针对中风患者手部偏瘫问题的治疗康复系统,可以对患者左右手同时进行独立的康复训练。
...................................

2  人体动作识别相关理论及算法

2.1  二维图像人体动作特征
2.1.1  二维人体骨骼关键点
人体骨骼关键点检测分为二维人体骨骼关键点检测和三维人体骨骼关键点检测。本论文主要检测视频图像中的二维人体骨骼关键点,并对获取的骨骼关键点坐标信息进行计算、分析。在 MS COCO 数据集中可以提取到 17 个人体骨骼关键点,包括:鼻子、左眼、右眼、左耳、右耳、左肩、右肩、左肘、右肘、左手腕、右手腕、左髋、右髋、左膝、右膝、左脚踝、右脚踝。各关键点的分布如图 2-1,各个编号的含义如表 2-1 所示。
计算机论文参考
计算机论文参考
...........................

2.2  人体骨骼关键点检测算法
人体骨骼关键点检测的任务就是将给定的图像或者视频送入到检测网络中,网络自动提取人体骨骼关键点特征并返回最终关键点在图像中位置信息。这个任务主要分为二维骨骼关键点检测和三维骨骼关键点检测。近年来,基于深度学习的骨骼关键点检测技术从原始图像中提取更充分、深层的特征信息,在精度、性能等方面都远远超过了传统方法。基于深度学习的二维骨骼关键点检测方法主要分为单人检测和多人检测两种,单人骨骼关键点检测根据预测关键点坐标的方式,又分为基于回归的方法、基于热图(Heatmap)的方法以及两者相结合的方法。基于回归的方法利用输出的特征图直接回归出骨骼关键点,而基于热图的方法则是先生成热图(热图中的像素值表示该位置骨骼关键点存在的概率),然后在热图的基础上再预测骨骼关键点[39]。基于坐标回归和热图检测的混合模型则是通过串联或者并联的方式将两者结合起来,综合使用两者的优点。多人骨骼关键点检测也可以分为两类:一种是自顶向下(top-down)的方法,首先进行人体检测;然后根据检测到的人体区域分别进行单人骨骼关键点检测。另一种是自底向上(bottom-up)的方法,该方法也是分成两步,第一步是检测出图像中的所有人体骨骼关键点,第二步就是对这些离散骨骼关键点进行聚类,确定各关键点的归属,然后分配给不同的个体。
基于坐标回归的单人骨骼关键点检测模型,利用特征图直接获得每个骨骼关键点的坐标。在早期的基于深度学习的单人骨骼关节点检测研究中,这种方法还是十分常见的,简称坐标网络(Coordinate Net)。但是这种方法的识别效果并不大理想,一方面是由于人体姿态的多样性以及环境的复杂性,单纯想依靠直接回归的人体骨骼关键点坐标获取较为精确的预测关键点坐标仍有很大困难[37]。另一方面,由 Coordinate Net 预测得到的关键点坐标之间毫无关联,且没有对关节结构信息进行建模[38],导致训练得到的模型通用性比较差,很难泛化到多尺度的人体骨骼关键点检测上。因此后续的研究中,基于热图检测的方法逐渐取代了Coordinate Net。基于热图的方法将检测问题看作概率计算,根据检测网络得到骨骼关键点对应的 Heatmap,用热图的响应值来计算属于人体不同部位的概率[39]。
................................

3  轻量型高分辨率人体骨骼关键点检测网络构建 ................................ 21
3.1  引言 ........................................... 21
3.2  问题分析 ................................ 21
3.3  算法改进 ..................................... 22
4  基于关键帧和分段动态时间规整的动作对齐 .................................. 29
4.1  引言 .................................................... 29
4.2  关键帧提取 ................................................ 29
5  梅花拳动作训练系统的设计与实现 ..................................... 39
5.1  引言 ........................................... 39
5.2  梅花拳动作训练系统设计 .......................................... 39
5.3  梅花拳动作训练系统开发环境 .......................................... 40 

5  梅花拳动作训练系统的设计与实现

5.1  引言
本论文算法的应用场景是对训练动作进行比较与校正,要求系统能够快速、准确的对训练动作视频中的人体骨骼关键点进行识别,计算各关节点间的角度并与标准动作信息进行比对。本章以梅花拳这一传统武术为研究目标,主要介绍了梅花拳动作训练系统的设计与实现,其中包括系统的开发环境及各功能模块,并对各功能模块的界面进行详细的阐释。系统的主要流程如图 5-1 所示。本系统首先需要对标准的梅花拳动作视频进行采集;然后人工选取合适的标准动作帧,使用人体骨骼关键点检测算法对动作帧中的人体骨骼关键点进行提取,计算各关节点间的逆时针旋转角度,建立标准动作库;其次使用关键帧提取技术对训练动作视频进行关键帧提取,减少冗余视频帧,提高系统处理的速度;再次利用人体骨骼关键点检测算法对提取的关键帧进行骨骼关键点提取并计算各关节点间的角度;最后将训练动作与标准动作进行动作对齐并给出比对意见。最终给出的比对信息能够作为动作训练的指导意见。
计算机论文怎么写
计算机论文怎么写
............................

6  总结与展望

6.1  工作总结
人体动作识别是计算机视觉领域中的一个热门的研究课题,可以被广泛应用在人机交互、智能监控、动作分析等领域,具有非常广阔的应用前景和实用价值。人体骨骼关键点检测作为人体动作识别技术的基础,随着深度卷积神经网络的飞速发展,基于深度学习的人体骨骼关键点检测技术在速度、准确率等方面得到了很大提升,但仍有不少不足:1)模型的准确率、检测速度还有提升空间;2)研究人员为了获得更高的检测准确率,设计的模型网络结构越来越复杂,参数越来越多,导致这些高精度的模型在理论上表现越来越好,但是很难进行落地应用;3)大多数基于人体骨骼关键点识别技术用于实际应用的过程中主要是基于深度图像的,对图像视频采集设备的要求比较高,如何通过普通摄像头采集的图像进行骨骼关键点检测并进行应用仍有很大的探索空间。本文基于目前上述人体骨骼关键点检测领域面临的问题,进行了以下几方面的工作:
(1)文献调研及人体骨骼关键点检测算法研究
首先本文详细介绍了人体骨骼关键点检测技术及其在动作分析领域的背景与意义,并对这两方面的国内外研究现状进行了调研;之后详细介绍了人体骨骼关键点检测领域中的二维人体动作特征、常见检测算法分类、常用数据集和对应的评价指标;最后简要介绍了在动作评估中常用的相似性度量方法。
(2)轻量型高分辨率人体骨骼关键点检测网络构建
首先本文对中科大和微软亚洲研究院共同提出的自顶向下的人体骨骼关键点检测算法:HRNet 进行了详细介绍。然后针对其模型中存在的不足进行了分析,针对其网络结构复杂,参数量大的问题,提出了基于 HRNet 网络的轻量型高分辨率人体骨骼关键点检测网络 HS-GattNet,并对 HS-GattNet 网络的网络结构和核心模块进行了详细介绍。最后为了分析本检测网络的改进效果,选择了几个目前 SOTA 的算法进行了对比,结果显示本方法能够在保证网络模型检测准确率的同时大大减少了网络参数量,验证了算法的可行性和有效性。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
QQ 1429724474 电话 18964107217