1 绪论
1.1 研究背景及意义
上世纪末我国已经进入老龄化社会,目前我国已经成为了世界上老年人口最多的国家,预计到 2020 年六十岁以上的人口数将达到 2.48 亿,老龄化程度达到 17.17% [1]。我国老年人口的不断增长带来了诸多挑战和社会问题,其中最为严峻的就是老年人的日常看护问题。因为我国医疗资源分布不均且总量有限,而我国又是人口大国,有限的医疗资源无法满足大量老年人的日常看护需求,过去以“医院”为核心的老年人健康看护模式势必无法承担这种压力,所以在老人看护这一问题上需要由传统模式向“医院+家庭”的模式进行转变,即以医院为专业技术和知识保障进行疾病的治疗,以家庭作为日常看护方进行疾病的早期预防和简易治疗。但是“家庭”作为日常看护方也存在一定问题,由于独生子女的比例大幅上升,现代化、城市化脚步的加快,导致很多老人无人看护。老人无人看护成了社会上越来越普遍、越来越严重的问题。越来越多的‘空巢’老人因为子女忙于工作疏于照顾、看护屡屡发生意外,其中又以意外跌倒最为普遍与危险。
跌倒指的是人在生活中由于不自主或不可抗力因素导致人体姿态迅速的非可控地改变,并与低势物体相接触、撞击。据国外相关机构统计[2, 3],65 岁以上居家老人当中约有三分之一每年会有至少一次以上的意外跌倒,这其中又有超过一半以上的老年人由于跌倒受到了不同程度的损伤,并且随着年龄的增大跌倒的发生率和危险程度也会越来越高。而且跌倒会对老人施加心理和生理两方面的影响,在生理上,跌倒会对老人造成身体上的损伤,导致老人无法进行正常的日常生活,严重者更会导致生命危险;在心里上,跌倒会导致老人对日常活动产生一定程度的恐惧,这种恐惧心理将影响老人日常活动频率,降低老人身体素质,进一步提高意外发生的概率,所以意外跌倒会严重影响老年人身心健康[4]。根据美国国家安全委员会报告指出,在 65 岁以上老年人中,跌倒直接或间接导致死亡数量占该年龄段意外死亡总人数的 37%,居老年人致死原因的首位。由此可见跌倒对于老年人的健康和生命安全来说是一项最为重大的威胁,大多数情况下跌倒致死是因为老人在跌倒后未被及时发现并进行救治,导致错过最佳救助时间。2018 年 1 月北京的一位李姓老人在家因起身太快意外跌倒,因为无人发现导致最终在家中地板上被冻死。
...........................
1.2 本文主要研究内容
跌倒检测就是通过一系列输入数据判断目标人物是否跌倒的过程。根据所采用传感器的类型不同,跌倒检测方法可以分为基于穿戴式设备的方法、基于场景式设备的方法和基于视觉信息的方法。由于可穿戴设备本身对于老人的日常生活来说本身也是一种负担,经常会存在无法正常佩戴设备的情况,所以在实际应用中不能很好的实时监控老人状态。基于场景式设备的方法又分为不同的几类,一类是在居家环境中设置多种传感器、雷达等收集数据用以判断老人的行为状态,但是这种方法精度一般且存在成本高,安装、拆卸不便,环境受限制严重等问题;另一类主要使用摄像头采集数据,通过分析图像信息来判断老人行为状态,但是在居家复杂环境中,摄像头所采集到的图像信息包含复杂的背景信息,对前景信息产生较强的干扰,所以在居家环境中检测效果不佳。并且传统方法非常依赖人工提取特征,一旦所提取的特征不够理想,跌倒行为检测的精度就会受到非常大的影响。而近些年比较先进的基于视觉信息深度学习的方法避免了人工提取特征的问题,特别是其中结合人体姿态的跌倒检测方法取得了非常好的效果。但是这类方法仍然存在一些缺陷,因为这类方法只能得到局部的空间特征而丢失了跌倒行为的时间特征,从而影响检测精度。
3.1 三维人体姿态估计系统框架 ........................... 10跌倒检测就是通过一系列输入数据判断目标人物是否跌倒的过程。根据所采用传感器的类型不同,跌倒检测方法可以分为基于穿戴式设备的方法、基于场景式设备的方法和基于视觉信息的方法。由于可穿戴设备本身对于老人的日常生活来说本身也是一种负担,经常会存在无法正常佩戴设备的情况,所以在实际应用中不能很好的实时监控老人状态。基于场景式设备的方法又分为不同的几类,一类是在居家环境中设置多种传感器、雷达等收集数据用以判断老人的行为状态,但是这种方法精度一般且存在成本高,安装、拆卸不便,环境受限制严重等问题;另一类主要使用摄像头采集数据,通过分析图像信息来判断老人行为状态,但是在居家复杂环境中,摄像头所采集到的图像信息包含复杂的背景信息,对前景信息产生较强的干扰,所以在居家环境中检测效果不佳。并且传统方法非常依赖人工提取特征,一旦所提取的特征不够理想,跌倒行为检测的精度就会受到非常大的影响。而近些年比较先进的基于视觉信息深度学习的方法避免了人工提取特征的问题,特别是其中结合人体姿态的跌倒检测方法取得了非常好的效果。但是这类方法仍然存在一些缺陷,因为这类方法只能得到局部的空间特征而丢失了跌倒行为的时间特征,从而影响检测精度。
为了解决上述问题,本文设计了一种基于三维人体姿态检测的跌倒检测算法。首先使用卷积神经网络去估计图像中目标人物的二维姿态,即其关键关节点的位置(包括头、颈、双肩、双肘、双手、左右胯、双膝、左右脚踝和盆骨共 15 个关键关节点),得到目标人物的二维姿态图片,之后使用一种改进型的角径向分割方法将其转化为一种图像描述子,统计二维姿态图片中每个代表肢体的像素在不同划分区域的权重,将统计得到的结果转换为三维直方图的形式,并将其作为二维姿态的描述子,使用描述子在预先构建好的字典集中进行查询匹配,得到与输入二维姿态最为匹配的三维姿态。由于是采用查询匹配得到的三维姿态,所以不一定完全贴合实际姿态,所以本文以提取到的二维姿态作为优化目标,调整三维姿态的关节位置参数使得其二维投影与二维姿态一致,通过三维姿态优化来提高最终的精度,以求更贴近实际情况的三维姿态。结合三维人体姿态,本文改进了一种 LSTM 树状网络结构来进行跌倒检测,树状结构中的单向信息传递会因节点的信息缺失而导致整体信息传递缺失,并且误差会随着信息从根到叶的传递进行累积,从而导致整体预测能力下降,因此本文采用双向信息传递结构,分别使用两个 LSTM 网络来实现根节点与叶节点之间的信息传递,更有效的利用视频信息前后帧之间的时间关系和同帧之间骨骼关键点之间的信息,进一步提高了跌倒检测的准确性。
............................
2 国内外研究现状综述
2.1 基于穿戴式设备的跌倒检测研究现状
可穿戴式传感器是最早被应用于检测老人跌倒的方法,根据所穿戴的传感器的不同又分为以下几种:
(1)基于加速度传感器的跌倒检测
这种类型的跌倒检测算法主要依靠传感器采集老人跌倒时产生的瞬间加速度信息检测跌倒行为。所采用的传感器主要是加速度计和陀螺仪,将这些传感器嵌入手机、手表、手环或者直接制作成衣物(如马甲、裤子等)让老人随身携带。Oussama[7]等人和 Mathie[8]等人设计了一种嵌有加速度计的腰带式设备,当发生跌倒的时候人体的加速度会突然增加,据此来进行跌倒检测。相似的 Tamura[9]等人设计了一种跌倒触发的可穿戴安全气囊来保护老人,通过加速度计和陀螺仪收集人体运动数据,当检测到加速度和角加速度值超出所设置的阈值的时候,气囊就会打开来保护老人从而减少跌倒造成的冲击伤害。Kaluza[10]等人采用了多个位置传感器来模仿惯导系统,将传感器安装在人体各个关节部位如肩、肘、腰、膝和头等,通过采集到的信息在三维空间中重构出人体的姿态,之后通过预设的一系列参数和姿态行为模型对是否跌倒进行更为精确的判别。
(2)基于压力传感器的跌倒检测
另一方面有的学者发现当老人跌倒时其脚底对地面的压力会发生显著的变化,而这种变化具有很明显的特征,所以他们根据老人足底压力的变化情况来判断老人跌倒行为。Lieberman[10]设计了一种利用足底压力传感器判断老人跌倒行为的鞋子,但是老人在日常活动中和上下楼梯时也会又相似的压力变化,所以误报率也比较高。石欣[14]等人改进了这种设计,将压力传感器集中在脚掌和足跟部位,并且着重分析了几种容易产生误报的日常行为活动与跌倒行为压力变化的区别,提高了检测的准确率。不同的是弗吉尼亚理工大学的一个团队设计了一款集成了压力传感器与加速度传感器的裤子,通过联合分析跌倒时压力和加速度的变化进一步提高了准确率。
...........................
2 国内外研究现状综述
2.1 基于穿戴式设备的跌倒检测研究现状
可穿戴式传感器是最早被应用于检测老人跌倒的方法,根据所穿戴的传感器的不同又分为以下几种:
(1)基于加速度传感器的跌倒检测
这种类型的跌倒检测算法主要依靠传感器采集老人跌倒时产生的瞬间加速度信息检测跌倒行为。所采用的传感器主要是加速度计和陀螺仪,将这些传感器嵌入手机、手表、手环或者直接制作成衣物(如马甲、裤子等)让老人随身携带。Oussama[7]等人和 Mathie[8]等人设计了一种嵌有加速度计的腰带式设备,当发生跌倒的时候人体的加速度会突然增加,据此来进行跌倒检测。相似的 Tamura[9]等人设计了一种跌倒触发的可穿戴安全气囊来保护老人,通过加速度计和陀螺仪收集人体运动数据,当检测到加速度和角加速度值超出所设置的阈值的时候,气囊就会打开来保护老人从而减少跌倒造成的冲击伤害。Kaluza[10]等人采用了多个位置传感器来模仿惯导系统,将传感器安装在人体各个关节部位如肩、肘、腰、膝和头等,通过采集到的信息在三维空间中重构出人体的姿态,之后通过预设的一系列参数和姿态行为模型对是否跌倒进行更为精确的判别。
(2)基于压力传感器的跌倒检测
另一方面有的学者发现当老人跌倒时其脚底对地面的压力会发生显著的变化,而这种变化具有很明显的特征,所以他们根据老人足底压力的变化情况来判断老人跌倒行为。Lieberman[10]设计了一种利用足底压力传感器判断老人跌倒行为的鞋子,但是老人在日常活动中和上下楼梯时也会又相似的压力变化,所以误报率也比较高。石欣[14]等人改进了这种设计,将压力传感器集中在脚掌和足跟部位,并且着重分析了几种容易产生误报的日常行为活动与跌倒行为压力变化的区别,提高了检测的准确率。不同的是弗吉尼亚理工大学的一个团队设计了一款集成了压力传感器与加速度传感器的裤子,通过联合分析跌倒时压力和加速度的变化进一步提高了准确率。
...........................
2.2 基于场景式设备的跌倒检测研究现状
不同于穿戴式设备的跌倒检测方法,基于场景式的跌倒检测方法式通过将压力、震动、声音、红外等非视觉信息传感器布置在老人日常活动的场景中如起居室、客厅等。通过传感器所采集到的信息检测老人是否跌倒。Zhuang[17]等人将一组麦克风阵列布置在一个房间中,通过麦克风阵列所收集的声音信息,之后将所收集到的声音分成含有跌倒信息的声音和噪声并采用混合高斯模型(GMM)对其进行降噪,编码后使用欧式距离衡量不同音频之间的差异,最后利用支持向量机(SVM)进行分类从而判断跌倒。Alwan[18]等人将压力电传感器铺设在地毯下,通过人和地板的接触时产生的不同震动模式进行判断。霍宏伟[19]等人设计了一种基于射频信号的分析系统来进行跌倒检测,该系统不仅可以判断跌倒并且可以获得跌倒发生的位置,但是无法实时检测。目前比较新颖的方法是利用 Wi Fi和射频传感器进行跌倒检测,Ramezani[20]等人和 Wang[21]等人都使用这种方法在检测精度上相比于传统场景式设备方法有了明显的提升。
不同于穿戴式设备的跌倒检测方法,基于场景式的跌倒检测方法式通过将压力、震动、声音、红外等非视觉信息传感器布置在老人日常活动的场景中如起居室、客厅等。通过传感器所采集到的信息检测老人是否跌倒。Zhuang[17]等人将一组麦克风阵列布置在一个房间中,通过麦克风阵列所收集的声音信息,之后将所收集到的声音分成含有跌倒信息的声音和噪声并采用混合高斯模型(GMM)对其进行降噪,编码后使用欧式距离衡量不同音频之间的差异,最后利用支持向量机(SVM)进行分类从而判断跌倒。Alwan[18]等人将压力电传感器铺设在地毯下,通过人和地板的接触时产生的不同震动模式进行判断。霍宏伟[19]等人设计了一种基于射频信号的分析系统来进行跌倒检测,该系统不仅可以判断跌倒并且可以获得跌倒发生的位置,但是无法实时检测。目前比较新颖的方法是利用 Wi Fi和射频传感器进行跌倒检测,Ramezani[20]等人和 Wang[21]等人都使用这种方法在检测精度上相比于传统场景式设备方法有了明显的提升。
虽然基于场景式设备的跌倒检测系统无需穿戴避免了之前穿戴式设备的一些弊端,但是也有其局限性比如其布设成本高、无法固定在室外场景等,影响了这类方法的应用范围,所以目前应用很少,只有一些固定的医院看护室和养老院有使用。
............................
3基于查询优化的三维人体姿态估计 ........................ 10
............................
3基于查询优化的三维人体姿态估计 ........................ 10
3.2 二维人体姿态提取 ....................... 11
4 基于树状 LSTM 网络的跌倒检测 ................................. 37
4.1 LSTM 网络基础结构 .................... 37
4.2 树形结构 LSTM 网络结构 ............................ 39
5 总结与展望 ................................... 46
5.1 论文总结........................................ 46
5.2 未来展望........................................... 46
4基于树状 LSTM 网络的跌倒检测
4.1 LSTM 网络基础结构

.......................
5总结与展望
5.1 论文总结
随着现今社会人口老龄化程度的加剧,由于独生子女政策使得越来越多的老人无法得到较好的看护,并且独居老人由于年龄的增长导致身体素质、行为能力的下降更容易发生危险,其中跌倒是老人们最常遇到同时也是非常容易导致危险情况发生的行为。所以目前社会非常需要一种可以及时、有效的发现老人跌倒的系统是。
鉴于此,本文首先对国内外关于老年人跌倒检测的相关工作进行了梳理与回顾,其中包括基于穿戴式设备、场景式设备和基于视觉信息的跌倒检测方法,又着重分析了结合人体姿态进行跌倒检测的方法的优势与优点,本文也重点研究了基于三维人体姿态的跌倒检测方法。
为了保证跌倒检测的精度需要有一个准确的三维人体姿态作为输入,所以本文重点研究了通过单目视觉信息估计三维人体姿态的问题,首先通过一个卷积神经网络提取 RGB 图像中目标人物的二维人体姿态,之后通过二维人体姿态生成其对应的描述子,使用描述子在预先构建的字典集中查询得到最相似的 k 个三维姿态,最后根据之前得到的二维姿态通过一个三维姿态优化过程得到更贴近真实的三维人体姿态。最后我们在两个大型公开数据集 Human3.6M 和 UR-FDD上通过充分的实验证明了本文提出算法的有效性。
更进一步的结合三维人体姿态本文改进了一种 LSTM 树状网络结构进行跌倒检测,通过时间域与空间域的学习,结合双向的信息传递更有效的利用了视频信息前后帧之间的时间关系和同帧之间骨骼关键之间的联系,进一步提高了跌倒检测时的准确性。
本文基于三维人体姿态的居家老人跌倒检测方法具有设备成本低廉、安装操作简单检测精度高等优点,并且可以在居家复杂背景和室外场景下良好运行,切实解决了社会对于老人健康看护的需求,具有非常高的社会意义。
参考文献(略)
本文基于三维人体姿态的居家老人跌倒检测方法具有设备成本低廉、安装操作简单检测精度高等优点,并且可以在居家复杂背景和室外场景下良好运行,切实解决了社会对于老人健康看护的需求,具有非常高的社会意义。
参考文献(略)