首页 理论教育基于图像深度信息的人体动作识别研究成果

基于图像深度信息的人体动作识别研究成果

【摘要】:最初,人体动作识别主要是以RGB 视频图像为研究对象,经过多年的努力,人体动作识别技术已取得了较快的发展。本书使用Kinect 传感器采集人体动作的深度图像信息,探讨人体动作识别的相关理论和技术难点,着重研究如何消除可能对识别结果造成的干扰因素,提高人体动作识别的鲁棒性与普适性。

人体动作识别能自动分析、理解人在环境中发生的动作变化,从而做出相应的决策,是视频图像语义分析方向的一个新兴研究课题。该研究融合了人工智能模式识别图像处理、计算机视觉以及认知科学等多学科知识,在智能视频监控、人机交互运动分析、虚拟现实等领域有着广阔的应用前景,对推动经济和社会发展具有重要意义。

(1)智能视频监控

通过人体动作识别技术自动对监控环境中人物的行为举止进行分析、预测,并对监控环境中任务发生的变化进行识别、定位和跟踪,及时发现可疑人员。

(2)人机交互

人体动作识别是计算机感知视觉信息的基础。识别技术是智能人机交互系统的关键技术,与其他常见交互方式相比,人体动作包含更多的信息,可极大地提升计算机对外部视觉信息的感知能力,实现方便、快捷的人机交互。

(3)运动分析

对视频中的运动员情况进行人体动作识别,通过评价,完善训练系统,从而提高运动员成绩。也可通过步态分析,为腿部受伤运动员的康复训练治疗方案提供一个科学的技术支持。(www.chuimin.cn)

(4)虚拟现实

人体动作识别是虚拟现实技术的重要组成部分,通过对人体动作进行建模分析,可更好地对场景进行仿真模拟。例如,飞行员的模拟驾驶、虚拟现实游戏等,带给使用者更加优越的体验感受。

最初,人体动作识别主要是以RGB 视频图像为研究对象,经过多年的努力,人体动作识别技术已取得了较快的发展。但是,由于环境光线、遮挡和动态背景等因素造成的影响,以及从三维空间二维图像平面投影导致深度信息丢失等原因,造成了基于RGB 视频图像的人体动作识别准确率较低、算法鲁棒性较差。因此,人体动作识别还存在极大的发展空间。

随着科学技术的发展,传感器工艺和性能不断更新,打破了传统的视频图像采集方式。2010 年问世的深度传感器Kinect 不仅能采集RGB 视频图像和深度图像,而且还可实时地对人体骨架进行跟踪,采集人体骨架关节点的坐标信息。深度图像能方便地实现背景剔除、前景人体检测和提取,弥补空间投影过程中深度信息丢失的问题。Kinect 传感器采集的深度信息为人体动作识别研究注入了新的活力,受到越来越多学者的关注。

本书使用Kinect 传感器采集人体动作的深度图像信息,探讨人体动作识别的相关理论和技术难点,着重研究如何消除可能对识别结果造成的干扰因素,提高人体动作识别的鲁棒性与普适性。本书的主要目标是进一步分析人体动作行为的特性,提出鲁棒性更高的人体动作识别算法。