表4.2同类识别算法对比的平均识别率图4.4在MSRActionPairs 数据集上平均识别率91.5%的混淆矩阵示意图实验结论:①基于人物交互相似动作识别,本章提出的基于深度图像的多特征融合算法能达到91.5%的平均识别率,充分验证基于交互动作整体结构的识别算法在相似“动作对”中具有较好的辨识性和有效性。......
2023-10-28
人体动作识别能自动分析、理解人在环境中发生的动作变化,从而做出相应的决策,是视频图像语义分析方向的一个新兴研究课题。该研究融合了人工智能、模式识别、图像处理、计算机视觉以及认知科学等多学科知识,在智能视频监控、人机交互、运动分析、虚拟现实等领域有着广阔的应用前景,对推动经济和社会发展具有重要意义。
(1)智能视频监控
通过人体动作识别技术自动对监控环境中人物的行为举止进行分析、预测,并对监控环境中任务发生的变化进行识别、定位和跟踪,及时发现可疑人员。
(2)人机交互
人体动作识别是计算机感知视觉信息的基础。识别技术是智能人机交互系统的关键技术,与其他常见交互方式相比,人体动作包含更多的信息,可极大地提升计算机对外部视觉信息的感知能力,实现方便、快捷的人机交互。
(3)运动分析
对视频中的运动员情况进行人体动作识别,通过评价,完善训练系统,从而提高运动员成绩。也可通过步态分析,为腿部受伤运动员的康复训练治疗方案提供一个科学的技术支持。(www.chuimin.cn)
(4)虚拟现实
人体动作识别是虚拟现实技术的重要组成部分,通过对人体动作进行建模分析,可更好地对场景进行仿真模拟。例如,飞行员的模拟驾驶、虚拟现实游戏等,带给使用者更加优越的体验感受。
最初,人体动作识别主要是以RGB 视频图像为研究对象,经过多年的努力,人体动作识别技术已取得了较快的发展。但是,由于环境光线、遮挡和动态背景等因素造成的影响,以及从三维空间到二维图像平面投影导致深度信息丢失等原因,造成了基于RGB 视频图像的人体动作识别准确率较低、算法鲁棒性较差。因此,人体动作识别还存在极大的发展空间。
随着科学技术的发展,传感器工艺和性能不断更新,打破了传统的视频图像采集方式。2010 年问世的深度传感器Kinect 不仅能采集RGB 视频图像和深度图像,而且还可实时地对人体骨架进行跟踪,采集人体骨架关节点的坐标信息。深度图像能方便地实现背景剔除、前景人体检测和提取,弥补空间投影过程中深度信息丢失的问题。Kinect 传感器采集的深度信息为人体动作识别研究注入了新的活力,受到越来越多学者的关注。
本书使用Kinect 传感器采集人体动作的深度图像信息,探讨人体动作识别的相关理论和技术难点,着重研究如何消除可能对识别结果造成的干扰因素,提高人体动作识别的鲁棒性与普适性。本书的主要目标是进一步分析人体动作行为的特性,提出鲁棒性更高的人体动作识别算法。
有关基于图像深度信息的人体动作识别研究的文章
表4.2同类识别算法对比的平均识别率图4.4在MSRActionPairs 数据集上平均识别率91.5%的混淆矩阵示意图实验结论:①基于人物交互相似动作识别,本章提出的基于深度图像的多特征融合算法能达到91.5%的平均识别率,充分验证基于交互动作整体结构的识别算法在相似“动作对”中具有较好的辨识性和有效性。......
2023-10-28
由于人体动作的多样性和周边环境的复杂性,使人体动作识别充满了挑战。人体动作识别最初的研究都是基于RGB 视频图像序列,许多学者分别从静态特征、动态特征和时空特征3 个方面对该领域的工作进行了总结[1-4]。虽然基于RGB 视频图像序列的动作识别研究取得了较好的成果,但因其复杂背景、相机视角、光照变化以及遮挡等问题,人体动作识别研究仍然存在诸多挑战。......
2023-10-28
下面简单介绍大部分可公开获取的RGB-D 动作行为数据集。目前有3类人体动作行为数据集,即单视角动作行为数据集、多视角动作行为数据集和双人/多人交互动作行为数据集。单视角动作行为数据集MSR-Action3D[30]数据集是微软研究院2010 年公开的RGB-D 单视角行为数据集。10 个受试者共320 个样本。UTKinect[31]行为数据集是得克萨斯大学2012 年公布的。UTD-MHAD[88]行为数据集是由得克萨斯大学2015 年公布的。8 个受试者每个动作执行4 次。......
2023-10-28
深度传感器Kinect 采集的深度图像与实时采集的骨骼模型深度信息相比,更能直观和完整地描述动作形状特征以及动态特征。图1.2深度传感器Kinect 采集的图像类型基于深度图像提取的特征主要包括全局特征和局部特征。基于深度图像的局部特征提取方法是人体动作识别领域中的一个研究热点。除了上述常用的人体动作识别研究方法外,还有另外一种研究方法,即将图像序列转换为3D 点云序列数据进行动作识别。......
2023-10-28
表2.2不同识别算法在MSR-Action3D 数据集识别率对比图2.6在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。......
2023-10-28
卷积神经网络的这种局部连接、权值共享结构使其布局更接近于实际生物神经网络。②卷积神经网络引入多种形式的池化操作,可对特征提取过程产生的局部相似视觉特征、局部结构的尺度差异,甚至对局部几何畸变起到抑制作用,较好地保持了旋转、尺度和缩放不变性,能得到更加鲁棒的特征描述。更为关键的是,卷积神经网络在每一个神经元节点使用相同的连接权值,可更有效地捕获图像不同部位的同类型视觉特征。......
2023-10-28
针对上述噪声,本章引入高斯核函数进行滤波处理。同时,高斯核函数还具有单瓣频谱特性,对噪声具有很好的抑制作用。同样,为了获取紧凑的运动特征和更好的传输不变性,实验使用Max-pooling 技术进行下采样,归一化处理,形成向量Sm。......
2023-10-28
表3.1在MoCap 动作序列上提取关键帧从实验可知,本章提出的关键帧提取算法可有效地提取具有代表性的动作序列帧,关键帧序列只占样本序列的2/3 甚至更少,其余的帧均为冗余信息。因此,关键帧提取对减少运算复杂度、提高动作识别率具有重要意义。在关键帧提取实验的基础上,又进行了动作序列的关键轨迹提取实验。......
2023-10-28
相关推荐