首页 理论教育基于深度信息的人体动作识别:底层视觉特征提取

基于深度信息的人体动作识别:底层视觉特征提取

【摘要】:特征提取是人体动作识别的一个重要环节,高效、准确地提取特征可极大地提高动作识别率。学者们一般从两个方面进行底层视觉特征的提取:一是提取全局特征;二是提取局部特征。其目的是通过人体的形状轮廓信息获取全局特征。而对局部特征的提取方法,目前主要集中在提取时空兴趣点和动作运动轨迹两个方面。其优点是不易受到噪声和遮挡因素的影响,缺点是对提取的特征点准确性要求较高。下面简单介绍3 类特征提取方法。

特征提取是人体动作识别的一个重要环节,高效、准确地提取特征可极大地提高动作识别率。提取的特征应能反映动作目标之间的可分性,以及较强的独立性和鲁棒性,还能去除冗余特征,保留数据中的重要信息。学者们一般从两个方面进行底层视觉特征的提取:一是提取全局特征;二是提取局部特征。提取全局特征的思路一般是首先进行背景分割,然后对视频中的目标进行检测和定位,最后从整体结构对以目标为中心的兴趣区域进行特性描述。其目的是通过人体的形状轮廓信息获取全局特征。其优点是可提取大量与人体有关的信息,包含丰富的运动特征;缺点是容易受到噪声和视角变化因素的影响。而对局部特征的提取方法,目前主要集中在提取时空兴趣点和动作运动轨迹两个方面。其优点是不易受到噪声和遮挡因素的影响,缺点是对提取的特征点准确性要求较高。下面简单介绍3 类特征提取方法。

(1)形状特征

形状特征是指采用自上而下的方式对目标行为的全局和局部的表观特征进行描述。通常采用的方法有边界质心距离、傅里叶描述子、HOG 特征、SIFT 特征、统计方法及上下文关系等。形状特征不受颜色以及光照变化的影响,具有较好的旋转、位移、尺度不变性,是一种包含了一定语义信息的高层次特征。

(2)运动特征

运动特征是指连续动作序列中目标运动状态变化的一种特征,如运动的方向、速度等。光流法是提取运动特征的一种常用方法。该方法通过计算图像相邻帧之间的像素变化情况来估计运动变化趋势,从而反映视频图像中目标的运动趋势。(www.chuimin.cn)

(3)时空特征

时空特征是指随着时间推演动作在空间中的状态分布信息。首先将视频图像序列处理为一种三维数据,然后提取时空兴趣点、时空立方体或时空形状等特征来描述运动过程人体姿态的时空状态分布信息。

本章主要提取人体动作的边缘形状特征和运动特征,提出加权融合策略来进行人体动作识别。