表3.1在MoCap 动作序列上提取关键帧从实验可知,本章提出的关键帧提取算法可有效地提取具有代表性的动作序列帧,关键帧序列只占样本序列的2/3 甚至更少,其余的帧均为冗余信息。因此,关键帧提取对减少运算复杂度、提高动作识别率具有重要意义。在关键帧提取实验的基础上,又进行了动作序列的关键轨迹提取实验。......
2023-10-28
实验在MoCap 数据集上进行。该数据集包含35 类不同动作序列,每类动作由20 位受试者各执行两次完成,每类动作序列样本的长度均不同。本实验任选其中一个样本进行算法验证。实验随机选取CMU Motion Capture 动作数据集中的5 类动作,如“Both Arms Pointing to Right Side” “Both Arms Pointing to Left Side” “Basketball Shooting”“Left Arm Receive” “Right Arm Receive”。其实验结果见表3.1。
表3.1 在MoCap 动作序列上提取关键帧
从实验可知,本章提出的关键帧提取算法可有效地提取具有代表性的动作序列帧,关键帧序列只占样本序列的2/3 甚至更少,其余的帧均为冗余信息。因此,关键帧提取对减少运算复杂度、提高动作识别率具有重要意义。
在关键帧提取实验的基础上,又进行了动作序列的关键轨迹提取实验。其实验结果见表3.2。
表3.2 在MoCap 动作序列上提取关键轨迹
通过观察动作样本“Both Arms Pointing to Right Side”的视觉展示图可以发现,该动作序列中具有代表性意义的动作主要由左(右)手、左(右)腕、左(右)肘及左(右)肩8 个关节点完成。而“Left Arm Receive”动作序列,仅由左手、左腕、左肘及左肩4 个关节点完成。动作样本“Both Arms Pointing to Right Side”的关键轨迹视觉展示如图3.2 所示。(www.chuimin.cn)
图3.2 “Both Arms Pointing to Right Side”关键轨迹示意图
从以上两个实验可得出以下结论:
①基于空间曲面概念设计的关键帧提取算法具有一定的可行性和有效性,弥补了单一曲率特性的局限性。
②利用空间曲度概念可检测简单的动作起止点。例如,样本“Both Arms Pointing to Right Side”的前50 帧没有动作,即前50 帧动作轨迹曲线无突变状态,动作结束后30 帧,轨迹曲线也没有突变状态,而动作的起止点处均应存在曲率变化。因此,可简单地对动作起止点作出判断。
③为了保证动作的连贯性和细节的准确性,数据采集一般采用高频采样方式。因此从动作视觉图上可清晰看到大量的相似动作。但是,使用空间曲度概念设计的关键帧提取算法无法对相似动作进行有效区分,针对该问题需要进一步改进算法,如增加相似度判定准则,进一步简化关键帧的帧数等。
有关基于图像深度信息的人体动作识别研究的文章
表3.1在MoCap 动作序列上提取关键帧从实验可知,本章提出的关键帧提取算法可有效地提取具有代表性的动作序列帧,关键帧序列只占样本序列的2/3 甚至更少,其余的帧均为冗余信息。因此,关键帧提取对减少运算复杂度、提高动作识别率具有重要意义。在关键帧提取实验的基础上,又进行了动作序列的关键轨迹提取实验。......
2023-10-28
表2.2不同识别算法在MSR-Action3D 数据集识别率对比图2.6在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。......
2023-10-28
针对上述噪声,本章引入高斯核函数进行滤波处理。同时,高斯核函数还具有单瓣频谱特性,对噪声具有很好的抑制作用。同样,为了获取紧凑的运动特征和更好的传输不变性,实验使用Max-pooling 技术进行下采样,归一化处理,形成向量Sm。......
2023-10-28
由于人体动作的多样性和周边环境的复杂性,使人体动作识别充满了挑战。人体动作识别最初的研究都是基于RGB 视频图像序列,许多学者分别从静态特征、动态特征和时空特征3 个方面对该领域的工作进行了总结[1-4]。虽然基于RGB 视频图像序列的动作识别研究取得了较好的成果,但因其复杂背景、相机视角、光照变化以及遮挡等问题,人体动作识别研究仍然存在诸多挑战。......
2023-10-28
最初,人体动作识别主要是以RGB 视频图像为研究对象,经过多年的努力,人体动作识别技术已取得了较快的发展。本书使用Kinect 传感器采集人体动作的深度图像信息,探讨人体动作识别的相关理论和技术难点,着重研究如何消除可能对识别结果造成的干扰因素,提高人体动作识别的鲁棒性与普适性。......
2023-10-28
下面简单介绍大部分可公开获取的RGB-D 动作行为数据集。目前有3类人体动作行为数据集,即单视角动作行为数据集、多视角动作行为数据集和双人/多人交互动作行为数据集。单视角动作行为数据集MSR-Action3D[30]数据集是微软研究院2010 年公开的RGB-D 单视角行为数据集。10 个受试者共320 个样本。UTKinect[31]行为数据集是得克萨斯大学2012 年公布的。UTD-MHAD[88]行为数据集是由得克萨斯大学2015 年公布的。8 个受试者每个动作执行4 次。......
2023-10-28
图4.1双人交互动作示意图该数据集包含RGB 视频图像、深度图像和骨骼深度信息3 种类型,提供7 位受试者两两组合形成的21 组数据,执行8 类不同的交互动作行为。表4.1同类识别算法对比的平均识别率图4.2在SBU 数据集上基于RGB 图像识别率93.8%的混淆矩阵示意图图4.3在SBU 数据集上基于深度图像识别率98.4%的混淆矩阵示意图实验结论:①基于深度图像数据进行交互动作识别得到的平均识别率为98.4%,高于基于RGB 视频图像序列进行识别的93.8%平均识别率。......
2023-10-28
深度传感器Kinect 采集的深度图像与实时采集的骨骼模型深度信息相比,更能直观和完整地描述动作形状特征以及动态特征。图1.2深度传感器Kinect 采集的图像类型基于深度图像提取的特征主要包括全局特征和局部特征。基于深度图像的局部特征提取方法是人体动作识别领域中的一个研究热点。除了上述常用的人体动作识别研究方法外,还有另外一种研究方法,即将图像序列转换为3D 点云序列数据进行动作识别。......
2023-10-28
相关推荐