首页 理论教育基于图像深度信息的动作识别实验结果

基于图像深度信息的动作识别实验结果

【摘要】:表2.2不同识别算法在MSR-Action3D 数据集识别率对比图2.6在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。

该实验在两个公开的动作行为数据集上进行,验证本章所述方法的可行性,并与其他同类算法进行对比。实验选用的数据集均为Kinect 采集的20 个骨架关节点的骨骼模型。第一个数据集是微软研究院公开的MSR-Action3D数据集[30],10 位受试者执行20 类不同动作。对比的同类算法包括Actionlet整体模型[37]、HON4D[68]、深度运动映射(Depth Motion Map,DMM)[57]、最长公共相似子序列[135]及Profile HMM[136]。使用最近邻分类器进行动作分类,其实验结果见表2.2,识别率相应混淆矩阵如图2.6 所示。

表2.2 不同识别算法在MSR-Action3D 数据集识别率对比

图2.6 在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图

第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。它由30 位受试者执行12 类动作,包括6 个标志性动作(crouch,put goggle,shoot pistol,throw object,change weapon,kick)和6 个隐喻性动作(start system,push right,wind it up,bow,had enough,beat both),共计594 个动作序列。对比的同类算法包括Actionlet 整体模型[37]、HON4D[68]、DMM[57]和Offset Position[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。

表2.3 不同识别算法在MSRC-12 数据集识别率对比(www.chuimin.cn)

图2.7 在MSRC-12 数据集上识别率93.3%的混淆矩阵示意图

实验结论:

①从上述两个实验可以看出,本章算法在MSR-Action3D 数据集上实现了90.5%的最高平均识别率,在MSRC-12 数据集上实现了93.3%的最高平均识别率,充分说明本章提出的张量形状描述子较其他的特征表示方法能更好地描述动作序列的特征。

②本章提出的多线性主成分规整(Multi-linear Principal Component Warping,MPCW)算法不仅弥补了张量模型无法进行时域对齐的问题,而且还解决了在大量数据情况下动态时间规整无法寻到最优规整路径的问题。实验结果表明,该框架比现有同类算法具有更好的性能。张量运算的引入不仅避免了将矩阵拉伸到向量空间丢失结构信息的问题,而且还避免了构造大容量协方差矩阵的问题,极大地降低了运算复杂度