首页 理论教育不同输入模型对比实验:基于图像深度信息的识别研究

不同输入模型对比实验:基于图像深度信息的识别研究

【摘要】:为了验证张量模型的有效性,采用两种不同输入模型进行对比实验:一种是直接用向量模型作为输入量;另一种是构建张量模型作为输入量。表2.1不同输入模型在MoCap 数据集识别率对比实验过程说明:①实验使用的数据集是Kinect 采集的三维坐标位置信息,选用人体骨架20 个关节点的骨骼模型。实验使用最近邻分类器进行动作分类,动作识别率见表2.1。

选用卡内基梅隆大学公布的动作捕捉数据集(CMU Motion Capture,MoCap)作为实验数据。该数据集包含人与环境以及动作交互的行为,有6 个大类和23 个子类,共2 605 个不同动作。其中,包括一些常见的双人交互动作,如打篮球、跳舞等。本章实验忽略应用场景,仅使用地面真实信息,形成一个独立的动作样本。故本实验使用的动作数据集包含35 类不同动作,每类动作有40 个样本,由20 位受试者各执行两次动作完成,共1 400 个样本。

为了验证张量模型的有效性,采用两种不同输入模型进行对比实验:一种是直接用向量模型作为输入量;另一种是构建张量模型作为输入量。其实验结果见表2.1。

表2.1 不同输入模型在MoCap 数据集识别率对比

实验过程说明:

①实验使用的数据集是Kinect 采集的三维坐标位置信息,选用人体骨架20 个关节点的骨骼模型。因此,本实验上下文点数目从1 ~19 进行选取,当动作识别率趋于稳定时,确定上下文点数目(本实验上下文点数目选择8)。(www.chuimin.cn)

②MPCA 算法每次迭代保留95%的方差信息。实验使用最近邻分类器进行动作分类,动作识别率见表2.1。使用最近邻分类器的原因是本章提出的形状描述子是依据欧氏距离进行特征表示的,并且上下文点的选择是在该点周围最近邻区域进行选择的,故与KNN 分类算法的工作原理相似。

从实验得到以下结论:

①上下文点数目的大小对动作识别率造成很大影响,应在权衡动作识别率和运算复杂度的情况下选取上下文点数目。

②使用向量形状描述子进行特征表示,35 类动作的平均识别率为78.4%,高于其他同类对比算法,证明本章所提出的完整形状描述子在人体动作识别方面,具有一定的可行性和有效性。

③使用张量形状描述子进行特征表示,得到了86.3%的最高平均识别率,不仅高于TCCA 算法76.4%的平均识别率,也高于向量模型作为输入的78.4%的平均识别率,充分说明,张量形状描述子能更好地保留数据结构信息,非常适合处理像骨骼序列这种具有多个维度独立的高维数据,能有效地进行人体动作识别,获得较高的识别率。