表2.2不同识别算法在MSR-Action3D 数据集识别率对比图2.6在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。......
2023-10-28
机器学习框架的高效性是在满足以下前提条件实现的:首先,需要有大量带有标注信息的训练样本进行网络训练;其次,假设训练数据和测试数据均服从相同分布。但在实际情况中,很难保证上述前提条件。迁移学习[193]成为解决此类问题的一种新方法。通过迁移已训练好的模型或参数解决仅有少量样本数据的学习问题。迁移学习可理解为通过在学习任务过程中已获取的知识提高目标领域中预测函数的学习能力。
基于卷积神经网络的迁移学习是指将经过训练的网络模型或参数,应用到新目标任务数据集上进行二次训练,即网络微调,以获取更高层次的特征。高层特征具有充分的表达能力和泛化能力,可提取隐含在样本中的高层语义信息,进而提高动作识别率。
在SBU-Interaction 数据集上进行迁移学习实验:首先,在MSR-Action3D数据集上进行3D CNNs 模型训练,迁移学习到SBU-Interaction 数据集;然后,在进行网络二次训练时,使用原3D CNNs 模型的权重代替随机权重。3D CNNs模型在两种条件下的训练收敛速度如图5.5 所示,对比实验结果见表5.3。
图5.5 网络训练收敛速度示意图
表5.3 不同识别算法在SBU-Interaction 数据集上的平均识别率对比(www.chuimin.cn)
实验是在以下的环境完成:处理器为Intel Core i7-6700,CPU 为3.40 GHz;RAM 为16 GB,3D CNNs 整个的训练时间为17 126.4 ms,而进行迁移学习的网络训练时间为6 589.3 ms。由实验可知,使用迁移学习可大大减少网络模型的训练时间。使用3D CNNs 模型在SBU-Interaction 数据集上进行动作识别可获得96.76%的平均识别率,通过迁移学习动作识别率可提高到97.42%,充分验证迁移学习在3D CNNs 模型上的可行性和有效性。
实验结论:
①在3D CNNs 模型上进行迁移学习是有效可行的。通过网络参数微调不仅提高了网络训练的收敛速度,还可进一步提高动作识别率。
②将已训练好的模型或参数进行迁移学习,不仅能解决仅有少量样本数据的学习问题,还可获得较好的分类效果。
有关基于图像深度信息的人体动作识别研究的文章
表2.2不同识别算法在MSR-Action3D 数据集识别率对比图2.6在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。......
2023-10-28
最初,人体动作识别主要是以RGB 视频图像为研究对象,经过多年的努力,人体动作识别技术已取得了较快的发展。本书使用Kinect 传感器采集人体动作的深度图像信息,探讨人体动作识别的相关理论和技术难点,着重研究如何消除可能对识别结果造成的干扰因素,提高人体动作识别的鲁棒性与普适性。......
2023-10-28
由于人体动作的多样性和周边环境的复杂性,使人体动作识别充满了挑战。人体动作识别最初的研究都是基于RGB 视频图像序列,许多学者分别从静态特征、动态特征和时空特征3 个方面对该领域的工作进行了总结[1-4]。虽然基于RGB 视频图像序列的动作识别研究取得了较好的成果,但因其复杂背景、相机视角、光照变化以及遮挡等问题,人体动作识别研究仍然存在诸多挑战。......
2023-10-28
表4.2同类识别算法对比的平均识别率图4.4在MSRActionPairs 数据集上平均识别率91.5%的混淆矩阵示意图实验结论:①基于人物交互相似动作识别,本章提出的基于深度图像的多特征融合算法能达到91.5%的平均识别率,充分验证基于交互动作整体结构的识别算法在相似“动作对”中具有较好的辨识性和有效性。......
2023-10-28
下面简单介绍大部分可公开获取的RGB-D 动作行为数据集。目前有3类人体动作行为数据集,即单视角动作行为数据集、多视角动作行为数据集和双人/多人交互动作行为数据集。单视角动作行为数据集MSR-Action3D[30]数据集是微软研究院2010 年公开的RGB-D 单视角行为数据集。10 个受试者共320 个样本。UTKinect[31]行为数据集是得克萨斯大学2012 年公布的。UTD-MHAD[88]行为数据集是由得克萨斯大学2015 年公布的。8 个受试者每个动作执行4 次。......
2023-10-28
特征提取是人体动作识别的一个重要环节,高效、准确地提取特征可极大地提高动作识别率。学者们一般从两个方面进行底层视觉特征的提取:一是提取全局特征;二是提取局部特征。其目的是通过人体的形状轮廓信息获取全局特征。而对局部特征的提取方法,目前主要集中在提取时空兴趣点和动作运动轨迹两个方面。其优点是不易受到噪声和遮挡因素的影响,缺点是对提取的特征点准确性要求较高。下面简单介绍3 类特征提取方法。......
2023-10-28
图4.1双人交互动作示意图该数据集包含RGB 视频图像、深度图像和骨骼深度信息3 种类型,提供7 位受试者两两组合形成的21 组数据,执行8 类不同的交互动作行为。表4.1同类识别算法对比的平均识别率图4.2在SBU 数据集上基于RGB 图像识别率93.8%的混淆矩阵示意图图4.3在SBU 数据集上基于深度图像识别率98.4%的混淆矩阵示意图实验结论:①基于深度图像数据进行交互动作识别得到的平均识别率为98.4%,高于基于RGB 视频图像序列进行识别的93.8%平均识别率。......
2023-10-28
深度传感器Kinect 采集的深度图像与实时采集的骨骼模型深度信息相比,更能直观和完整地描述动作形状特征以及动态特征。图1.2深度传感器Kinect 采集的图像类型基于深度图像提取的特征主要包括全局特征和局部特征。基于深度图像的局部特征提取方法是人体动作识别领域中的一个研究热点。除了上述常用的人体动作识别研究方法外,还有另外一种研究方法,即将图像序列转换为3D 点云序列数据进行动作识别。......
2023-10-28
相关推荐