首页 理论教育基于深度信息的动作识别研究成果

基于深度信息的动作识别研究成果

【摘要】:3D CNNs模型在两种条件下的训练收敛速度如图5.5 所示,对比实验结果见表5.3。使用3D CNNs 模型在SBU-Interaction 数据集上进行动作识别可获得96.76%的平均识别率,通过迁移学习动作识别率可提高到97.42%,充分验证迁移学习在3D CNNs 模型上的可行性和有效性。

机器学习框架的高效性是在满足以下前提条件实现的:首先,需要有大量带有标注信息的训练样本进行网络训练;其次,假设训练数据和测试数据均服从相同分布。但在实际情况中,很难保证上述前提条件。迁移学习[193]成为解决此类问题的一种新方法。通过迁移已训练好的模型或参数解决仅有少量样本数据的学习问题。迁移学习可理解为通过在学习任务过程中已获取的知识提高目标领域中预测函数的学习能力。

基于卷积神经网络的迁移学习是指将经过训练的网络模型或参数,应用到新目标任务数据集上进行二次训练,即网络微调,以获取更高层次的特征。高层特征具有充分的表达能力和泛化能力,可提取隐含在样本中的高层语义信息,进而提高动作识别率。

在SBU-Interaction 数据集上进行迁移学习实验:首先,在MSR-Action3D数据集上进行3D CNNs 模型训练,迁移学习到SBU-Interaction 数据集;然后,在进行网络二次训练时,使用原3D CNNs 模型的权重代替随机权重。3D CNNs模型在两种条件下的训练收敛速度如图5.5 所示,对比实验结果见表5.3。

图5.5 网络训练收敛速度示意图

表5.3 不同识别算法在SBU-Interaction 数据集上的平均识别率对比(www.chuimin.cn)

实验是在以下的环境完成:处理器为Intel Core i7-6700,CPU 为3.40 GHz;RAM 为16 GB,3D CNNs 整个的训练时间为17 126.4 ms,而进行迁移学习的网络训练时间为6 589.3 ms。由实验可知,使用迁移学习可大大减少网络模型的训练时间。使用3D CNNs 模型在SBU-Interaction 数据集上进行动作识别可获得96.76%的平均识别率,通过迁移学习动作识别率可提高到97.42%,充分验证迁移学习在3D CNNs 模型上的可行性和有效性。

实验结论:

①在3D CNNs 模型上进行迁移学习是有效可行的。通过网络参数微调不仅提高了网络训练的收敛速度,还可进一步提高动作识别率。

②将已训练好的模型或参数进行迁移学习,不仅能解决仅有少量样本数据的学习问题,还可获得较好的分类效果。