由于人体动作的多样性和周边环境的复杂性,使人体动作识别充满了挑战。人体动作识别最初的研究都是基于RGB 视频图像序列,许多学者分别从静态特征、动态特征和时空特征3 个方面对该领域的工作进行了总结[1-4]。虽然基于RGB 视频图像序列的动作识别研究取得了较好的成果,但因其复杂背景、相机视角、光照变化以及遮挡等问题,人体动作识别研究仍然存在诸多挑战。......
2023-10-28
人体动作数据是一个具有时序特性的高维度数据,传感器的高频采样方式导致动作数据中存在大量冗余信息,为了能更好地提高数据的有效使用性和动作识别率,需要提取具有代表性动作姿态的关键帧。如何对人体动作数据进行关键帧提取,国内外学者提出了不同处理方法,主要分为以下4 类:
(1)基于聚类方法
聚类方法是一种根据样本相似度进行归类的方法。Liu 等[139]提出一种基于内容的三维动作检索算法,采用最近邻规则的动态聚类算法对动作数据集进行分割,构建动作类型索引树,通过样本和数据集子库的相似度匹配,从而提取动作关键帧。Bulut 等[140]提出使用聚类方法进行关键帧提取,首先在运动曲线中寻找显著性明显的动作帧作为重要帧,然后通过阈值选取法进行关键帧提取并进行聚类。Halit 等[141]提出一种从动作序列中自动提取关键帧方法,将输入的动作序列作为运动曲线处理,提取曲线中运动性显著部分,并使用帧消减方法提取重要帧作为动作关键帧。Nie 等[141]根据人体动作感知的特点,提出一个基于动作变化点提取关键帧的算法框架,其中引入极值搜索算法进行动作变化点获取,对获取的动作变化点进行聚类,提取对应的关键帧。Wang 等[143]以动作的能量信息作为动作行为相似性准则,提出一种时间序列分割方法,首先将动作视频分割为各种单元动作,然后根据相似能量信息将单元动作合并、分组,提取各分组中最大能量信息范围内的重要帧,重新组织获取动作序列关键帧。Zhao 等[144]提出一种基于关节点三维空间距离的X-means 聚类算法,首先通过描述动作姿态与特定关节点的空间距离提取候选关键帧,然后采用时间约束X-means 算法对姿态序列进行聚类和滤波,从而获取动作序列关键帧。聚类的方法主要利用了动作之间的相似度判决,基于该算法提取的关键帧可很好地保持动作的真实性,但忽略了样本之间的时序相关性。
(2)基于曲线简化方法
曲线简化的定义是将采集到的运动轨迹点三维坐标信息按照时序进行连接,形成表示动作行为的一条运动轨迹曲线,通过提取运动轨迹曲线特征进行关键帧提取。Shao 等[145]通过计算动作序列的帧内和帧间运动直方图,提出一种关键帧提取算法,首先对每个视频帧进行运动直方图分析,获取熵曲线中的峰值,其次通过显著性判决对峰值熵进行加权,最后通过直方图交集部分,提取动作关键帧。Zhou 等[146]采用骨架关节点之间夹角信息描述动作序列中每个动作片段的动作特征,并根据夹角特性进行关键帧提取。Zhang等[147]提出一种基于曲线振幅提取动作序列关键帧的方法,首先选择一组联合距离特征进行动作表示,采用主成分分析方法获取主成分分量,求取特征曲线,然后通过提取曲线中局部最优点获取初始关键帧,最后通过合并基于曲线幅度提取的关键帧获得最终关键帧。Lim 等[148]将运动轨迹曲线上动作开始的第一个轨迹点和动作结束时的轨迹点进行连接,依次求取轨迹曲线上所有轨迹点到该直线的距离,选取最大距离的轨迹点作为关键帧分割点,直至满足设定误差为止,确定的各个分割点就是要提取的动作序列关键帧。许多学者根据曲线简化的定义,相继又提出许多优化算法,如分层曲线简化算法、曲线特征算法等。Kabir 等[149]提出一种通过分析帧和帧之间动作积累最大化进行关键帧提取的方法,首先计算两个骨骼关节点之间距离,提出自相似矩阵,然后根据自相似矩阵确定一个代价函数,表示帧之间的运动积累量,最后把运动积累最大值的点作为分割点进行分割,重复该操作多次,重新组织各个分割点形成最终的关键帧序列。Ji 等[150]提出一种使用t-SNE 算法进行关键帧提取的方法,首先通过改变t-SNE 的函数宽度参数,获取动作序列的低维特征曲线,然后分别求取特征曲线的局部最大值和局部最小值作为初始关键帧,最后根据曲线幅度的计算方法提取关键帧序列。曲线简化方法虽然能有效地概括人体动作,但容易忽略动作的局部细节特征,不能有效地控制三维空间中骨架关节点位置,对相似度极高且复杂的动作很难保证其动作之间的一致性。
(3)基于帧消减方法(www.chuimin.cn)
帧消减方法就是去除在动作序列中无意义的动作帧,从而保留有代表性意义关键帧。Togawa 等[151]提出一种基于骨架关节点位置的关键帧检测方案,根据骨架关节点的三维位置坐标信息,逐个求出相邻帧之间的位置差,给定一个度量因子,去除位置差最小的帧,将符合要求的剩余帧作为动作序列关键帧。Liu 等[152]提出一种基于镜头级别的帧和帧之间差异性进行关键帧提取方法,首先在镜头级别选择一组候选关键帧,然后使用视频镜头内和镜头之间的信息过滤候选集,最后提取符合要求的动作帧作为动作序列关键帧。蔡美玲等[153]提出基于重建误差最优化方法进行关键帧提取。该方法首先设定误差阈值,然后结合预选策略,去除不满足条件的动作帧,重新组织保留的动作帧,形成动作序列关键帧。
(4)基于智能优化算法
智能优化算法是利用现有一些特征选择算法进行人体动作关键帧提取。Liu 等[154]使用遗传算法结合概率模型进行关键帧提取,首先通过骨架关节点位置和速度的加权差异计算原始动作与重建动作之间的重构误差,根据最小重构误差以及最优压缩率概念定义一个适应度函数,求取最大适应度值,然后以此为目标进行最优搜索,通过对随机生成的初始种群进行迭代,提取最优动作关键帧集合。杨涛等[155]应用量子粒子群优化算法提取动作关键帧,首先计算原始动作与重构动作帧和帧之间的距离,然后根据距离值确定一个重构误差,最后使用重构误差和关键帧数目定义一个目标函数,采用有序整数编码方式进行关键帧提取。有些学者使用Fisher score[156]和Laplacian score两个高效的特征选择方法进行关键帧提取,也有一些学者使用如蚁群算法、萤火虫算法等其他优化算法。Zhang 等[156]在粒子群算法中加入异步学习因子,提出一种新颖的动作序列关键帧提取方法,首先初始化一系列关键帧粒子,然后通过异步学习因子搜索全局最优值,最后根据压缩比和重构误差率计算适应度函数,获取最佳动作序列关键帧集合。
上述介绍的关键帧提取方法各有其优缺点:帧消减方法容易忽略动作的边界帧,未考虑被消减帧和关键帧之间存在的相关性;聚类方法虽然能很好地获取代表性关键帧,但其算法太复杂,导致运算复杂度非常高;智能优化算法也取得了不错的效果,但其优化算法收敛速度太慢,容易出现抖动现象,影响后续识别结果的稳定性,不适合分割包含多帧动作数据视频的关键帧提取;曲线简化方法是以运动轨迹为研究对象,更适合提取以动作概括能力为目标的关键帧,缺点就是阈值设置对后续动作识别具有一定的影响。
有关基于图像深度信息的人体动作识别研究的文章
由于人体动作的多样性和周边环境的复杂性,使人体动作识别充满了挑战。人体动作识别最初的研究都是基于RGB 视频图像序列,许多学者分别从静态特征、动态特征和时空特征3 个方面对该领域的工作进行了总结[1-4]。虽然基于RGB 视频图像序列的动作识别研究取得了较好的成果,但因其复杂背景、相机视角、光照变化以及遮挡等问题,人体动作识别研究仍然存在诸多挑战。......
2023-10-28
最初,人体动作识别主要是以RGB 视频图像为研究对象,经过多年的努力,人体动作识别技术已取得了较快的发展。本书使用Kinect 传感器采集人体动作的深度图像信息,探讨人体动作识别的相关理论和技术难点,着重研究如何消除可能对识别结果造成的干扰因素,提高人体动作识别的鲁棒性与普适性。......
2023-10-28
下面简单介绍大部分可公开获取的RGB-D 动作行为数据集。目前有3类人体动作行为数据集,即单视角动作行为数据集、多视角动作行为数据集和双人/多人交互动作行为数据集。单视角动作行为数据集MSR-Action3D[30]数据集是微软研究院2010 年公开的RGB-D 单视角行为数据集。10 个受试者共320 个样本。UTKinect[31]行为数据集是得克萨斯大学2012 年公布的。UTD-MHAD[88]行为数据集是由得克萨斯大学2015 年公布的。8 个受试者每个动作执行4 次。......
2023-10-28
表4.2同类识别算法对比的平均识别率图4.4在MSRActionPairs 数据集上平均识别率91.5%的混淆矩阵示意图实验结论:①基于人物交互相似动作识别,本章提出的基于深度图像的多特征融合算法能达到91.5%的平均识别率,充分验证基于交互动作整体结构的识别算法在相似“动作对”中具有较好的辨识性和有效性。......
2023-10-28
深度传感器Kinect 采集的深度图像与实时采集的骨骼模型深度信息相比,更能直观和完整地描述动作形状特征以及动态特征。图1.2深度传感器Kinect 采集的图像类型基于深度图像提取的特征主要包括全局特征和局部特征。基于深度图像的局部特征提取方法是人体动作识别领域中的一个研究热点。除了上述常用的人体动作识别研究方法外,还有另外一种研究方法,即将图像序列转换为3D 点云序列数据进行动作识别。......
2023-10-28
Gabor 滤波器还可通过设置不同的参数,构造出多通道滤波器,可提取不同方向多个尺度的图像特征,提取的图像特征具有光照变化不敏感和旋转不变性等特性。因此,本章选用Gabor 变换进行边缘形状特征的提取。同时,高频分量部分表达能力不足,带宽受到一定限制,影响特征的提取效果,在一定程度上无法反映图像的真实性。使用Log-Gabor 滤波器对图像进行边缘特征提取相当于一次卷积运算过程。......
2023-10-28
针对上述噪声,本章引入高斯核函数进行滤波处理。同时,高斯核函数还具有单瓣频谱特性,对噪声具有很好的抑制作用。同样,为了获取紧凑的运动特征和更好的传输不变性,实验使用Max-pooling 技术进行下采样,归一化处理,形成向量Sm。......
2023-10-28
特征提取是人体动作识别的一个重要环节,高效、准确地提取特征可极大地提高动作识别率。学者们一般从两个方面进行底层视觉特征的提取:一是提取全局特征;二是提取局部特征。其目的是通过人体的形状轮廓信息获取全局特征。而对局部特征的提取方法,目前主要集中在提取时空兴趣点和动作运动轨迹两个方面。其优点是不易受到噪声和遮挡因素的影响,缺点是对提取的特征点准确性要求较高。下面简单介绍3 类特征提取方法。......
2023-10-28
相关推荐