表4.2同类识别算法对比的平均识别率图4.4在MSRActionPairs 数据集上平均识别率91.5%的混淆矩阵示意图实验结论:①基于人物交互相似动作识别,本章提出的基于深度图像的多特征融合算法能达到91.5%的平均识别率,充分验证基于交互动作整体结构的识别算法在相似“动作对”中具有较好的辨识性和有效性。......
2023-10-28
Gabor 变换具有与生物视觉系统相近的特点,其空间形状与人眼的视觉感知区域有着相似的轮廓,对时域和空域有很好的分辨率,尤其对图像的边缘较为敏感,能准确地对其进行描述。Gabor 滤波器还可通过设置不同的参数,构造出多通道滤波器,可提取不同方向多个尺度的图像特征,提取的图像特征具有光照变化不敏感和旋转不变性等特性。因此,本章选用Gabor 变换进行边缘形状特征的提取。
假定图像为f(x,y),二维Gabor 小波变换为
其中,p 和q 分别为图像中像素点位置;m 和l 分别为Gabor 小波变换的尺度和方向。Gabor 滤波器是一个带通滤波器,响应函数为
其中,σx和σy分别表示在x 轴和y 轴上的标准差;u 和v 分别为Gabor 滤波器的中心频率分量。假定u0为Gabor 滤波器的中心频率,θ 为方向,则有
Gabor 滤波器响应函数的傅里叶变换为
其中,σu和σv是信号的带宽,分别为
Gabor 滤波器响应函数是一个复函数,其实部可表示为
虚部可表示为
观察上述关系式,Gabor 滤波器响应函数的实部和虚部在相位上相差90°,并且实部为偶函数,虚部为奇函数。这样,就可将空域和频域中的信号进行最优定位。通过改变m 和l 的取值,可设计一组方向和尺度不同的Gabor滤波器,从而获取多尺度、多方向的特性。但是,Gabor 滤波器的实部是一个偶对称函数,当中心频率较低,带宽不够窄时,两个高斯函数的末端就会发生交叠,导致在频域中出现一个直流分量。同时,高频分量部分表达能力不足,带宽受到一定限制,影响特征的提取效果,在一定程度上无法反映图像的真实性。
针对Gabor 滤波器的缺陷,本章引入了Log-Gabor 滤波器[177],表达式(一维线性尺度)为
其中,u0表示中心频率;k 表示滤波器带宽。(www.chuimin.cn)
二维Log-Gabor 的定义为
其中,θ 为二维Log-Gabor 滤波器方向角度;u0为中心频率;k 为该滤波器在u1方向带宽的调控参数;σv为滤波器在v1方向带宽的调控。
Log-Gabor 滤波器不仅继承了Gabor 滤波器多通道、多分辨率的优点,同时还克服了Gabor 滤波器的缺点,具有以下特性:
①Log-Gabor 滤波器的函数不会再产生直流分量,带宽也将不再受限,可更灵活地进行多通道滤波器组设计。
②Log-Gabor 滤波器的传递函数在高频分量部分较Gabor 滤波器的传递函数多出一个额外部分,能弥补对高频分量表达不足的缺点。
③Log-Gabor 滤波器覆盖的频率范围更大,较少的滤波器组可大大减少高维数据的运算量。
对数频率尺度上的Gabor 滤波器是一个具有对数性质的非线性系统,符合人类的视觉系统。因此,使用Log-Gabor 滤波器能更有效地对图像进行编码。
使用Log-Gabor 滤波器对图像进行边缘特征提取相当于一次卷积运算过程。假定一幅图像I(x,y),则存在
其中,φ u,v(x,y) 表示通过Log-Gabor 滤波器提取的特征,LGu,v(x,y) 滤波器中的u 表示尺度;v 表示方向,⊗表示卷积运算符。
有关基于图像深度信息的人体动作识别研究的文章
表4.2同类识别算法对比的平均识别率图4.4在MSRActionPairs 数据集上平均识别率91.5%的混淆矩阵示意图实验结论:①基于人物交互相似动作识别,本章提出的基于深度图像的多特征融合算法能达到91.5%的平均识别率,充分验证基于交互动作整体结构的识别算法在相似“动作对”中具有较好的辨识性和有效性。......
2023-10-28
由于人体动作的多样性和周边环境的复杂性,使人体动作识别充满了挑战。人体动作识别最初的研究都是基于RGB 视频图像序列,许多学者分别从静态特征、动态特征和时空特征3 个方面对该领域的工作进行了总结[1-4]。虽然基于RGB 视频图像序列的动作识别研究取得了较好的成果,但因其复杂背景、相机视角、光照变化以及遮挡等问题,人体动作识别研究仍然存在诸多挑战。......
2023-10-28
特征提取是人体动作识别的一个重要环节,高效、准确地提取特征可极大地提高动作识别率。学者们一般从两个方面进行底层视觉特征的提取:一是提取全局特征;二是提取局部特征。其目的是通过人体的形状轮廓信息获取全局特征。而对局部特征的提取方法,目前主要集中在提取时空兴趣点和动作运动轨迹两个方面。其优点是不易受到噪声和遮挡因素的影响,缺点是对提取的特征点准确性要求较高。下面简单介绍3 类特征提取方法。......
2023-10-28
下面简单介绍大部分可公开获取的RGB-D 动作行为数据集。目前有3类人体动作行为数据集,即单视角动作行为数据集、多视角动作行为数据集和双人/多人交互动作行为数据集。单视角动作行为数据集MSR-Action3D[30]数据集是微软研究院2010 年公开的RGB-D 单视角行为数据集。10 个受试者共320 个样本。UTKinect[31]行为数据集是得克萨斯大学2012 年公布的。UTD-MHAD[88]行为数据集是由得克萨斯大学2015 年公布的。8 个受试者每个动作执行4 次。......
2023-10-28
最初,人体动作识别主要是以RGB 视频图像为研究对象,经过多年的努力,人体动作识别技术已取得了较快的发展。本书使用Kinect 传感器采集人体动作的深度图像信息,探讨人体动作识别的相关理论和技术难点,着重研究如何消除可能对识别结果造成的干扰因素,提高人体动作识别的鲁棒性与普适性。......
2023-10-28
表2.2不同识别算法在MSR-Action3D 数据集识别率对比图2.6在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。......
2023-10-28
深度传感器Kinect 采集的深度图像与实时采集的骨骼模型深度信息相比,更能直观和完整地描述动作形状特征以及动态特征。图1.2深度传感器Kinect 采集的图像类型基于深度图像提取的特征主要包括全局特征和局部特征。基于深度图像的局部特征提取方法是人体动作识别领域中的一个研究热点。除了上述常用的人体动作识别研究方法外,还有另外一种研究方法,即将图像序列转换为3D 点云序列数据进行动作识别。......
2023-10-28
卷积神经网络的这种局部连接、权值共享结构使其布局更接近于实际生物神经网络。②卷积神经网络引入多种形式的池化操作,可对特征提取过程产生的局部相似视觉特征、局部结构的尺度差异,甚至对局部几何畸变起到抑制作用,较好地保持了旋转、尺度和缩放不变性,能得到更加鲁棒的特征描述。更为关键的是,卷积神经网络在每一个神经元节点使用相同的连接权值,可更有效地捕获图像不同部位的同类型视觉特征。......
2023-10-28
相关推荐