首页 理论教育边缘特征提取在基于图像深度信息的人体动作识别中的作用

边缘特征提取在基于图像深度信息的人体动作识别中的作用

【摘要】:Gabor 滤波器还可通过设置不同的参数,构造出多通道滤波器,可提取不同方向多个尺度的图像特征,提取的图像特征具有光照变化不敏感和旋转不变性等特性。因此,本章选用Gabor 变换进行边缘形状特征的提取。同时,高频分量部分表达能力不足,带宽受到一定限制,影响特征的提取效果,在一定程度上无法反映图像的真实性。使用Log-Gabor 滤波器对图像进行边缘特征提取相当于一次卷积运算过程。

Gabor 变换具有与生物视觉系统相近的特点,其空间形状与人眼的视觉感知区域有着相似的轮廓,对时域和空域有很好的分辨率,尤其对图像的边缘较为敏感,能准确地对其进行描述。Gabor 滤波器还可通过设置不同的参数,构造出多通道滤波器,可提取不同方向多个尺度的图像特征,提取的图像特征具有光照变化不敏感和旋转不变性等特性。因此,本章选用Gabor 变换进行边缘形状特征的提取。

假定图像为f(x,y),二维Gabor 小波变换为

其中,p 和q 分别为图像中像素点位置;m 和l 分别为Gabor 小波变换的尺度和方向。Gabor 滤波器是一个带通滤波器,响应函数为

其中,σx和σy分别表示在x 轴和y 轴上的标准差;u 和v 分别为Gabor 滤波器的中心频率分量。假定u0为Gabor 滤波器的中心频率,θ 为方向,则有

Gabor 滤波器响应函数的傅里叶变换

其中,σu和σv是信号的带宽,分别为

Gabor 滤波器响应函数是一个复函数,其实部可表示为

虚部可表示为

观察上述关系式,Gabor 滤波器响应函数的实部和虚部在相位上相差90°,并且实部为偶函数,虚部为奇函数。这样,就可将空域和频域中的信号进行最优定位。通过改变m 和l 的取值,可设计一组方向和尺度不同的Gabor滤波器,从而获取多尺度、多方向的特性。但是,Gabor 滤波器的实部是一个偶对称函数,当中心频率较低,带宽不够窄时,两个高斯函数的末端就会发生交叠,导致在频域中出现一个直流分量。同时,高频分量部分表达能力不足,带宽受到一定限制,影响特征的提取效果,在一定程度上无法反映图像的真实性。

针对Gabor 滤波器的缺陷,本章引入了Log-Gabor 滤波器[177],表达式(一维线性尺度)为

其中,u0表示中心频率;k 表示滤波器带宽。(www.chuimin.cn)

二维Log-Gabor 的定义为

其中,θ 为二维Log-Gabor 滤波器方向角度;u0为中心频率;k 为该滤波器在u1方向带宽的调控参数;σv为滤波器在v1方向带宽的调控。

Log-Gabor 滤波器不仅继承了Gabor 滤波器多通道、多分辨率的优点,同时还克服了Gabor 滤波器的缺点,具有以下特性:

①Log-Gabor 滤波器的函数不会再产生直流分量,带宽也将不再受限,可更灵活地进行多通道滤波器组设计。

②Log-Gabor 滤波器的传递函数在高频分量部分较Gabor 滤波器的传递函数多出一个额外部分,能弥补对高频分量表达不足的缺点。

③Log-Gabor 滤波器覆盖的频率范围更大,较少的滤波器组可大大减少高维数据的运算量。

对数频率尺度上的Gabor 滤波器是一个具有对数性质的非线性系统,符合人类的视觉系统。因此,使用Log-Gabor 滤波器能更有效地对图像进行编码。

使用Log-Gabor 滤波器对图像进行边缘特征提取相当于一次卷积运算过程。假定一幅图像I(x,y),则存在

其中,φ u,v(x,y) 表示通过Log-Gabor 滤波器提取的特征,LGu,v(x,y) 滤波器中的u 表示尺度;v 表示方向,⊗表示卷积运算符。