首页 理论教育特征区域描述研究现状分析

特征区域描述研究现状分析

【摘要】:在图像中检测出不同的特征区域之后,需要使用一种更适合于计算机进一步处理的形式,对得到的区域像素集进行表示和描述。显然,一般局部特征区域的外部特性不具有区分性,只能通过其内部特性来表示。常用的局部特征描述子都是基于选定的表示方式,将特征区域描述为向量的形式,又称特征向量。

在图像中检测出不同的特征区域之后,需要使用一种更适合于计算机进一步处理的形式,对得到的区域像素集进行表示和描述。基本上,表示一个区域包括两种选择:用其外部特性来表示区域(如区域的边界);用其内部特性来表示区域(如组成区域的像素)[8]。显然,一般局部特征区域的外部特性不具有区分性,只能通过其内部特性来表示。

常用的局部特征描述子都是基于选定的表示方式,将特征区域描述为向量的形式,又称特征向量。这些特征描述子一方面要充分体现出不同目标的差异,又要易于计算局部特征之间的相似度,还要对背景噪声和目标姿态的变化具有鲁棒性。Mikolajczyk[156]将局部特征描述子从技术应用角度分为四大类:基于分布的描述子、基于空间频率技术的描述子、差分描述子和其他描述子。

1.基于分布的描述子

这类描述子主要利用直方图来描述不同的外观或形状特征。一种最简单的描述子就是用灰度直方图来描述区域中像素点的强度分布;在亮度变化的情况下,使用区域灰度级直方图的统计矩[8]效果更好,但它的应用局限于对纹理图像的描述;SI(Spin Image)[157]通过对围绕着区域中心点的5个环分别统计灰度值,使得描述子对亮度变化、旋转变化不敏感;Lowe[146]提出的SIFT(Scale In-variant Feature Transform)描述子是通过DoG检测子和梯度方向直方图获得每个关键点的位置、尺度和方向信息,并利用坐标轴旋转、多种子点联合描述、向量长度归一化等技术消除了旋转、光照和尺度变化等因素的影响,该描述子适用范围广、运算速度快、鲁棒性强;GH(Geometric Histogram)[158]和SC[138]描述子的主要思想与SIFT描述子类似,只是它们描述的是区域内边缘的分布,主要应用于边缘特征比较明显、稳定的图像;PCA-SIFT[159]和GLOH(Gradient Loca-tion Orientation Histograms)[156]描述子都是对SIFT描述子的扩展,它们在区域和梯度方向上采用了不同的描述精度,并用主分量分析对特征向量进行降维处理,进一步增强了描述子的鲁棒性和区分度。

2.基于空间频率技术的描述子

这类方法的优势在于,通过用频域技术对图像进行描述和处理,可以充分利用频率成分和图像外观之间的对应关系。但最初的傅里叶变换是将图像信号转化为无限域的基函数,而且像素点之间的空间关系是不明确的,这极不适用于局部特征。Gabor滤波器和小波变换则克服了上述缺陷,被广泛应用于纹理图像的分类和识别中。Papageorgiou[160]、Mohan[161]和Viola[3]等人将图像由空间域映射到频域,采用类似于Haar小波的频谱方法表示图像区域,结合支持向量机和核方法,实现了行人、人脸和汽车等目标的检测与识别。

3.差分描述子

一系列的图像导数也可以用来描述一个点附近的区域特征。Koenderink和Doorn[162]就提出了用差分计算来获取导数的近似,并得到了local jet描述子;此后,Florack等人[163]又改进了该描述子,使其具有旋转不变性;Freeman和Adel-son[164]提出的导向滤波器(Steerable Filters)是对local jet的进一步完善,它通过与高斯导数卷积并调整导数沿着梯度方向,使得该描述子适用于旋转和光照变化的图像;复数滤波器(Complex Filters)是利用方程Kxyθ)=fxy)exp ()的求导结果对区域进行描述的,其中θ是方向,而fxy)的形式要根据具体情况而定,Baumberg[165]用的是高斯导数,Schaffalitzky和Zisserman[166]则用多项式。

4.其他描述子

Gool[137]提出的广义不变矩是指物体图像经过平移、旋转以及比例变换仍保持不变的矩特征量。不变矩描述了一个区域内的形状和亮度分布,它的特征维数较少,对彩色图像的每个颜色通道的计算结果都很稳定,但高阶矩对几何失真和光亮度失真比较敏感。基于人类对纹理的视觉感知的心理学的研究,Tamu-ra等人[167]提出了纹理特征的表达,它用以描述特征区域的六个分量分别是对比度、方向度、粗糙度、线像度、规整度和粗略度,这种局部特征常用于图像检索领域,对纹理图像的识别效果比较好。

随着技术的进步,不断有新的描述子出现,但每种描述子都有一定的适用范围,而且其性能与特征区域检测方法没有必然的联系。总体看来,GLOH和SIFT描述子应用比较广泛,性能比较稳定;SC描述子在形状特征明显的目标识别中效果很好,但在纹理图像和非刚性目标的识别中效果不佳;在低维描述子中,不变矩和导向滤波器的性能要略胜一筹。