首页 理论教育研究现状:特征区域检测

研究现状:特征区域检测

【摘要】:目前,常用的特征区域检测方法可以分为三类,分别是密集选取、稀疏选取和其他选取方法。密集选取方法在滑动窗口模型中应用较多,其优点就是基本没有丢失图像的细节,可以得到非常丰富的局部特征。但是其中很大一部分特征区域信息量过小,对后期的识别没有作用甚至起到干扰作用,加重了下一步特征优化工作的负担。但很多特征区域检测算法往往和图像的特性相关,应用到通用目标识别时,可能会有一定的局限。

目前,常用的特征区域检测方法可以分为三类,分别是密集选取、稀疏选取和其他选取方法。从本质上看,所有的这些方法都是建立在对图像像素遍历的基础之上的。

1.密集选取方法

这种方法的研究者普遍持有这样一种观点:在模式识别的低层处理中,所有图像区域都有一定的作用,丢失任何细节都可能对最终效果产生很大的影响。Ohba和Ikeuchi[133,134]提出将图像密集地分为互不重叠的特征窗(Eigen Win-dows),每个特征窗都当作一个局部特征区域;Jurie[78]以整幅图像的每一个像素点为中心,选取周围的区域作为局部特征区域;Dalal[135]和Zhu[136]采用在检测窗口的每个像素位置、不同尺度下提取大量的特征区域,以供进一步应用。

密集选取方法在滑动窗口模型中应用较多,其优点就是基本没有丢失图像的细节,可以得到非常丰富的局部特征。但是其中很大一部分特征区域信息量过小,对后期的识别没有作用甚至起到干扰作用,加重了下一步特征优化工作的负担。

2.稀疏选取方法

这种方法都是通过特征检测,选取具有显著特点的图像区域作为局部特征。检测算子一般可以分为基于形状(Shape-based)的检测算子和基于外观(Ap-pearance-based)的检测算子两类。

基于形状的检测算子是根据图像的形状特征(如边界、直线、弧线等)来确定特征区域的位置。主要应用于外形区分度明显的目标识别,如各种刚性的、无关节的物体。Gool[137]利用图像的边缘信息对图像进行分析和理解,构造了线矩特征,作为一种局部信息量,它受到平移、旋转和尺度变化的影响较小;Be-longie[138]围绕着梯度算子检测出的边缘点,提出了SC(Shape Context)特征,描述子的维度为36;Berg[139]结合边缘方向能量与高斯核函数,得到了一种204维的局部特征,命名为GB(Geometic Blur);Fergus[140]用Canny算法检测图像的边缘,选择边缘点周围的区域作为特征区域。

基于外观的检测算子是在图像的灰度模式下,搜寻具有某种稳定性和不变性的特征点或关键区域。Beaudet[141]通过对图像函数二阶导数的泰勒展开,得到了具有旋转不变性的Hessian矩阵,可以直接对灰度图像进行操作提取特征点;Harris等人[142]受到了信号处理中自相关函数的启发,提出了Harris算法,也称为Plessey算法,这种算法是通过自相关矩阵来检测特征点的;随后,Mikolajc-zyk和Schmid等人结合拉普拉斯和高斯变换对Hessian和Harris算法进行了改进,提出了Harris-Laplace[143],Hessian-Laplace[144],Harris affine[144],Hessian af-fine[145]四种检测算子;Lowe[146]提出的高斯差分(Difference of Gaussian,DoG)算子是在尺度空间寻找极值点,结果比较稳定,抗噪能力较强;Kadir等人[147]提出的SalReg(Salient Regions)算子,利用亮度直方图在尺度空间计算局部最大熵,将其所对应的圆形区域定义为特征区域;Matas等人[148]结合分水岭算法和阈值思想提出了MSER(Maximally Stable Extremal Regions)算法,检测出的灰度值居中的稳定区域。

稀疏选取法检测出的特征区域数量一般在200~3000,其主要优点是简洁、紧致,图像的关键点远少于图像的像素,使得后面的识别过程能大大加速。但很多特征区域检测算法往往和图像的特性相关,应用到通用目标识别时,可能会有一定的局限。

3.其他选取方法

Nowak[149]在研究向量空间模型的取样策略时发现,当训练集的样本足够多时,随机取样法能达到和某些稀疏取样相近甚至更好的结果。Moosmann等研究者[32]提出了使用显著性映射在分类过程中动态选取图像块的方法。

三类特征区域检测方法都是建立在扫描、分析整幅输入图像的基础之上的,不同的是:密集选取方法在滑动窗口模型中应用较多,其优点就是基本没有丢失图像的细节,可以得到非常丰富的局部特征,但是其中很大一部分特征区域信息量过小,对后期的识别没有作用甚至起到干扰作用;随机选取等方法需要的训练集样本数量较大,这本身就加重了后面分类识别的负担;稀疏选取目前被广泛应用于各种目标识别系统,而且可供选用的算子不断涌现,但每个算子的效果往往和目标以及背景的特性有很大的关联,所以如何选择合适的检测算子是进行目标识别的关键。