首页 理论教育高斯差分检测算子简介

高斯差分检测算子简介

【摘要】:高斯差分算子是在多尺度空间中寻找稳定有效的特征区域。图4-1 高斯拉普拉斯函数与高斯差分函数图4-2 高斯金字塔和高斯差分金字塔的构造示意图限于篇幅,图4-2只给出了第一层和第二层高斯差分图像的计算。如图4-2中右图的五角星符号所标识,由于需要与相邻尺度的点进行比较,所以在每层高斯差分金字塔的一组图像中只能检测到两个尺度的极值点。

近几年,高斯差分(Difference of Gaussian,DoG)、SalReg(Salient Re-gions)、MSER(Maximally Stable Extremal Regions)算法的相继出现,代表着基于外观的检测算子开始广泛应用于机器视觉领域。高斯差分算子是在多尺度空间中寻找稳定有效的特征区域。Koendetink和Lindeberg等人[150-152]证明了高斯卷积核是实现尺度变换的唯一线性核,所以,一幅二维图像I (xy)的尺度空间定义为

L (xyσ)=G (xyσ)∗I (xy) (4-1)

式中,符号∗表示卷积,(xy)代表图像中像素的位置,而尺度可变高斯函数为

978-7-111-38182-2-Chapter04-1.jpg

利用不同尺度的高斯差分算子与图像进行卷积运算,可以求取尺度空间极值,计算公式如下:

D (xyσ)=[G (xy)-G (xyσ)]∗I (xy)

=L (xy)-L (xyσ) (4-3)

其中,L代表了图像的尺度空间,k是常数,一般取978-7-111-38182-2-Chapter04-2.jpg。这里选择高斯差分函数的原因主要有两个:一是其计算效率较高;二是它可以作为尺度归一化的高斯拉普拉斯函数(Laplacian of Gaussian,LoG)——σ22G的一种近似[152],如图4-1所示。

通过与其他特征提取算子(如Harris、Hessian算子)的实验比较,Mikola-jczyk等人[154]发现基于σ22G的极大值和极小值能够产生更为稳定的局部特征。D (xyσ)与σ22G的关系可以从如下公式推导得到:

978-7-111-38182-2-Chapter04-3.jpg

利用差分近似替代微分,则有

978-7-111-38182-2-Chapter04-4.jpg

因此,有

G (xy)-G (xyσ)≈(k-1)σ22G (4-6)

其中k-1是个常数,并不影响极值点位置的求取。

如图4-2所示,Lowe等人[153]提出了一种构造Dxyσ)的有效方法。左侧是不同尺度空间中的图像金字塔,右侧显示了将每层金字塔中相邻图像相减所生成的高斯差分图像的结果。

978-7-111-38182-2-Chapter04-5.jpg

图4-1 高斯拉普拉斯函数与高斯差分函数

978-7-111-38182-2-Chapter04-6.jpg

图4-2 高斯金字塔和高斯差分金字塔的构造示意图

限于篇幅,图4-2只给出了第一层和第二层高斯差分图像的计算。在实际应用中,高斯金字塔一般选择4层,每层有5幅一组的尺度图像。在目前常用的设计方案中,第一层的第一幅图像是放大2倍的原始图像,其目的是为了得到更多的特征点。

图4-3是利用一幅关于爱因斯坦的图像构造高斯金字塔和高斯差分金字塔的示例。图4-3b所示的高斯差分图像是通过图4-3a金字塔中对应层上的相邻图像相减而得到的。

978-7-111-38182-2-Chapter04-7.jpg

图4-3 两种图像金字塔的示例

a)高斯金字塔 b)高斯差分金字塔

图4-4所示为如何从高斯差分金字塔的分层结构中提取出图像的极值点作为候选的特征点,就是将每个检测点与其相邻点(图像域和尺度域)进行逐个比较,得到的局部极值位置即为该特征点所处的位置和对应的尺度。如图4-2中右图的五角星符号所标识,由于需要与相邻尺度的点进行比较,所以在每层高斯差分金字塔的一组图像中只能检测到两个尺度的极值点。

由于DoG算子对噪声和边缘较为敏感,因此,在上面DoG尺度空间中检测到的局部极值点还需要经过进一步的检验才能精确定位为特征点。通过拟合三维二次函数可以较精确地计算特征点的位置和尺度,同时还可以去除对比度较低的特征点以及稳定性较差的边缘响应点[146]

获取特征点处的拟合函数为

978-7-111-38182-2-Chapter04-8.jpg

求导并让方程等于零,可以得到极值点:

978-7-111-38182-2-Chapter04-9.jpg

对应极值点,方程的值为

978-7-111-38182-2-Chapter04-10.jpg

如果D (X∧)≤0.03,则视为对比度较低的候选特征点,并予以剔除。

978-7-111-38182-2-Chapter04-11.jpg

图4-4 尺度空间的极值检测

(来源:Lowe,2004)

因为DoG算子会产生较强的边缘响应,所以需要对这些不稳定的点进行检测。首先获取该点处的Hessian矩阵

978-7-111-38182-2-Chapter04-12.jpg

H的特征值αβ代表xy方向的梯度

978-7-111-38182-2-Chapter04-13.jpg

Tr (H)和Det (H)分别表示矩阵H的迹与行列式。假设α是最大的特征值,β是较小的特征值,令α=,则

978-7-111-38182-2-Chapter04-14.jpg

式(4-12)的值越大也就是两个特征值之比越大,这就说明在某一个方向上的梯度值越大,同时另一个方向上的梯度值越小,这种情况恰恰符合边缘响应的条件。一般取r=10,并检测是否符合以下条件,就可以剔除边缘响应点:

978-7-111-38182-2-Chapter04-15.jpg