首页 理论教育最佳纹理基元字典规模分析

最佳纹理基元字典规模分析

【摘要】:纹理基元字典的规模是指纹理基元字典中含有纹理基元的个数,纹理基元字典规模的大小在字典学习算法中具有重要的影响,主要体现在以下两个方面。所以,纹理基元字典的规模过大会使纹理基元字典的学习过程和纹理基元编码过程非常耗时,导致算法的实时性降低。因此,必须为本章方法确定一个最佳的纹理基元字典规模,以便充分有效地提取原始纹理图像中所包含的特征信息,同时能获得良好的纹理图像识别精度和实时性。

纹理基元字典的规模是指纹理基元字典中含有纹理基元的个数,纹理基元字典规模的大小在字典学习算法中具有重要的影响,主要体现在以下两个方面。

(1)纹理基元字典的规模会影响字典的特征表达能力。对一个指定的纹理图像数据集,如果学习到的纹理基元字典的规模过小,则字典中的纹理基元可能会缺少某些特征元素,这会导致纹理基元字典的特征表达能力差,使原始纹理图像中的有些特征无法用字典中的纹理基元进行描述,进而造成对原始纹理图像的特征提取不充分,使最终的纹理识别精度下降。相反,如果纹理基元字典的规模过大,则可能是因为存在较多冗余的纹理基元,这些冗余的纹理基元在字典中具有不同的编号,在对原始的纹理图像进行编码和特征提取时会形成相互干扰,即同一种纹理特征可能被标记为不同的编码值,从而导致纹理图像的识别精度下降。

(2)纹理基元字典的规模会影响算法的实时性。如果纹理基元字典的规模过大,则意味着在学习字典的过程中需要学习更多个数的纹理基元,这会导致纹理基元字典的学习过程计算量增大;另外,由于纹理基元字典的规模过大,在对原始的纹理图像进行编码时就需要在更大的纹理基元字典空间中检索更多个数的纹理基元,这会使纹理基元的编码过程计算量增大。所以,纹理基元字典的规模过大会使纹理基元字典的学习过程和纹理基元编码过程非常耗时,导致算法的实时性降低。

因此,必须为本章方法确定一个最佳的纹理基元字典规模,以便充分有效地提取原始纹理图像中所包含的特征信息,同时能获得良好的纹理图像识别精度和实时性。另外,考虑到本章所采用的方法是从每个纹理类别学习Nt个纹理基元,所以纹理基元字典的规模即为纹理类别个数C与每个类别纹理基元个数Nt的乘积。因为纹理类别个数C是固定的,所以纹理基元字典的规模主要由每个类别的纹理基元个数Nt决定,确定纹理基元字典的规模即确定Nt的大小。

本章利用K-均值聚类算法进行逐类纹理基元的学习,每个纹理类别获得Nt个聚类中心,将其作为一个纹理类别的纹理基元学习结果。其中,初始的聚类中心采用均匀选择的方法来确定,即从聚类数据的分布区间内均匀选择Nt个数据作为初始的聚类中心,距离测度采用欧氏距离,迭代次数设为100次。考虑到KTH-TIPS纹理库含有丰富的光照、视角和尺度变化,对纹理图像的特征提取和识别更具挑战性,所以本章在KTH-TIPS纹理库上开展实验,通过改变每个类别的纹理基元个数Nt的值,分析不同纹理基元字典规模对纹理识别精度和实时性的影响,实验结果如表2-1所示。表2-1中的“时间消耗”是指在KTH-TIPS纹理库上进行实验时,平均一个纹理样本图像所消耗的时间。

表2-1 纹理基元字典规模对识别精度和实时性的影响

从表2-1可以看出:

(1)当每类的纹理基元个数Nt <20时,随着字典规模的增大,纹理基元字典的特征描述能力不断增强,能够更好地提取原始纹理图像中的特征信息,使纹理图像的识别精度逐步提高;当Nt=20时,纹理图像的识别精度已基本达到最高水平,说明此时学习到的纹理基元字典已经能够充分地提取原始纹理图像的特征;当Nt >20时,继续增大Nt的值并没有获得识别精度的显著提高,这是因为纹理基元字典中开始出现冗余的纹理基元,而冗余的纹理基元对提高特征的鉴别能力是没有作用的。

(2)随着纹理基元字典规模的增大,本章方法的时间消耗呈单调性增加的趋势,这是因为字典规模的增大意味着在逐类学习纹理基元的过程中需要学习更多个数的纹理基元,这直接导致纹理基元字典学习阶段的计算量显著增加,同时会使后续纹理基元编码阶段和特征对比阶段的计算量增加,从而导致算法的实时性不断下降。

综上所述,本章方法选择最佳的参数值Nt=20,即从每个纹理类别学习20个纹理基元,并用所有类别的纹理基元构建最终的纹理基元字典,此时既能获得很高的纹理识别精度,又能获得很好的实时性。