纹理基元字典的规模是指纹理基元字典中含有纹理基元的个数,纹理基元字典规模的大小在字典学习算法中具有重要的影响,主要体现在以下两个方面。所以,纹理基元字典的规模过大会使纹理基元字典的学习过程和纹理基元编码过程非常耗时,导致算法的实时性降低。因此,必须为本章方法确定一个最佳的纹理基元字典规模,以便充分有效地提取原始纹理图像中所包含的特征信息,同时能获得良好的纹理图像识别精度和实时性。......
2023-06-29
K-均值聚类算法是一种简单有效的无监督学习算法,本章选择它作为纹理基元的学习方法。K-均值聚类算法的代价函数是各聚类的类内距离平方和,可表示为
式中:
K —— 聚类中心的个数;
xk —— 第k个点的特征量;
ci —— 第i个聚类的中心;
Ji —— 第i个聚类的类内距离平方和,即J;
Gi —— 第i个聚类的点集合。
K-均值聚类算法通过不断迭代,不断调整聚类中心ci的值,使式(2-7)所示的代价函数不断减小,当代价函数达到最小值或达到设定的迭代次数时,可获得最佳的聚类中心。在本章算法中,利用K-均值聚类算法对所有训练样本的所有LF特征向量进行聚类,最终的聚类中心就是要学习的纹理基元集合,即每个聚类中心就是一个纹理基元。需要注意的是,利用K-均值聚类算法时,需要预先设定聚类中心的个数,即需要提前指定纹理基元字典中包含的纹理基元的个数(也称为纹理基元字典的规模),而选定合适的纹理基元个数非常重要。如果纹理基元的个数太少,即纹理基元字典的规模过小,则不能充分描述纹理图像的特征;如果纹理基元的个数太多,即纹理基元字典的规模过大,则会增加纹理基元字典学习和对原始图像进行纹理基元编码的计算量,导致算法的实时性降低。因此,必须在算法设计过程中通过实验选择最佳的纹理基元个数,即确定最佳的纹理基元字典的规模。
在学习纹理基元时,如果直接对所有类别全部训练样本的LF特征向量进行K-均值聚类操作,则由于训练样本的数量非常大,K-均值聚类过程所需的时间和存储量过大,导致对硬件平台的性能要求非常高。因此,为了提高算法的实时性,本章采用逐类学习纹理基元的方法,即从每个纹理类别中分别学习一组纹理基元,然后把所有类别的纹理基元进行合并,从而获得纹理基元字典。采用逐类学习纹理基元的方法,可以显著降低K-均值聚类时对时间和存储空间的消耗。例如,如果训练样本集一共有50个类别,则采用逐类学习纹理基元的方法对每个类别的特征向量进行K-均值聚类时,其对时间和存储空间的消耗大约只有原来的1/50。图2-7展示了本章所采取的逐类学习纹理基元,最终构建纹理基元字典的实现过程。
图2-7 本章的纹理基元字典学习过程
根据图2-7,利用本章方法进行纹理基元字典学习的具体步骤可描述如下:
(1)对于一个类别的全部训练样本,按照本章第2.3.1节的方法分别计算每个样本图像在每个像素位置的局部特征向量LF,然后把所有像素的局部特征向量LF合并,组成一个类别的局部特征向量集合。
(2)设定聚类中心的个数为Nt,然后利用K-均值聚类算法对上述步骤(1)提取的一个类别所有像素的局部特征向量集合进行聚类运算,当代价函数降到最小或达到设定的迭代次数时,获得Nt个聚类中心,将这Nt个聚类中心作为该类别的纹理基元集合。
(3)按照上述步骤(1)(2)的方法,依次从每个类别的训练样本中学习Nt个纹理基元,然后把从所有类别学习到的纹理基元进行合并,将其作为纹理基元字典。
从以上过程可以看出,学习到的一个纹理基元就对应K-均值聚类算法收敛时的一个聚类中心,它们与本章第2.3.1节构造的局部特征向量LF具有完全相同的结构,即每个纹理基元都是一个7维的局部特征向量,可表示纹理图像中一个独特的、具有代表性的局部区域特征。另外,本章方法采用逐类学习的策略依次从每个类别学习到Nt个纹理基元,如果训练样本集一共有C个纹理类别,则构建的纹理基元字典的规模是C×Nt,即纹理基元字典一共含有C×Nt个纹理基元。
最后,需要对纹理基元字典中非常相似的纹理基元进行删除。由于本章采用逐个类别学习纹理基元的方法,在逐类学习的过程中没有充分考虑到不同类别的纹理图像之间可能存在一定的特征相似性,所以从不同类别的训练样本中学习到的一些纹理基元可能存在很高的相似度,这会导致在构造的纹理基元字典中可能存在一些非常相似的纹理基元。如果纹理基元字典中存在多个非常相似的纹理基元,则只需在纹理基元字典中保留一个纹理基元即可,其他非常相似的纹理基元被视为冗余的纹理基元,它们没有提供额外的特征信息,因此需要删除这些冗余的纹理基元。如图2-8所示,对于逐类学习到的纹理基元集合,在其中用矩形框成对地标记出了一些非常相似的纹理基元特征。
图2-8 一些非常相似的纹理基元
上述冗余纹理基元的存在会增大纹理基元字典的规模,这会导致在对原始图像特征进行纹理基元编码时需要搜索更大的纹理基元字典空间,需要把当前待编码的特征向量与更多的纹理基元向量进行特征对比,从而使算法的计算量增加,降低算法的实时性。因此,必须删除纹理基元字典中冗余的纹理基元。本章采取的冗余纹理基元删除方法如下:分别计算纹理基元字典中每两个纹理基元特征向量的L1范数距离,将其作为两个纹理基元的特征差异测度,如果某些纹理基元的特征差异小于设定的阈值Ttd,则这些纹理基元只保留一个,其他相似的纹理基元被删除。在本章方法中,根据实验经验设置纹理基元特征差异的阈值Ttd=3,当纹理基元的特征差异小于该阈值时被视为存在冗余的纹理基元,即可删除字典中对应的冗余纹理基元。
有关纹理图像的特征提取和识别的文章
纹理基元字典的规模是指纹理基元字典中含有纹理基元的个数,纹理基元字典规模的大小在字典学习算法中具有重要的影响,主要体现在以下两个方面。所以,纹理基元字典的规模过大会使纹理基元字典的学习过程和纹理基元编码过程非常耗时,导致算法的实时性降低。因此,必须为本章方法确定一个最佳的纹理基元字典规模,以便充分有效地提取原始纹理图像中所包含的特征信息,同时能获得良好的纹理图像识别精度和实时性。......
2023-06-29
例如,对于一个7×7像素的图像块,把所有像素的灰度值排成一列,构成一个49维的列向量,将其作为纹理基元的学习对象,最终学习到的每个纹理基元也是一个49维的列向量,可见,VZ-Joint算法中49维的图像块向量相当于VZ-MR8算法中的局部MR8响应特征。总体来说,将VZ-MR8算法和VZ-Joint算法相比,这两种纹理基元学习方法各有优劣之处,主要体现在以下几个方面。......
2023-06-29
图2-5本章提出的纹理基元学习方法的原理图本章所提出的纹理基元学习方法把纹理图像的局部特征视为潜在的纹理基元,通过对局部纹理图像的特征进行描述,来获取潜在纹理基元的特征向量。因此,本章所提出的纹理基元学习方法预期能够超越传统的纹理基元学习方法,在识别精度和实时性方面实现新的突破。......
2023-06-29
在获得输入图像I的纹理基元编码图像之后,为了方便送入分类器进行类别的判断,需要将编码图像转换成一个特征向量,将其作为原始纹理图像的最终特征描述。显然,利用纹理基元编码图像计算出的直方图特征向量,其特征维数和纹理基元字典的规模是相同的,即每个直方条对应纹理基元字典中的一种纹理基元,直方图的数值则体现了纹理基元编码图像中每个纹理基元出现的频率大小。......
2023-06-29
从本节开始,我们讨论多元多项式的性质与应用.设F是一个数域,x1,x2,…,ln).在一个多项式中,按照出现的单项式之间的先于关系将多项式的项进行排列,即若f先于g,那么f总是更靠前.注意这里的顺序与单项式的次数无关.这种排列多元多项式的方法称为字典排序法.例如,x31x2x23-3x31x3+4x1x2-9x72x43-x42x73,x41-2x21x22-2x21x23+x42-2x22x23+x43,等.引理2.5 若f1,f2,g1,g2都是非零单项式,且满足条件f1先于f2,g1先于g2,那么一定有f1g1先于f2g2.证明:设单项式这时一定有关系(l1,l2,…......
2023-11-22
纹理基元通常表现为一种局部特征,因此对局部特征的描述就是对潜在的纹理基元进行描述。因此,本章方法利用这5个特征量构造一个局部特征向量,用这个局部特征向量来描述每个像素所在区域的局部纹理特征,并将其作为纹理基元的学习对象。......
2023-06-29
基于深度学习的纹理图像特征提取和识别方法研究。目前,大部分的深度学习模型都是针对普通的图像识别任务而设计的,但在纹理图像的特征提取和识别任务中,这些模型的表现不一定是最佳的,并且模型的结构通常比较复杂,训练非常耗时。因此,针对纹理图像的特征提取和识别问题,设计更具针对性的、更加简捷高效的深度学习模型是一个重要的研究方向。......
2023-06-29
差距模式是当前学习障碍儿童鉴别和评估的主要方法,可操作性强。差距法也称常模参照法、标准化测验法,这是因为差距模式的评估首先需要标准化的智力测验和标准化的成就测验。该差距模式源于学习障碍定义中所强调的潜能与实际表现之间的差距。差距模式使用差距分数作为筛查的指标。差距分数的衡量方法主要有年级水平差距法、成就水平期望公式法、标准分数差距法和回归分析法四种。......
2023-07-02
相关推荐