首页 理论教育纹理基元编码与特征向量构建

纹理基元编码与特征向量构建

【摘要】:在获得输入图像I的纹理基元编码图像之后,为了方便送入分类器进行类别的判断,需要将编码图像转换成一个特征向量,将其作为原始纹理图像的最终特征描述。显然,利用纹理基元编码图像计算出的直方图特征向量,其特征维数和纹理基元字典的规模是相同的,即每个直方条对应纹理基元字典中的一种纹理基元,直方图的数值则体现了纹理基元编码图像中每个纹理基元出现的频率大小。

对于一个纹理图像I,利用纹理基元字典对其进行编码的具体过程如下所述。

(1)选择纹理图像I中的一个像素,将其作为当前像素,按照本章第2.3.1节的方法以当前像素为中心选择一个局部邻域图像,然后分别计算当前像素所在局部邻域图像的宏观特征(熵Ent、方差Var、最大变化幅度MR)和微观特征(半径R=2和6时对应的LDSC、LDMC分量),将上述宏观特征和微观特征分量进行级联,使当前像素获得一个7维的局部特征向量标记LF,用于描述当前像素所在邻域图像的局部特征。

(2)根据式(2-8)计算当前像素的局部邻域特征向量LF与纹理基元字典中每个纹理基元向量的L2范数距离,用这个L2范数距离表示当前像素局部邻域特征向量与每个纹理基元的特征相似度,即

式中:

LF —— 当前像素的局部邻域特征向量(7维向量);

Textonj —— 纹理基元字典中第j个纹理基元的特征向量(7维向量)。

(3)根据最近邻(即特征最相似)原则,将L2范数距离最小的那个纹理基元在整个纹理基元字典中对应的序号作为当前像素局部邻域特征的编码值,即

式中:

dj —— 当前像素的局部特征向量LF与第j个纹理基元的L2范数距离;

j —— 纹理基元字典中第j个纹理基元的序号。

图2-9展示了利用纹理基元字典对一个像素(白色圆点)的局部邻域特征进行编码的过程,即通过特征相似度的对比,将整个纹理基元字典中与LF最相似的那个纹理基元的序号作为当前像素的标记,在上述纹理基元编码之后,当前像素获得一个编码值(如图2-9所示,当前像素的局部邻域特征向量与纹理基元字典中第6个纹理基元的特征最相似,所以当前像素的编码值就赋值为6),该编码值与原始图像中的灰度值具有不同的特征描述能力,即原始图像中当前像素的灰度值仅表示单独一个像素点的灰度信息,而编码值能够表示当前像素及其局部邻域图像的统计特征,这是因为每一个编码值的背后都有一个7维的纹理基元特征向量的支撑,这使编码值所包含的信息更加丰富。

图2-9 对一个像素进行纹理基元编码的过程

(4)按照上述步骤(1)~(3)的方法,对纹理图像I中的每个像素都计算一个纹理基元编码值,从而获得原始纹理图像I对应的纹理基元编码图像。

在获得输入图像I的纹理基元编码图像之后,为了方便送入分类器进行类别的判断,需要将编码图像转换成一个特征向量,将其作为原始纹理图像的最终特征描述。因为图像的直方图能够很好地反映图像的统计特征,具有较强的鉴别能力,并且计算简单高效,对图像的旋转也具有不变性,所以用本章方法计算纹理基元编码图像的直方图,可以获得每个类型纹理基元发生的频率特征,将其作为原始纹理图像的特征向量,用于纹理图像的识别。同时,为了避免直方图中频率过大模式的不良影响,本章对纹理基元编码图像的直方图进行了开平方运算,然后将其送入分类器进行纹理识别。显然,利用纹理基元编码图像计算出的直方图特征向量,其特征维数和纹理基元字典的规模是相同的,即每个直方条对应纹理基元字典中的一种纹理基元,直方图的数值则体现了纹理基元编码图像中每个纹理基元出现的频率大小。