图2-5本章提出的纹理基元学习方法的原理图本章所提出的纹理基元学习方法把纹理图像的局部特征视为潜在的纹理基元,通过对局部纹理图像的特征进行描述,来获取潜在纹理基元的特征向量。因此,本章所提出的纹理基元学习方法预期能够超越传统的纹理基元学习方法,在识别精度和实时性方面实现新的突破。......
2025-09-29
纹理基元通常表现为一种局部特征,因此对局部特征的描述就是对潜在的纹理基元进行描述。如果直接将局部的图像像素值作为局部特征描述子,会使这种局部特征描述子的鉴别能力较低,并且特征的维数高,导致算法的识别精度和实时性都不理想,因此充分挖掘局部图像的特征信息,构造更好的局部特征描述子是纹理基元学习方法的重点研究内容之一。研究发现,纹理图像在局部区域的熵值(Entropy)、方差(Variance)和最大变化幅度(Maximum Range)上能够体现局部纹理图像的信息量和复杂程度,可用来描述局部纹理图像的宏观特征。同时,CLBC算法[86]中的局部差分符号计数(Local Difference Sign Count, LDSC)分量和局部差分幅值计数(Local Difference Magnitude Count, LDMC)分量能够体现局部区域的细节特征,可用来描述局部纹理图像的微观特征,因此可以考虑将上述局部区域的宏观特征和局部特征结合起来用于描述局部纹理图像的特征,二者具有很好的特征描述互补能力。同时,研究发现,以上这5个特征量对单调的光照变化和图像旋转都具有很好的稳健性,并且计算简单高效。因此,本章方法利用这5个特征量(熵、方差、最大变化幅度、LDSC、LDMC)构造一个局部特征向量,用这个局部特征向量来描述每个像素所在区域的局部纹理特征,并将其作为纹理基元的学习对象。显然,这里构造的局部特征向量具有特征描述能力强(能够同时描述局部纹理图像的宏观特征和微观特征)、特征维数低(本章算法中纹理基元的特征维数小于VZ-MR8算法中的维数8和VZ-Joint算法中的维数49)、计算简单高效,并且对单调的光照变化和图像旋转具有稳健性等优点,这为提取具有鉴别力的局部纹理特征和提高后续纹理基元字典学习与纹理基元编码的实时性奠定了良好的基础。
对局部的纹理图像,其熵值Ent、方差Var、最大变化幅度MR可分别定义为
式中:
N —— 局部区域图像所包含的像素个数;
ni —— 局部区域图像内灰度等级为i的像素个数;
xi —— 局部区域图像内一个像素的灰度值;
µ —— 局部区域图像内所有像素的平均灰度值;
Gmax —— 局部区域图像内的最大灰度值;
Gmin —— 局部区域图像内的最小灰度值。
在半径为R的局部环形邻域内,局部差分符号计数LDSC、局部差分幅值计数LDMC的定义分别为
式中:(https://www.chuimin.cn)
P —— 环形邻域上的像素点个数;
gc—— 环形邻域内中心像素点的灰度值;
gp—— 等间隔分布在环形邻域上的一个像素点的灰度值;
mp —— 邻域像素点与中心像素点灰度差分的幅值,即;
mc —— 整个图像所有像素点灰度差分幅值mp的平均值;
从上述5个特征量的定义可以看出,LDSC分量就是将半径为R的局部环形邻域上邻域点与中心点的灰度值做差分,并统计灰度差分大于或等于0的邻域点个数,即统计在局部环形邻域上灰度值大于或等于中心点的邻域点个数。LDMC则是将LDSC中的每个灰度差分幅值mp再与整个图像所有灰度差分幅值的平均值mc进行比较,并统计差分幅值大于或等于平均差分幅值的邻域点个数。因此,在局部的环形邻域内,LDSC能描述邻域点与中心点灰度大小的符号关系,而LDMC则更进一步地描述邻域点与中心点灰度大小的幅值关系。通过将LDSC和LDMC相结合,实现了局部差分符号信息和幅值信息的结合,能够更加充分地描述局部环形邻域上灰度分布的细节特征。同时,通过改变环形邻域的半径R和邻域点个数P,还可以对不同尺寸(大的邻域半径R对应大的尺度,小的邻域半径R对应小的尺度)的局部特征进行描述和检测,这对克服不同场景下由于摄像机和目标样本之间的距离不同所引起的图像尺度变化也具有重要的作用。
在本章方法中,为了构造纹理基元的学习对象,选择在13×13像素(即对应环形邻域的半径R=6)的局部区域图像内计算熵值Ent、方差Var和最大变化幅度MR。对于LDSC和LDMC分量,为了捕获更多的局部细节特征,并考虑到相邻半径所获取的特征之间存在较多的冗余信息,在利用一个大半径(R ,P)=(6,48)来捕获大尺寸局部特征的同时,还间隔选取了一个小半径(R, P)=(2,16)来捕获小尺寸的局部特征,从而实现不同尺度特征的融合。最后,将上述计算所得的特征量进行组合,构造一个局部特征向量来描述每个像素所在区域的局部纹理特征,并将其作为纹理基元的学习对象,即
因此,利用式(2-6)对一个纹理图像进行局部特征提取后,每个像素点都获得一个7维的局部特征向量LF,该特征向量LF描述了以当前像素点为中心的局部纹理图像的特征,包括多尺度的宏观特征和微观特征。同时,该特征量LF对单调的光照变化和图像旋转具有稳健性,这是因为特征向量LF中的7个特征量都对单调的光照变化和图像旋转具有不变性,其中熵Ent和方差Var只反映整体图像灰度值的变化信息,与灰度值的绝对值无关,而MR、LDMC和LDSC通过不同像素灰度值的差分运算可以抵消光照强度整体升高或降低的幅值,这种对光照变化和图像旋转的稳健性使特征向量LF能够适应更加复杂的应用场景,从而保证本章算法识别能力的稳健性。图2-6展示了对一个像素点进行局部特征提取和标记的过程,其中白色圆点表示一个当前的像素点,白色圆圈表示以白色当前像素点为中心的局部区域,计算当前像素点的7维局部特征向量LF,将其作为当前像素点的局部特征描述子和标记。
图2-6 一个像素点的局部特征提取和标记过程
按照图2-6所示的方法,对纹理图像中的每个像素点分别计算局部特征向量LF,使每个像素点都获得一个特征向量标记LF,从而完成对整个纹理图像的局部特征提取和描述。可以看出,对每个纹理图像都能提取出一组特征向量LF,在学习纹理基元字典的过程中,将所有训练样本图像在不同位置的局部特征向量LF进行合并,对这些局部特征向量进行非监督的聚类操作,从中挑选出在每个纹理类别中都具有代表性的特征向量,将其作为纹理基元字典中的纹理基元。所以,每个局部特征向量LF都是潜在的纹理基元学习对象。
相关文章
图2-5本章提出的纹理基元学习方法的原理图本章所提出的纹理基元学习方法把纹理图像的局部特征视为潜在的纹理基元,通过对局部纹理图像的特征进行描述,来获取潜在纹理基元的特征向量。因此,本章所提出的纹理基元学习方法预期能够超越传统的纹理基元学习方法,在识别精度和实时性方面实现新的突破。......
2025-09-29
人类对纹理特征的研究最早可追溯到1962年Julesz[44]对纹理视觉感知模型的研究,时至今日,人们对纹理图像的研究已经有50多年的历史。在国内,清华大学的郭振华[52-57]、国防科技大学的刘丽[1,2, 58-61]、重庆邮电大学的宋铁成[62-64]等也在该方面进行了深入的研究。图1-7展示了当选择距离d=1、方向θ=0°时根据输入图像计算GLCM矩阵的基本原理。例如,将原始图像量化为32或16个灰度等级,则GLCM方法的计算量会大大降低。......
2025-09-29
如第2章2.3.3节所述,面矩作为一种全局信息,已经广泛用于完全分割后的目标识别,其具有前面所述的整体特征的优缺点。当对边缘曲线进行尺度变化时,尺度的变化导致曲线长度的变化,相应的变化因子是k。此时尺度变化后的中心矩成为μ′pq=μpq×kp+q+1。为此,对7个不变矩进行如下修正,以调整其取值范围:式中所进行的修正变换应综合考虑不变矩特征的大小及后续识别的结构特点。......
2025-09-29
例如,对于一个7×7像素的图像块,把所有像素的灰度值排成一列,构成一个49维的列向量,将其作为纹理基元的学习对象,最终学习到的每个纹理基元也是一个49维的列向量,可见,VZ-Joint算法中49维的图像块向量相当于VZ-MR8算法中的局部MR8响应特征。总体来说,将VZ-MR8算法和VZ-Joint算法相比,这两种纹理基元学习方法各有优劣之处,主要体现在以下几个方面。......
2025-09-29
相对其他特征而言,光谱特征具有描述简便直观的特点,而且对大小、方向都不敏感,在一些情况下表现出相当强的鲁棒性。RGB、XYZ、HIS和Lab是四种不同的颜色空间,以不同的方式描述图像目标的颜色特征[67、68]。图2-13 单波段图像的灰度直方图除了颜色直方图之外,还有颜色矩、颜色集等其他一些颜色特征表示方式。......
2025-09-29
现有的图像检索方式主要分为两种:基于文本的图像检索和基于内容的图像检索。针对以上两点问题,本书对局部特征提取技术和相关反馈技术进行了深入的研究分析,提出了一种基于局部特征的图像检索方法。......
2025-09-29
在激光焊接、切割以及其他激光热加工时激光束质量是激光束选择考虑以及影响工艺参数设定的重要因素。这里的激光光束质量是对光束的空间分布特征的描述。光束质量特征可以由多种参数进行描述,如发散角、光束参数积、光束传播因子、横模模式等。对于基模高斯光束,M2=1,达到衍射极限。基模、低阶模的激光束横截面上的能量分布相对集中,具有更好的聚焦能力,因此,这类激光光束适合应用于激光切割、激光焊接等加工领域。......
2025-09-29
航拍图像拼接技术是当前机器视觉领域的一个研究热点,已经被广泛应用于地理信息系统、地质灾害监测、城市规划和战场态势评估等许多方面。但是,由于是在飞行器上对地面场景的俯视拍摄,所以又有其自身的特点和难点,比如飞行器姿态变化导致的航拍视角改变、飞行器升降造成的图像分辨率不同、天气状况对图像质量的影响等。该方法比较适合于全景图像拼接。......
2025-09-29
相关推荐