图2-5本章提出的纹理基元学习方法的原理图本章所提出的纹理基元学习方法把纹理图像的局部特征视为潜在的纹理基元,通过对局部纹理图像的特征进行描述,来获取潜在纹理基元的特征向量。因此,本章所提出的纹理基元学习方法预期能够超越传统的纹理基元学习方法,在识别精度和实时性方面实现新的突破。......
2025-09-29
对于一个纹理图像I,利用纹理基元字典对其进行编码的具体过程如下所述。
(1)选择纹理图像I中的一个像素,将其作为当前像素,按照本章第2.3.1节的方法以当前像素为中心选择一个局部邻域图像,然后分别计算当前像素所在局部邻域图像的宏观特征(熵Ent、方差Var、最大变化幅度MR)和微观特征(半径R=2和6时对应的LDSC、LDMC分量),将上述宏观特征和微观特征分量进行级联,使当前像素获得一个7维的局部特征向量标记LF,用于描述当前像素所在邻域图像的局部特征。
(2)根据式(2-8)计算当前像素的局部邻域特征向量LF与纹理基元字典中每个纹理基元向量的L2范数距离,用这个L2范数距离表示当前像素局部邻域特征向量与每个纹理基元的特征相似度,即
![]()
式中:
LF —— 当前像素的局部邻域特征向量(7维向量);
Textonj —— 纹理基元字典中第j个纹理基元的特征向量(7维向量)。
(3)根据最近邻(即特征最相似)原则,将L2范数距离最小的那个纹理基元在整个纹理基元字典中对应的序号作为当前像素局部邻域特征的编码值,即
(https://www.chuimin.cn)
式中:
dj —— 当前像素的局部特征向量LF与第j个纹理基元的L2范数距离;
j —— 纹理基元字典中第j个纹理基元的序号。
图2-9展示了利用纹理基元字典对一个像素(白色圆点)的局部邻域特征进行编码的过程,即通过特征相似度的对比,将整个纹理基元字典中与LF最相似的那个纹理基元的序号作为当前像素的标记,在上述纹理基元编码之后,当前像素获得一个编码值(如图2-9所示,当前像素的局部邻域特征向量与纹理基元字典中第6个纹理基元的特征最相似,所以当前像素的编码值就赋值为6),该编码值与原始图像中的灰度值具有不同的特征描述能力,即原始图像中当前像素的灰度值仅表示单独一个像素点的灰度信息,而编码值能够表示当前像素及其局部邻域图像的统计特征,这是因为每一个编码值的背后都有一个7维的纹理基元特征向量的支撑,这使编码值所包含的信息更加丰富。

图2-9 对一个像素进行纹理基元编码的过程
(4)按照上述步骤(1)~(3)的方法,对纹理图像I中的每个像素都计算一个纹理基元编码值,从而获得原始纹理图像I对应的纹理基元编码图像。
在获得输入图像I的纹理基元编码图像之后,为了方便送入分类器进行类别的判断,需要将编码图像转换成一个特征向量,将其作为原始纹理图像的最终特征描述。因为图像的直方图能够很好地反映图像的统计特征,具有较强的鉴别能力,并且计算简单高效,对图像的旋转也具有不变性,所以用本章方法计算纹理基元编码图像的直方图,可以获得每个类型纹理基元发生的频率特征,将其作为原始纹理图像的特征向量,用于纹理图像的识别。同时,为了避免直方图中频率过大模式的不良影响,本章对纹理基元编码图像的直方图进行了开平方运算,然后将其送入分类器进行纹理识别。显然,利用纹理基元编码图像计算出的直方图特征向量,其特征维数和纹理基元字典的规模是相同的,即每个直方条对应纹理基元字典中的一种纹理基元,直方图的数值则体现了纹理基元编码图像中每个纹理基元出现的频率大小。
相关文章
图2-5本章提出的纹理基元学习方法的原理图本章所提出的纹理基元学习方法把纹理图像的局部特征视为潜在的纹理基元,通过对局部纹理图像的特征进行描述,来获取潜在纹理基元的特征向量。因此,本章所提出的纹理基元学习方法预期能够超越传统的纹理基元学习方法,在识别精度和实时性方面实现新的突破。......
2025-09-29
纹理基元通常表现为一种局部特征,因此对局部特征的描述就是对潜在的纹理基元进行描述。因此,本章方法利用这5个特征量构造一个局部特征向量,用这个局部特征向量来描述每个像素所在区域的局部纹理特征,并将其作为纹理基元的学习对象。......
2025-09-29
人类对纹理特征的研究最早可追溯到1962年Julesz[44]对纹理视觉感知模型的研究,时至今日,人们对纹理图像的研究已经有50多年的历史。在国内,清华大学的郭振华[52-57]、国防科技大学的刘丽[1,2, 58-61]、重庆邮电大学的宋铁成[62-64]等也在该方面进行了深入的研究。图1-7展示了当选择距离d=1、方向θ=0°时根据输入图像计算GLCM矩阵的基本原理。例如,将原始图像量化为32或16个灰度等级,则GLCM方法的计算量会大大降低。......
2025-09-29
差错控制编码的基本方法是:在发送端,给要传送的信息序列按照事先约定好的规律增加一些码元,称之为监督码元。不同的差错控制编码也要与相应的差错控制方式配合使用。常用的差错控制方式通常有三种:前向差错控制 、检错重发以及使用FEC和ARQ技术的混合方式。所以连续ARQ重发时要将错误分组及其以后的分组全部重发。比如一种纠错编码能纠正一个码字内的两位错,检出三位错。......
2025-09-29
本节详细介绍如何根据用户行为构建模型产出标签、权重。关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。表9-2用户标识表②什么时间。时间戳,为了标识用户行为的时间点,如,1395121950,1395121950.083612,通常采用精度到秒的时间戳即可,因为微秒的时间戳精度并不可靠。行为类型:浏览行为记为权重1;地点:品尚红酒单品页的网址子权重记为0.9。用户偏好标签是红酒,权重是0.95×0.9×1=0.855,即用户A:红酒0.855、长城0.855。......
2025-09-29
北京印刷学院机械工程专业结合自身特点设计出适应卓越工程师教育的实践教育体系,见表2-21。学科竞赛是机械工程专业长期坚持的重要综合实践活动之一。工程项目训练则是在大学最后阶段进行的一项综合性训练内容,即毕业设计。区别于原来的毕业设计,工程项目训练的选题较为宽泛,但主要是以本专业领域内,能够解决实际工程问题的各类综合性题目作为训练课题。......
2025-09-29
光电编码器是一种将旋转角度转换为数字量的传感器,是一种直接编码方式的位置检测元件。图2-12 旋转编码器的结构1.光电编码器的分类及应用特点按脉冲与对应位置的关系,光电编码器通常分为增量式光电编码器、绝对式光电编码器两大类。同时,在增量式光电编码器中还备有用作参考零位的标志脉冲或指示脉冲。如果要测量旋转超过360°范围,就要用到多圈绝对值编码器。......
2025-09-29
常用的熵编码有基于图像概率分布特性的哈夫曼编码、算术编码和游程编码三类。采用哈夫曼编码时有两个问题值得注意:1)哈夫曼编码没有错误保护功能,在解码时,如果码串中没有错误,那么就能一个接一个地正确译出代码。3)重复第2)步,最后输出的“当前区间”的下边界就是该给定符号序列的算术编码。......
2025-09-29
相关推荐