为了对提取的纹理图像特征进行类别的判定,需要采用分类器对测试样本和所有训练样本的特征进行相似度的分析,本章采用最近子空间分类器 [55]来识别测试样本的类别标签,其工作过程具体如下。步骤1:利用同一类别所有训练样本的特征向量,构造该类别纹理的特征子空间。步骤2:计算待识别的测试样本在每个类别特征子空间中的投影和投影残差。......
2023-06-29
设计分类器是目标分类的主要任务和核心研究内容之一。分类器设计就是在训练样本集合上进行优化(如使每一类样本的表达误差最小或使不同类别样本的分类误差最小)的过程,也就是一个机器学习过程。下面将从不同的角度对图像目标识别常用的分类器进行归类,进而介绍它们的研究现状。
1.按照分类器的数目
按照分类器的数目,可以分为单分类器方法和多分类器方法。顾名思义,单分类器方法中,全部目标类别共用一个分类器,多分类器方法为每个类别设置一个分类器。但是多分类器方法会带来一个很严重的“拒识”问题。如果某个目标和全部目标类别的相似度都小于相应的阈值,就无法识别该目标。这种情况下,还得调用单分类器方法,将其类别设置为相似度最大的那个类别。所以,为每个类别设置一个分类器的方法应用并不广泛。
还有一种思路,就是用多个弱分类器来联合投票进行目标识别,采用这种思路的多分类器方法被认为是结合不同分类器的优点、克服单个分类器性能不足的一个有效途径。其核心思想是,k个专家判断的有效组合应该优于某个专家个人的判断结果。投票算法主要有两种:Bagging算法[109]和Boosting算法[110],它们都是通过对训练样本集进行重采样或加权来训练多分类器的。不过,Bag-ging算法是并行的,而Boosting算法是串行的,它们在训练每个分量分类器时,训练样本的抽取方式也有所不同。Boosting方法作为一种集成机器学习方法,通过粗糙的、不太正确的、简单的、单凭经验的初级预测方法(弱分类器),按照一定的规则(在自组织自学习的方式下设计各弱分类器的权重),最终得出一个复杂的、精确度很高的预测方法(提升分类模型来解决复杂问题)。基于Boos-ting方法有许多不同的变形,其中AdaBoost方法[111]由于算法简单、运算速度快而被广泛应用于字符识别和人脸检测等领域。
与其他学习方法对样本集或特征集进行分解不同的是,纠错输出编码(Er-ror-correcting output codes,ECOC)[112]是对类别集进行分解,通过组合多个二类分类器(这里的一类可以是一个类别子集)来实现多类分类。另外一种通过二类分类器实现多类分类的方法是把一对样本之间的关系分为“同类”(Intra-class)和“不同类”(Extra-class)两类,输入特征从两个样本提取(如两个样本对应特征的差),二类分类器的输出给出两个样本“同类”的概率或相似度,多类问题采用近邻规则进行分类。这种方法可以克服训练样本不足的问题,而且在训练后可任意增加或减少类别而不必重新训练,近年来已广泛用于人脸识别等生物特征识别问题。
2.按照分类器训练过程中的人工参与程度
按照分类器训练过程中的人工参与程度,一般可以分为有监督(Su-pervied)和无监督(Unsupervied)识别。它们从本质上的区别就在于训练数据是否有已知的类别标签。无监督识别主要用于确定两个特征向量之间的“相似度”以及合适的测度,并选择一个算法方案,基于选定的相似度测度对向量进行聚类(分组)。通常,不同的算法方案可能导致不同的结果,这一点必须由专家进行解释[31];而有监督识别可以通过学习有标签的数据,挖掘已知信息来设计分类器,能够以较小的训练集获得较高精度的模型。
对于海量的图像数据进行人工标注,浪费资源且不切实际,近年来,将标注数据和未标注数据结合起来用于目标识别受到广泛的关注,这就是半监督(Semi-supervied)识别方法[46]。Cohen[47],Yao[48]和Li[49]等学者分别将半监督识别应用到了人脸识别、航拍图像的目标检测以及图像分类等领域,取得了一些成果。
3.按照分类器的数学模型
按照分类器的数学模型,可以分为生成(Generative)方法和判别(Discrim-inative)方法。生成方法中的朴素贝叶斯(Naive Bayes)分类器[54]是根据目标属于不同类别的概率来进行分类的,它将分类器设计问题转化为概率密度估计问题,给出了最一般情况下适用的“最优”分类器设计方法,该方法对各种不同的分类器设计技术在理论上都有指导意义;在判别方法中将每个目标表示为特征向量,进而视作整个特征空间的一个点,认为不同的类别是特征空间中不同区域或子空间,因此如果能够找到一个分离函数把属于不同类别的点分来,则识别任务就完成了,这种方法不依赖于条件概率密度的知识,其中最具代表性的是神经网络(Neural Network,NNet)[113]和支持向量机(Support Vector Ma-chine,SVM)[114]。
混合生成-判别学习的识别方法[115,116]近年来受到了广泛的关注。这种方法结合了生成模型和判别模型的优点,一般先是对每一类模式建立一个生成模型(概率密度模型或结构模型),然后用判别学习准则对生成模型的参数进行优化。学习的准则可以是生成模型学习准则(如最大似然准则)和判别学习准则(如条件似然度)的加权组合[117,118]。结合判别学习的贝叶斯网络[119,120]也可以看做是混合-判别学习模型。
Jain等人[121]把分类器分为基于相似度(距离度量)的分类器、基于概率密度的分类器、基于决策边界的分类器。第一种分类器常用于目标匹配识别,其性能取决于相似度或距离度量的设计,后两种分类器基本对应于生成模型和判别模型。此外,强化学习近年来在模式识别领域得到了深入的研究和广泛的应用[122,123]。它在本质上是一种在线学习,与有监督学习的最明显区别是不需要指明目标类别的标签,只需要外界对这次分类任务完成情况给出“对”或“错”的反馈。
有关图像目标的表示与识别的文章
为了对提取的纹理图像特征进行类别的判定,需要采用分类器对测试样本和所有训练样本的特征进行相似度的分析,本章采用最近子空间分类器 [55]来识别测试样本的类别标签,其工作过程具体如下。步骤1:利用同一类别所有训练样本的特征向量,构造该类别纹理的特征子空间。步骤2:计算待识别的测试样本在每个类别特征子空间中的投影和投影残差。......
2023-06-29
我在这里主要讲两种关于字体的基础分类。这是一种拥有很高声誉的字体,它看起来十分经典。在标题处和插图编号处可以使用艺术样式的字体来增加点趣味,特别是当这些字体特别大的时候。在这种情况下,选择使用非衬线字体或者艺术字是十分合适的。根据这些特征,粗的衬线字体可以找到它们自己的定位。“display”的字样都是一些适用于标题、文章开头的字体。......
2023-06-24
目标识别系统中分类器的作用是:根据特征提取器得到的特征向量来给一个被测对象赋一个类别标记[52]。图6-8 不同样本数量和分类方法的效果实验3:特征权重对分类效果的影响采用不同的特征权重类型对分类的最终效果会有较大的影响,本章节将对布尔、绝对词频和TF-IDF三种特征权重计算方法进行实验对比。......
2023-06-28
步骤1:利用同一类别所有训练样本的特征向量,构造该类别纹理的特征子空间。因此,和常用的最近邻分类器相比,本章采用的NSC分类器能够有效避免单个离群训练样本的干扰,从而获得更加准确、稳定的待识别样本的类别标记,最终能够提高纹理图像的识别精度。......
2023-06-29
针对图像领域中的各种具体问题,目标识别所采用的研究方法和技术方案都有所区别,甚至迥然不同。所以需要将目标识别问题按照一定的标准进行分类,对具体问题进行具体分析。图像分割在静态图像识别领域也尚未得到有效解决,图像对应问题则是与模式识别和人工智能紧密相连的难题。......
2023-06-28
基于聚类分析的分类与后面几节所述的有监督学习分类的不同之处在于,它要划分的类是未知的,也就是说事先并不知晓要把目标分为哪几个具体的类别。为了达到全局最优,基于划分的聚类会要求穷举所有可能的划分。它也基于标准的统计数字自动决定聚类的数目,考虑“噪声”数据和孤立点,从而产生健壮的聚类方法。高维数据聚类分析是聚类分析中一个非常活跃的领域,同时也是一个具有挑战性的工作。......
2023-06-28
利用上面介绍的16种内插器即理想、最近邻域、双线性、三次B样条、立方卷积、小波、全相位Ⅰ型,全相位Ⅱ型(共9种)对3幅2∶1下取样图像进行重构实验,其中全相位Ⅱ型除了行列方向使用一维模板分别进行内插恢复外,又可以设计二维模板直接内插重构,因此对应的内插方式共有27种。图8-30 测试图像及谱分布以woman.bmp为例,画出各种内插结果图,其中全相位Ⅱ型只画出了双窗结果。......
2023-06-23
一个典型的图像目标识别系统如图1-1所示,主要由图像增强与变换、图像分割、图像描述、分类决策四部分构成。其鲜明的特点是输入和输出的都是图像。高层处理一般是基于知识进行推理和证实的,涉及图像或图像区域的理解,以及执行与视觉相关的识别函数[8]。图1-1 图像目标识别系统的基本框架图图像目标识别技术是延伸和扩展人的视觉功能的方式和方法,其实信息技术整体都可以认为是扩展人的信息器官功能的技术。......
2023-06-28
相关推荐