首页 理论教育如何设计分类器 ,从不同的角度对图像目标识别分类器进行归类

如何设计分类器 ,从不同的角度对图像目标识别分类器进行归类

【摘要】:设计分类器是目标分类的主要任务和核心研究内容之一。这种情况下,还得调用单分类器方法,将其类别设置为相似度最大的那个类别。第一种分类器常用于目标匹配识别,其性能取决于相似度或距离度量的设计,后两种分类器基本对应于生成模型和判别模型。

设计分类器是目标分类的主要任务和核心研究内容之一。分类器设计就是在训练样本集合上进行优化(如使每一类样本的表达误差最小或使不同类别样本的分类误差最小)的过程,也就是一个机器学习过程。下面将从不同的角度对图像目标识别常用的分类器进行归类,进而介绍它们的研究现状。

1.按照分类器的数目

按照分类器的数目,可以分为单分类器方法和多分类器方法。顾名思义,单分类器方法中,全部目标类别共用一个分类器,多分类器方法为每个类别设置一个分类器。但是多分类器方法会带来一个很严重的“拒识”问题。如果某个目标和全部目标类别的相似度都小于相应的阈值,就无法识别该目标。这种情况下,还得调用单分类器方法,将其类别设置为相似度最大的那个类别。所以,为每个类别设置一个分类器的方法应用并不广泛。

还有一种思路,就是用多个弱分类器来联合投票进行目标识别,采用这种思路的多分类器方法被认为是结合不同分类器的优点、克服单个分类器性能不足的一个有效途径。其核心思想是,k个专家判断的有效组合应该优于某个专家个人的判断结果。投票算法主要有两种:Bagging算法[109]和Boosting算法[110],它们都是通过对训练样本集进行重采样或加权来训练多分类器的。不过,Bag-ging算法是并行的,而Boosting算法是串行的,它们在训练每个分量分类器时,训练样本的抽取方式也有所不同。Boosting方法作为一种集成机器学习方法,通过粗糙的、不太正确的、简单的、单凭经验的初级预测方法(弱分类器),按照一定的规则(在自组织自学习的方式下设计各弱分类器的权重),最终得出一个复杂的、精确度很高的预测方法(提升分类模型来解决复杂问题)。基于Boos-ting方法有许多不同的变形,其中AdaBoost方法[111]由于算法简单、运算速度快而被广泛应用于字符识别和人脸检测等领域。

与其他学习方法对样本集或特征集进行分解不同的是,纠错输出编码(Er-ror-correcting output codes,ECOC)[112]是对类别集进行分解,通过组合多个二类分类器(这里的一类可以是一个类别子集)来实现多类分类。另外一种通过二类分类器实现多类分类的方法是把一对样本之间的关系分为“同类”(Intra-class)和“不同类”(Extra-class)两类,输入特征从两个样本提取(如两个样本对应特征的差),二类分类器的输出给出两个样本“同类”的概率或相似度,多类问题采用近邻规则进行分类。这种方法可以克服训练样本不足的问题,而且在训练后可任意增加或减少类别而不必重新训练,近年来已广泛用于人脸识别等生物特征识别问题。

2.按照分类器训练过程中的人工参与程度

按照分类器训练过程中的人工参与程度,一般可以分为有监督(Su-pervied)和无监督(Unsupervied)识别。它们从本质上的区别就在于训练数据是否有已知的类别标签。无监督识别主要用于确定两个特征向量之间的“相似度”以及合适的测度,并选择一个算法方案,基于选定的相似度测度对向量进行聚类(分组)。通常,不同的算法方案可能导致不同的结果,这一点必须由专家进行解释[31];而有监督识别可以通过学习有标签的数据,挖掘已知信息来设计分类器,能够以较小的训练集获得较高精度的模型。

对于海量的图像数据进行人工标注,浪费资源且不切实际,近年来,将标注数据和未标注数据结合起来用于目标识别受到广泛的关注,这就是半监督(Semi-supervied)识别方法[46]。Cohen[47],Yao[48]和Li[49]等学者分别将半监督识别应用到了人脸识别、航拍图像的目标检测以及图像分类等领域,取得了一些成果。

3.按照分类器的数学模型

按照分类器的数学模型,可以分为生成(Generative)方法和判别(Discrim-inative)方法。生成方法中的朴素贝叶斯(Naive Bayes)分类器[54]是根据目标属于不同类别的概率来进行分类的,它将分类器设计问题转化为概率密度估计问题,给出了最一般情况下适用的“最优”分类器设计方法,该方法对各种不同的分类器设计技术在理论上都有指导意义;在判别方法中将每个目标表示为特征向量,进而视作整个特征空间的一个点,认为不同的类别是特征空间中不同区域或子空间,因此如果能够找到一个分离函数把属于不同类别的点分来,则识别任务就完成了,这种方法不依赖于条件概率密度的知识,其中最具代表性的是神经网络(Neural Network,NNet)[113]和支持向量机(Support Vector Ma-chine,SVM)[114]

混合生成-判别学习的识别方法[115,116]近年来受到了广泛的关注。这种方法结合了生成模型和判别模型的优点,一般先是对每一类模式建立一个生成模型(概率密度模型或结构模型),然后用判别学习准则对生成模型的参数进行优化。学习的准则可以是生成模型学习准则(如最大似然准则)和判别学习准则(如条件似然度)的加权组合[117,118]。结合判别学习的贝叶斯网络[119,120]也可以看做是混合-判别学习模型。

Jain等人[121]把分类器分为基于相似度(距离度量)的分类器、基于概率密度的分类器、基于决策边界的分类器。第一种分类器常用于目标匹配识别,其性能取决于相似度或距离度量的设计,后两种分类器基本对应于生成模型和判别模型。此外,强化学习近年来在模式识别领域得到了深入的研究和广泛的应用[122,123]。它在本质上是一种在线学习,与有监督学习的最明显区别是不需要指明目标类别的标签,只需要外界对这次分类任务完成情况给出“对”或“错”的反馈。