首页 理论教育分类器选择对目标识别系统的影响及特征权重计算方法的实验对比

分类器选择对目标识别系统的影响及特征权重计算方法的实验对比

【摘要】:目标识别系统中分类器的作用是:根据特征提取器得到的特征向量来给一个被测对象赋一个类别标记[52]。图6-8 不同样本数量和分类方法的效果实验3:特征权重对分类效果的影响采用不同的特征权重类型对分类的最终效果会有较大的影响,本章节将对布尔、绝对词频和TF-IDF三种特征权重计算方法进行实验对比。

目标识别系统中分类器的作用是:根据特征提取器得到的特征向量来给一个被测对象赋一个类别标记[52]。分类器的设计方法可以分为生成(Generative)方法和判别(Discriminative)方法两类。生成方法是根据类别出现的先验概率和条件概率来估计目标的类别概率,它将分类器设计问题转化为了概率密度估计问题,其代表是朴素贝叶斯分类器(Naive Bayesian Classifier,NBC);而在判别方法中,将每个目标视为整个特征空间中的一个点,认为不同的类别是特征空间中不同的区域或子空间,需要找到一条决策边界把属于不同类别的点分开,其中最具代表性的是支持向量机(Support Vector Machine,SVM)和神经网络(Neural Network,NNet)。本章实验主要选用了朴素贝叶斯和支持向量机两种分类器,关于它们的基本原理和具体实现方法,在本书的3.5节已有介绍,此处不再赘述。

实验1:视觉单词库构造方法对比分析

为了验证利用聚类算法构造视觉单词这一途径的有效性,本章将RNN凝聚聚类算法与划分方法中的k-平均值和k-中心点聚类应用于同一样本集,并比较最终的分类效果。该实验从60幅图片(小汽车图像)中共提取出19127个局部特征(用高斯差分算子检测,并用SIFT描述子描述为128维的模式向量)用以构造视觉单词库,利用支持向量机分类器(线性核函数)对小汽车图像和建筑物图像进行分类测试,得到单词库规模为200—1800之间的正确率,该评估指标是在相等错误率(EER)下的分类效果,对图像进行向量空间模型表示时用的是词频权重

如图6-7所示,由于RNN凝聚聚类算法得到的簇相对紧致,总体来说要比划分方法中的两种聚类算法性能好。关于视觉单词库的规模,在200—800之间随着视觉单词数量的增加分类效果得到了明显的改善,在800以上凝聚聚类算法相对稳定,k-平均值和k-中心点方法则会出现波动,这是因为划分方法经常以局部最优结束。

978-7-111-38182-2-Chapter06-39.jpg

图6-7 不同视觉单词库构造方法的性能

实验2:图像数量和分类方法的效果分析

图像目标分类效果在受到视觉单词数量影响的同时,也和生成视觉单词库所用的图像数量有关。本实验从40幅图像提取出的局部特征是10411个,70幅图像得到局部特征21577个,而100幅图像的局部特征数目达到39350个。在一定规模之内,从姿态各异的图像目标中提取越多的局部特征,构造出的视觉单词库内容就更为丰富,并且相应的视觉单词(原型特征)对分类来说更有区分性。

如图6-8所示,实验采用视觉单词的数量为800个,构造视觉单词库的图像为30~100个的时候,用朴素贝叶斯算法和支持向量机分别进行分类的效果。可以看出,在达到60幅图像的规模之后,图像的增加不再带来分类效果的明显改善;该实验的结果也简单证实了支持向量机在模式分类中的优越性能。

978-7-111-38182-2-Chapter06-40.jpg

图6-8 不同样本数量和分类方法的效果

实验3:特征权重对分类效果的影响

采用不同的特征权重类型对分类的最终效果会有较大的影响,本章节将对布尔、绝对词频(TF)和TF-IDF三种特征权重计算方法进行实验对比。实验采用支持向量机(线性核函数)对8种图像目标分别进行二分类,求取每次分类的查准率和查全率。由于样本在所有类别中分布均匀,计算出的宏平均查准率和查全率等于微平均查准率和查全率。如图6-9的RPC曲线所示,该实验中布尔权重效果较差,而TF和TF-IDF权重效果相差不大。

由于用0、1来代表该视觉单词是否在图像目标中出现,布尔权重无法体现视觉单词在目标中的作用程度,因而分类效果显然不如更精确的TF方法。这从理论上讲,TF-IDF作为一种相对词频权重,应当比TF的性能好,因为TF虽然体现了视觉单词的频率,但无法体现低频视觉单词的区分能力——有些视觉单词频率虽然很高,但分类能力很弱(比如大多数目标共有的特征或背景特征),有些视觉单词虽然频率较低,但分类能力却很强。但是从实验结果可以看出,TF-IDF的效果不够理想,这一方面是因为图像目标分类中训练集的数目并不够大,本章在一次实验中训练样本只有200幅图像;另一方面很有可能是图像目标的向量空间模型表示维度较低,本章实验采用800维向量,这远远低于文本分类中所用的模式向量的维度。

实验4:特征选择对分类效果的改善

特征选择在降低模式向量维数的同时保留了对分类有用的特征,本章节将通过图像频率(IF)、χ2统计量(CHI)方法、信息增益(IG)法和互信息(MI)法对图像特征进行筛选并进行分类效果对比。实验采用支持向量机(线性核函数)对图像目标进行二分类,在目标表示时用绝对词频计算特征权重,通过特征选择将视觉单词的数量从800减少至450,步长为50,测试每种方法在相等错误率(EER)下的分类正确率。如图6-10所示,在将特征维数降到600~700时大多数方法的效果最好,而总体看来基于互信息的特征选择方法性能较好。基于图像频率的特征选择方法最为简单易行,但该方法直接去除低频特征对分类效果产生不利影响。

978-7-111-38182-2-Chapter06-41.jpg

图6-9 采用不同特征权重的分类效果

978-7-111-38182-2-Chapter06-42.jpg

图6-10 特征选择后的分类性能

实验5:与相关文献的分类性能对比

近几年,国内外许多学者都在广泛关注利用局部特征进行图像目标识别这一研究方向。为了更为直观地比较Weber、Opelt等人提出的图像目标分类算法(参见参考文献[50],[127],[195]-[199])与本书提出的算法的性能差异,进行如下对比实验。为了相关算法保持一致,实验所用的摩托车和小汽车(背面视图)两类图像都选自Caltech图像库,算法的正确率是在相等错误率(EER)时计算所得的。从表6-3可以看出,与其他算法的最佳效果相比,本书算法的性能指标稍逊于Zhang提出的方法,总体看来正确率还是比较高的,可以说明本书算法的可行性。

表6-3相关文献算法与本书算法对比

978-7-111-38182-2-Chapter06-43.jpg