首页 理论教育目标分类研究现状探析

目标分类研究现状探析

【摘要】:目标分类也可以称为模式分类,就是在特征空间中用统计方法把被识别对象归为某一类别。模式分类不同于经典的统计“假设检验”技术,后者根据输入数据,判断零假设H0与备择假设H1中哪一个成立。模式分类也不同于严格意义上的“图像处理”。在图像处理中,输入的是一幅图像,输出的也是图像。图像处理的步骤常包括图像旋转、对比度增强和其他能保持所有原始信息的图像变换。

目标分类也可以称为模式分类,就是在特征空间中用统计方法把被识别对象归为某一类别。基本做法是在样本训练集基础上确定某个判决规则,使按这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小[54]

模式分类不同于经典的统计“假设检验”技术,后者根据输入数据,判断零假设(或原假设、空假设)H0与备择假设H1中哪一个成立。简单地说,如果在零假设H0成立的前提下获得相应实际输入数据的概率小于某个“显著性水平”,则我们拒绝零假设H0而接受备择假设H1。模式分类也不同于严格意义上的“图像处理”。在图像处理中,输入的是一幅图像,输出的也是图像。图像处理的步骤常包括图像旋转、对比度增强和其他能保持所有原始信息的图像变换。而特征提取,比如检出图像中的峰谷点,将要损失信息。

如上所述,特征提取器输入模式,而输出特征值。特征的数目几乎总是少于用于描述完整的感兴趣的目标所需的数据量,因而在这个过程中产生信息损失。而“联想存储器”的功能是输入模式,激发出另外一类模式。这个过程也损失信息,但损失的分量远比不上模式分类器所为。简而言之,因为决策在模式判别信息中至关重要的作用,所以它本质上就是一个信息压缩过程,不可能仅仅根据已知某个模式的类别隶属就重构该特定模式。分类过程中,信息量的损失更大,将原来图像中成千上万比特像素颜色信息压缩至几个比特表示的类别信息。

另外还有3种密切相关的技术——回归分析,函数内插,和(概率)密度统计[52],也经常要用到模式识别系统中的第一个步骤,不管是显式的运用或隐含的运用。回归分析的目的是对输入数据找到合适的函数表示,常用于预测新数据的值,其中线性回归的函数形式对输入数据而言是线性的,是到目前为止最流行也是研究最透彻的一种回归形式;在函数内插中,我们已知的(或者容易得出的)是一定范围内的输入数据对应的函数值,而要解决的问题是如何求出位于这些输入点之间的数据点的函数值;密度函数估计用于求解具有某种特定特征的类别成员(样本)出现的(概率)密度问题。