首页 理论教育如何利用线性判别式进行分类?

如何利用线性判别式进行分类?

【摘要】:判别函数是决策论模式识别方法中重要的基本方法,许多其他决策论识别方法也可用判别函数来研究。,c,i≠j最简单的判别函数是线性判别函数,它是所有模式特征的线性组合。所谓设计线件分类器,就是利用训练样本集建立线性判别函数式。建立判别函数式的过程,实际上就是寻找最好权值的过程。这样就获得了每个类别的线性判别函数,对于未知类别的样本Y,只要计算gi,然后根据gi值和式就可以判断Y所属的类别。

判别函数是决策论模式识别方法中重要的基本方法,许多其他决策论识别方法也可用判别函数来研究。

对于n维空间中的c个模式类别各给出一个由n个特征组成的单值函数,这叫做判别函数。在c类的情况下,共有c个判别函数,记为g1(X),g2(X),…,gc(X),对应于模式类ω1,ω2,…,ωc

作为判别函数,gi(X)应具有判别性质[95]。假如一个模式X属于i类,则有:

gi(X)>gj(X),i,j=1,2,…,c,i≠j (2.16)

而如果这个模式在第i类和第j类的分界面上,则有:

gi(X)=gj(X),i,j=1,2,…,c,i≠j (2.17)

最简单的判别函数是线性判别函数,它是所有模式特征的线性组合。对于第i类模式,它可表达为:

gi(X)=λi1x1i2x2+…+λinxni0,i=1,2,…,c (2.18)

λij是特征的系数,称为权。式子(2.18)说明,每个特征对于判别函数作出不同的贡献,权可以看做其贡献的大小。

所谓设计线件分类器,就是利用训练样本集建立线性判别函数式。建立判别函数式的过程,实际上就是寻找最好权值的过程。如前所述,最好的结果往往出现在准则函数的极值点上,设计线性分类器的问题就转化为利用训练样本集寻找准则函数极值的问题。设计线性分类器的主要步骤可概括如下[96]

(1)要有一组具有类别标志的样本集。

(2)要根据实际情况确定一个准则函数J。

(3)用最优化技术求出准则函数的极值解。

这样就获得了每个类别的线性判别函数,对于未知类别的样本Y,只要计算gi(Y),然后根据gi(Y)值和式(2.16)就可以判断Y所属的类别。