首页 理论教育基于互信息法的特征选择方案

基于互信息法的特征选择方案

【摘要】:利用互信息法选择特征的基本原则是选择类别相关的特征,同时排除冗余的特征。因此,基于互信息的特征选择一般遵循这样一种模式:在顺序前向搜索中寻找与类别互信息最大而与前面已选特征互信息最小的特征项。在目标分类中可以简单认为:互信息越大,特征ti和类别Cj共现的程度越大。那么,ti和Cj的互信息可以由下式计算:式中,A、B、C、D的含义和6.4.3节中约定的完全相同。

根据熵的连锁规则,有

978-7-111-38182-2-Chapter06-28.jpg

因此,

978-7-111-38182-2-Chapter06-29.jpg

这个差叫做XY的互信息,记作I(XY)。或者定义为:如果(XY)~p(xy),则XY之间的互信息I(XY)=H(X)-H(XY)。

互信息是一个均衡非负的信息测度,I(XY)反映的是在知道了Y的值以后X的不确定性的减少量。可以理解为Y的值透漏了多少关于X的信息量。互信息和熵之间的关系可以用图6-5表示。

978-7-111-38182-2-Chapter06-30.jpg

图6-5 互信息和熵之间的关系示意图

如果将定义中的H (X)和H (XY)展开,可得

I (XY)=H (X)-H (XY)=H (X)+H (Y)-H (XY)

978-7-111-38182-2-Chapter06-31.jpg

由于H (XX)=0,因此

978-7-111-38182-2-Chapter06-32.jpg

这一方面说明了熵之所以称为自信息的原因,另一方面说明了两个完全相互依赖的变量之间的互信息并不是一个常量,而是取决于它们的熵。实际上,互信息体现了两变量之间的依赖程度:如果I (XY)﹥﹥0,表明XY是高度相关的;如果I (XY)=0,表明XY是相互独立的;如果I (XY)﹤﹤0,表明XY是互不相关的分布。

利用互信息法选择特征的基本原则是选择类别相关的特征,同时排除冗余的特征。特征与类别之间的互信息很好地度量了特征的相关性,特征与特征之间的互信息则度量它们之间的相似性(冗余性)。因此,基于互信息的特征选择一般遵循这样一种模式:在顺序前向搜索中寻找与类别互信息最大而与前面已选特征互信息最小的特征项。

在目标分类中可以简单认为:互信息越大,特征ti和类别Cj共现的程度越大。那么,tiCj的互信息可以由下式计算:

978-7-111-38182-2-Chapter06-33.jpg

式中,ABCD的含义和6.4.3节中约定的完全相同。如果特征ti和类别Cj无关,则PtiCj)=Pti)×PCj),那么,ItiCj)=0。

为了选出对多类图像目标识别有用的特征,与上面的基于CHI统计量的处理方法类似,基于互信息法的特征选择也可以采用最大值和平均值两种实现方法:

978-7-111-38182-2-Chapter06-34.jpg