首页 理论教育基于R的多元统计分析:Bayes判别

基于R的多元统计分析:Bayes判别

【摘要】:根据上面的叙述,要选择样本空间Ω 的一个划分R1 和R2=Ω-R1,使得平均误判损失ECM 达到极小.定理8.3.1 极小化平均误判损失式的区域R1 和R2 为说明:当时,即x 为边界点,它可以归入R1 和R2中的任何一个,为了方便就将它归入R1.根据定理8.3.1,得到两总体的Bayes判别准则:应用此准则时仅需要计算:新样本点x0=(x01,x02,…

根据上面的叙述,要选择样本空间Ω 的一个划分R1 和R2=Ω-R1,使得平均误判损失ECM 达到极小.

定理8.3.1 极小化平均误判损失式(8.3.1)的区域R1 和R2

说明:当时,即x 为边界点,它可以归入R1 和R2中的任何一个,为了方便就将它归入R1

根据定理8.3.1,得到两总体的Bayes判别准则

应用此准则时仅需要计算:

(1)新样本点x0=(x01,x02,…,x0pT 的密度函数比

(2)损失比

(3)先验概率比

损失和先验概率以比值的形式出现是很重要的,因为确定两种损失的比值(或两总体的先验概率的比值)往往比确定损失本身(或先验概率本身)要容易.以下看三种特殊情况:

(1)当=1时,有

(2)=1时,有

(3)当时,有

把上述的两总体的Bayes判别应用于正态总体Xi~Np(μi,Σi),i=1,2,分两种情况讨论.

(1)Σ1=Σ2=Σ,Σ>0

此时Xi 的密度函数为(www.chuimin.cn)

定理8.3.2 设总体Xi~Np(μi,Σi),i=1,2,其中Σ>0,则使平均误判损失极小的划分为

其中,

如果μ1,μ2 和Σ 未知,用样本的均值与协方差矩阵来(估计)代替:

其中,

对于待判样本x,其判别函数定义为

其中,

得到的判别函数

称为Anderson 线性判别函数,判别的规则为

其中,β=

(2)Σ1 ≠Σ21>0,Σ1>0

由于误判损失极小化的划分依赖于密度函数之比或等价于,把协方差矩阵不等的两个多元正态密度函数代入这个比值后,包含的因子不能消去,而且fi(x)的指数部分也不能组合成简单的表达式,因此,Σ1 ≠Σ2 时,根据定理8.3.1可以得到判别区域:

其中,

显然,判别函数W(x)是关于x 的二次函数,它比Σ1=Σ2 的情形要复杂得多.如果μi 和Σi 未知,仍然可以采用其估计来代替.

对于多总体情形,也要讨论各类的协方差矩阵相等与不等两种情况,与两个总体情形类似.