首页 理论教育基于R的实验:多重比较的均值分析

基于R的实验:多重比较的均值分析

【摘要】:如果F 检验的结论是拒绝H0,则说明因素A 的r 个水平有显著差异,也就是说,r 个均值之间有显著差异.但这并不意味着所有均值之间都有显著差异,这时还需要对每一对μi 和μj 作一一比较.通常采用多重t检验方法进行多重比较.这种方法本质上就是针对每组数据进行t检验,只不过估计方差时利用的是全部数据,因而自由度变大.具体地说,要比较第i组和第j 组均值,即检验H0:μi=μj,i≠j,i,j=1,2,…

如果F 检验的结论是拒绝H0,则说明因素A 的r 个水平有显著差异,也就是说,r 个均值之间有显著差异.但这并不意味着所有均值之间都有显著差异,这时还需要对每一对μi 和μj 作一一比较.

通常采用多重t检验方法进行多重比较.这种方法本质上就是针对每组数据进行t检验,只不过估计方差时利用的是全部数据,因而自由度变大.具体地说,要比较第i组和第j 组均值,即检验

H0:μi=μj,i≠j,i,j=1,2,…,r.

以下采用两个正态总体均值的t检验,取检验统计量

当H0 成立时,tij~t(n-r),所以当

时,说明μi 和μj 差异显著.定义相应的p 值为

(www.chuimin.cn)

即服从自由度为n-r的t分布的随机变量大于|tij|的概率.若p 值小于指定的α值,则认为μi 和μj 有显著差异.

多重t检验方法的优点是使用方便,但在均值的多重检验中,如果因素的水平较多,而检验又是同时进行的,则多次重复使用t 检验会增加犯第一类错误的概率,所得到的“有显著差异”的结论不一定可靠.

为了克服多重t 检验方法的缺点,统计学家们提出了许多更有效的方法来调整p 值.由于这些方法涉及较深的统计知识,这里只作简单的说明.具体调整方法的名称和参数见表6-3.调用函数“p.adjust.methods”可以得到这些参数(详见原教材的例6.1.6).

表6-3 p 值的调整方法

R 中函数“aov( )”提供了(单因素)方差分析的计算与检验,其调用格式为

aov(formula,data=NULL,projections=FALSE,qr=TRUE,contrasts=NULL,...)

说明:formula是方差分析的公式,在单因素方差分析中它表示为x~A,data是数据框.