首页 理论教育使用Box-Cox变换改进stackloss数据集的统计分析

使用Box-Cox变换改进stackloss数据集的统计分析

【摘要】:在实验4.4.1中曾对stackloss数据集进行了逐步回归,在实验4.4.2中曾对stackloss数据集进行了回归诊断.现在我们再考虑进行Box-Cox变换使回归方程的残差满足齐性.在实验4.4.1中,从回归诊断图(图4-2)的残差图,我们看到了残差图呈喇叭口形状,属于异方差情况,数据需要作Box-Cox变换.以下进行Box-Cox变换,画3张图:第1张图为残差与预测散点图,第2张图可确定参数

在实验4.4.1中曾对stackloss数据集进行了逐步回归,在实验4.4.2中曾对stackloss数据集进行了回归诊断.现在我们再考虑进行Box-Cox变换使回归方程的残差满足齐性.

在实验4.4.1中,从回归诊断图(图4-2)的残差图,我们看到了残差图呈喇叭口形状,属于异方差情况,数据需要作Box-Cox变换.

以下进行Box-Cox变换,画3张图:第1张图为残差与预测散点图,第2张图可确定参数λ,第3张图为变换后残差与预测散点图.

>library(MASS)

>op<-par(mfrow=c(3,1),mar=0.4+c(4,4,1,1),oma=c(0,0,2,0))

>plot(fitted(lm.correct),resid(lm.correct),cex=1.2,pch=21,col=ˈredˈ,bg=ˈorangeˈ,xlab=ˈfitted Valueˈ,ylab=ˈResidualsˈ)

>boxcox(lm.correct,lambda=seq(0,2,by=0.1))

>lambda<-0.32

>Ylam<-(stack.losslambda-1)/lambda(www.chuimin.cn)

>lm.lam<-lm(YlamAir.Flow+Water.Temp);

>summary(lm.lam)

>plot(fitted(lm.lam),resid(lm.lam),cex=1.2,pch=21,col=ˈblueˈ,bg=ˈorangeˈ,xlab=ˈFitted Valueˈ,ylab=ˈResidualsˈ)

>par(op)

结果如图4-5所示.

图4-5 B1ox-Cox变换图

比较第1张图和第3张图我们可以看出,变换前后的残差有明显改进.