首页 理论教育多元回归分析:R语言中stackloss数据集的诊断

多元回归分析:R语言中stackloss数据集的诊断

【摘要】:在实验4.4.1中曾对R 自带的stackloss数据集进行了逐步回归,现在我们在实验4.4.1的基础上进行回归诊断.(1)画回归诊断图>opar<-par(mfrow=c(2,2))>plot(lm.step,1:4)>par(opar)结果如图4-2所示.图4-2回归诊断图分析4张回归诊断图(图4-2).第1张是残差图,得到的残差图呈喇叭口形状,属于异方差情况(这样的数据需要作Box-Cox

多元回归分析:R语言中stackloss数据集的诊断

在实验4.4.1中曾对R 自带的stackloss数据集进行了逐步回归,现在我们在实验4.4.1的基础上进行回归诊断.

(1)画回归诊断图

>opar<-par(mfrow=c(2,2))

>plot(lm.step,1:4)

>par(opar)

结果如图4-2所示.

图4-2 回归诊断图

分析4张回归诊断图(图4-2).第1张是残差图,得到的残差图呈喇叭口形状,属于异方差情况(这样的数据需要作Box-Cox变换).第2张图是正态QQ 图,除21号点外,基本上都在一条直线上,也就是说,除21号点外,残差满足正态性.第3张图是标准差的平方根与预测值的散点图,21号点的值大于1.5,这说明21号点可能是异常值点(在95%的范围外).第4张图给出了Cook距离,从图上来看,21号点的Cook距离最大,这说明21号点可能是强影响点(高杠杆点).(www.chuimin.cn)

(2)剔除异常观测值(21号数据)后再进行回归

>newstackloss<-stackloss[-21,]

>lm.correct<-lm(stack.lossAir.Flow+Water.Temp,data=newstackloss)

>summary(lm.correct)

结果如下:

由此得到的回归方程为y=-51.076+0.863x1+0.8033x2