首页 理论教育基于R的实验stackloss数据集逐步回归结果

基于R的实验stackloss数据集逐步回归结果

【摘要】:对R 自带的stackloss数据集进行逐步回归.(1)首先显示stackloss数据集的信息其中,变量为stack.loss(氨气损失百分比),Air.Flow(空气流量),Water.Temp(水温),Acid.Conc.(硝酸浓度).(2)计算变量间的相关性——相关系数>cor(stackloss)结果如下:(3)散布图矩阵>library(car)>scatterplotMatrix(st

对R 自带的stackloss数据集进行逐步回归.

(1)首先显示stackloss数据集的信息

其中,变量为stack.loss(氨气损失百分比),Air.Flow(空气流量),Water.Temp(水温),Acid.Conc.(硝酸浓度).

(2)计算变量间的相关性——相关系数

>cor(stackloss)

结果如下:

(3)散布图矩阵

>library(car)

>scatterplotMatrix(stackloss,spreed=FALSE,lty.smooth=2,

+main="Scatter plot Matrix")

结果如图4-1所示.

图4-1 散布图矩阵

从图4-1与“cor( )”的运行结果看,氨气损失百分比与空气流量、水温、硝酸浓度大致呈线性关系,可建立线性回归模型.

(4)进行回归分析

因变量为y(stack.loss,氨气损失百分比),自变量为x1 (Air.Flow,空气流量),x2(Water.Temp,水温),x3(Acid.Conc.,硝酸浓度).建立y 与x1,x2,x3回归方程

>lm.sol<-lm(stack.lossAir.Flow+Water.Temp+Acid.Conc.,data=stackloss)(www.chuimin.cn)

>summary(lm.sol)

结果如下:

以上结果说明,氨气损失百分比这一因变量对回归常数、空气流量系数、水温系数显著,而对硝酸浓度不显著.

(5)使用“step( )”函数进行逐步回归

对AIC进行观测,尽可能地使AIC达到最小,以此往复直到建立更合理与简单实用的回归模型.

>lm.step<-step(lm.sol)

结果如下:

从以上结果可以看出,将硝酸浓度删除后AIC减小为52.12,但是减小得不是很明显.删除硝酸浓度这一变量之后不能再剔除其他变量,因为一旦删除则会导致AIC的上升.

>summary(lm.step)

结果如下:

权衡这些指标与AIC值,在得出回归方程时,应考虑剔除硝酸浓度这一变量.

由此得到的回归方程为y=-50.3588+0.6712x1+1.2954x2