MASS包中包含Boston数据集(波士顿房价),它记录了波士顿周围506个街区的medv(房价中位数).我们将设法用13个预测变量如rm(每栋住宅的平均房间数),age(平均房龄),lstat(社会经济地位低的家庭所占比例)等来预测medv(房价中位数).(1)首先查看Boston数据集(波士顿房价)中的变量>library(MASS)>fix(Boston)>names(Boston)结果如下......
2023-11-18
R 中自带的state.x77数据集包括Population(人口),Income(收入),Murder(犯罪率),Frost(结霜天数),Illiteracy(文盲率),Area(土地面积),Life.Exp(预期寿命)及HS Grad(高中毕业率)8个变量.
以下我们考虑(美国各州的)Murder(犯罪率)与一些因素的关系,这些因素主要包括:Population(人口),Income(收入),Illiteracy(文盲率),Frost(结霜天数)等.
(1)为了用函数“lm( )”进行回归,根据state.x77数据集建立一个数据框
states<-as.data.frame(state.x77[,c("Murder","Population","Illiteracy","Income","Frost")])
(2)为了进行回归,先计算变量之间的相关系数
用“cor( )函数”计算两个变量之间的相关系数.
>cor(states)
结果如下:
(3)以下画散布图矩阵
car包中“scatterplotMatrix( )”函数能生成散布图矩阵.
>library(car)
>scatterplotMatrix(states,spreed=FALSE,lty.smooth=2,
+main="Scat ter plot matrix")(www.chuimin.cn)
结果如图3-5所示.
图3-5包括线性、平滑曲线以及相应的边际分布(核密度和轴须图).
说明:在上述代码中,“spreed=FALSE”选项删除了残差正负均方根在平滑曲线的展开和非对称信息,“lty.smooth=2”选项设置平滑拟合曲线为虚线.
图3-5 散布图矩阵
(4)进行多元线性回归
>fit<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)
>summary(fit)
结果如下:
从以上结果可以看出,Illiteracy(文盲率)的系数在p<0.01水平下显著不为零,Frost(结霜天数)则没有显著不为零(p=0.9541).
有关应用多元统计分析:基于R的实验的文章
MASS包中包含Boston数据集(波士顿房价),它记录了波士顿周围506个街区的medv(房价中位数).我们将设法用13个预测变量如rm(每栋住宅的平均房间数),age(平均房龄),lstat(社会经济地位低的家庭所占比例)等来预测medv(房价中位数).(1)首先查看Boston数据集(波士顿房价)中的变量>library(MASS)>fix(Boston)>names(Boston)结果如下......
2023-11-18
在实验4.4.1中曾对R 自带的stackloss数据集进行了逐步回归,现在我们在实验4.4.1的基础上进行回归诊断.(1)画回归诊断图>opar<-par(mfrow=c(2,2))>plot(lm.step,1:4)>par(opar)结果如图4-2所示.图4-2回归诊断图分析4张回归诊断图(图4-2).第1张是残差图,得到的残差图呈喇叭口形状,属于异方差情况(这样的数据需要作Box-Cox......
2023-11-18
在实验2.3.1中,我们对mtcars数据集进行了展示和描述.在实验2.3.3中,我们对mtcars数据集进行了可视化.现在我们对该数据集中的变量进行回归分析.(1)不考虑变量交互项对该数据集,如果把mpg(汽车每加仑公里数)作为因变量,自变量为hp(马力)和wt(汽车重量)进行回归.>fit<-lm(mpg~hp+wt,data=mtcars)>summary(fit)结果如下:得到的回归方程为......
2023-11-18
直线回归是回归分析中最简单的一种,又称为简单回归。(一)直线回归方程散点图上呈现直线趋势的两个变数,自变量x的每一个取值都有y的一个分布与之对应。试计算其直线回归方程。为简化手续,可从以下恒等式得出:(五)直线回归的数学模型和基本假定回归分析的依据是直线回归模型。......
2023-11-17
在多数生态学文献中,回归分析方面的问题是所有应用统计学中出现频率最高的问题。R2实际上是一个相对的度量,它表示回归平方和占总平方和的百分比。......
2023-11-17
所以对于样本的回归方程,必须测定其来自无直线回归关系总体的概率大小。所以对直线回归的假设测验为H0:β=0对HA:β≠0由(6-3)式可推得回归系数b的标准误Sb为:而遵循ν=n-2的t分布,故由t值即可知道样本回归系数b来自β=0总体的概率大小。所以,对直线回归作假设测验,只需选择上述测验方法之一即可。......
2023-11-17
在实验3.3.3中我们已经研究过美国各州犯罪率与其他因素关系(state.x77数据集),在进行多元线性回归分析中,4个自变量都进入方程时,回归方程的显著性没能通过检验.以下对state.x77数据集进行逐步回归和回归诊断.(1)回顾简单多元线性回归情形>states<-as.data.frame(state.x77)>lm.sol<-lm(states$Murder~states$Populat......
2023-11-18
对R 自带的stackloss数据集进行逐步回归.(1)首先显示stackloss数据集的信息其中,变量为stack.loss(氨气损失百分比),Air.Flow(空气流量),Water.Temp(水温),Acid.Conc.(硝酸浓度).(2)计算变量间的相关性——相关系数>cor(stackloss)结果如下:(3)散布图矩阵>library(car)>scatterplotMatrix(st......
2023-11-18
相关推荐