首页 理论教育一元线性回归模型的估计和检验:应用统计学中的成果

一元线性回归模型的估计和检验:应用统计学中的成果

【摘要】:对两个具有线性关系的变量,配合线性回归方程,并根据自变量的变动来测定因变量平均发展趋势的分析方法,称为一元线性回归分析,也称简单直线回归分析。(三)一元线性回归分析的特点两个变量的地位不是对等关系。估计的结果表明,该社区居民月消费支出随可支配收入的增加而增加。估计的结果表明,该地交通事故数随机动车辆数的增加而增加。

在相关图分析的基础上,可以选择一定的回归方程式进行定量分析。对两个具有线性关系的变量,配合线性回归方程,并根据自变量的变动来测定因变量平均发展趋势的分析方法,称为一元线性回归分析,也称简单直线回归分析。它是回归分析中最基本、最常用的方法。

(一)构建一元线性回归方程应具备的条件

一般情况下,构建一元线性回归方程应具备以下几个条件。

1.现象间存在数量上的相互依存关系

只有当两个变量存在比较密切的相关关系时,所构建的回归方程才有意义,用此进行分析和预测才有价值。

2.现象间存在线性相关关系

一元线性回归方程在图形上表现为一条直线。因此,只有当两个变量的相关关系表现为直线相关时,所配合的直线方程才是对客观现实的真实描述,才可用此进行统计分析。如果现象间的相关关系表现为曲线,却配合为直线,就必然会得出错误的分析结论。

3.具备一定数量的变量观测值

一元线性回归方程是根据自变量和因变量的样本观测值求得的,因此,变量x和变量y都应有一定数量的对应观测值,这是构建直线方程的依据。如果观测值太少,受随机因素的影响较大,就不易观察出现象间的变动规律性,所求出的回归方程也就没有意义。

(二)一元线性回归方程

设x为自变量,y为因变量,y与x之间存在某种线性关系,其一元线性回归方程为:

式中,b0和b1是两个待定参数,也称回归系数。其中b0是直线在y轴上的截距,当x=0时,=b0;b1是直线的斜率,它表明自变量增加(或减少)一个单位,因变量相应增加(或减少)多少。当b1>0时,x与y为正相关;当b1<0时,x与y为负相关

(三)一元线性回归分析的特点

(1)两个变量的地位不是对等关系。在进行回归分析时,必须根据研究目的确定哪个变量是自变量、哪个变量是因变量。

(2)因变量为随机变量;而自变量为非随机变量,是可以预先给定或控制的变量。

(3)回归方程可以利用自变量的给定值来推算因变量的相应值,它反映的是自变量与因变量之间的具体变动关系。

(4)回归系数b1可正可负,正号说明两变量为正相关;负号说明两变量为负相关。

(四)OLS估计

估计方程的回归系数有许多方法,其中使用最广泛的是最小平方法(Ordinary Least Square,OLS),下面我们采用最小平方法来估计方程的回归系数。

最小平方法的中心思想,是通过数学方程配合一条较为理想的趋势线,这条趋势线必须满足两个条件:原数列的观测值与方程的估计值的离差平方和为最小;原数列的观测值与方程的估计值的离差总和为零。

现以公式表示如下。

式中,y代表原数列的观测值,代表回归估计方程的估计值。

,根据极值原理,为使Q具有最小值,对b0和b1分别求偏导数,并令其等于零,即:

整理出两个标准方程:

对上面两等式联立求解,解出回归系数b0、b1分别为:

【例5-3】根据表5-2居民家庭的月可支配收入和消费支出的调查资料,进行一元线性回归分析,确定回归方程。

根据消费支出与可支配收入之间的关系,令消费支出为因变量y,可支配收入为自变量x,直线回归方程参数计算如表5-8所示。

表5-8 居民家庭的月可支配收入和消费支出的回归方程参数计算

所以,回归方程为=-0.208 9+0.717 7x

上式说明,该社区2019年居民月可支配收入x每增加100元,消费支出y就平均增加71.77元;在月可支配收入x=0的情况下,消费支出为-0.208 9元。根据这个方程,可以估计该社区居民月可支配收入对消费支出的影响。估计的结果表明,该社区居民月消费支出随可支配收入的增加而增加。

【例5-4】某地近几年机动车辆数与交通事故数的统计资料如表5-9所示。请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果具有线性相关关系,求出线性回归方程。

表5-9 某地近几年机动车辆数与交通事故数统计资料

这里,我们可以借助Excel,根据数据得到散点图,如图5-2所示,直观判断散点在一条直线附近,故具有线性相关性。

图5-2 机动车辆数与交通事故数的散点图

严格来讲,应先计算出相关系数R,再根据计算结果判断是否可进行回归分析,在相关关系显著的情况下再计算出回归方程,以下为严格的解题过程。

根据交通事故数与机动车辆数之间的关系,令交通事故数为因变量y,机动车辆数为自变量x,相关系数计算如表5-10所示。

表5-10 机动车辆数与交通事故数的相关系数计算

续表

计算结果说明,交通事故数与机动车辆数之间存在高度正相关关系。所以,x和y线性相关关系显著,可进行回归分析。

再依据表5-10中的数据,可以计算出b1和b0,进而得到线性回归方程。

所以,回归方程为=-1.024 1+0.077 4x

上式说明,该地近几年机动车辆数x每增加1 000辆,交通事故数y就平均增加0.077 4千辆。根据这个方程,可以估计该地机动车辆数对交通事故数的影响。估计的结果表明,该地交通事故数随机动车辆数的增加而增加。