首页 理论教育大学物理实验:最小二乘法的线性回归

大学物理实验:最小二乘法的线性回归

【摘要】:在一元线性回归中,确定常数A和B,相当于在作图法中求直线的截距和斜率。图0-4密集分布 图0-5分散分布 方程的线性回归,用手工计算是很麻烦的。但是,不少袖珍型函数计算器上均有线性回归的计算键,计算起来极为方便,因此,线性回归的应用日益普及。

将实验结果画成图线可以形象地表示出物理规律,但图线的表示往往不如用函数表示那样明确和定量化。另外,用图解法处理数据,由于绘制图线有一定的主观随意性,同一组数据用图解法可能得出不同的结果。因此,下面将介绍一种利用最小二乘法来确定一条最佳直线的方法,从而准确地求出两个测量值之间的线性函数关系 (即经验方程)。由实验数据求经验方程,叫做方程的回归。

回归法首先要确定函数的形式。函数形式的确定一般是根据理论的推断或者从实验数据变化的趋势而推测出来。如果推断物理量y和x 之间的关系是线性关系,则可把函数写成如下形式

变量只有x一个,故称为一元线性回归。这是方程回归中最简单、最基本的问题。

回归法可以认为是用实验数据来确定方程中的待定常数。在一元线性回归中,确定常数A和B,相当于在作图法中求直线的截距和斜率。

以下讨论最简单的情况,即每个测量值都是等精度,且假定x和y值中只有y有明显的测量随机误差。如果x和y均有误差,只要把相对来说误差较小的变量作为x即可。

若实验得到的数据是

相对应的有

方程(0-1)既然是物理量y和x间所服从的规律,则在A、B确定以后,如果实验没有误差,把 (x1,y1)、(x2,y2)、…、 (xm,ym)代入方程 (0-1)时,方程的左右两边应该相等。但实际上,测量总伴随着测量误差,我们把这些测量归结为y的测量偏差,并记作ε1、ε2、…、εm。这样,把实验数据(x1,y1)、(x2,y2)、…、(xm,ym)代入方程(0-1)后,得到

图0-3 直线y=A+Bx

把式(0-3)分别对A和B 求偏微分,得

(www.chuimin.cn)

令式(0-4)等于零,得

代入式(0-5),得

解方程,得

式中 A——直线y=A+Bx的截距;

B——斜率。

用回归法处理数据最困难的问题在于函数形式的选取。函数形式的选取主要靠理论上的分析,在理论还不清楚的场合,只能靠实验数据的趋势来推测。这样,对于同一组实验数据,不同的人员可能取不同的函数形式,得出不同的结果。为了判断所得的结果是否合理,在待定常数确定以后,还需要计算一下相关系数r。对于一元线性回归,r定义为

可以证明,r的值总是在0~1之间。r值越接近1,说明实验数据点密集地分布在所求得的直线的近旁,用线性函数进行回归是合适的,如图0-4所示。相反,如果r值远小于1而接近于0,如图0-5所示,说明根据实验数据求得的直线很分散,即用线性回归不妥,必须用其他函数重新试探。

图0-4 密集分布 (r值接近于1)

图0-5 分散分布 (r值接近于零)

方程的线性回归,用手工计算是很麻烦的。但是,不少袖珍型函数计算器上均有线性回归的计算键(具体用法详见所用计算器的使用说明书),计算起来极为方便,因此,线性回归的应用日益普及。