首页 理论教育使用矩法估计总体参数的抽样误差优化

使用矩法估计总体参数的抽样误差优化

【摘要】:在X3.3中学习了参数估计的矩法公式,能否将其计算的样本统计参数作为总体统计参数的估计值,将取决于估计的抽样误差。进一步指出,式是从许多同容量样本的平均意义上来衡量矩法估计总体参数的抽样误差,对于一个具体样本的抽样误差则可能小于这些误差,也可能大于这些误差,不是公式所能计算的。

在X3.3中学习了参数估计的矩法公式,能否将其计算的样本统计参数作为总体统计参数的估计值,将取决于估计的抽样误差

所谓抽样误差,是指由随机抽样引起的样本统计参数与总体统计参数的离差。

在讨论之前,先说明一下符号。下面在有可能对样本均值、变差系数、偏态系数与总体相应这些参数发生混淆时,对总体参数将加下脚标“z”,如img、Cvz、Csz,而样本参数则不带脚标。但在不致混淆的场合,为简单方便起见,样本或总体的均值、变差系数、偏态系数均记为img、Cv、Cs,希望从上下文的含义上予以区分。

在讨论之前,先说明一下符号。下面在有可能对样本均值、变差系数、偏态系数与总体相应这些参数发生混淆时,对总体参数将加下脚标“z”,如img、Cvz、Csz,而样本参数则不带脚标。但在不致混淆的场合,为简单方便起见,样本或总体的均值、变差系数、偏态系数均记为img、Cv、Cs,希望从上下文的含义上予以区分。

设总体均值为img,当总体未知时,对于某一具体样本,其样本均值与总体均值的离差img是未知的。因此,考察一种估计方法的抽样误差的大小,无法由某一具体样本来衡量。

设总体均值为img,当总体未知时,对于某一具体样本,其样本均值与总体均值的离差img是未知的。因此,考察一种估计方法的抽样误差的大小,无法由某一具体样本来衡量。

为了说明衡量方法,首先应建立一个概念,即随机抽取同容量n的许多不同样本,样本均值将随抽取的样本的不同而不同,故从一般样本出发,样本均值也是随机变量,记为img的概率分布称为抽样分布。数理统计中可以证明,随机变量img的取值的平均值即为总体均值img。因此,img的离散特征参数均方差img反映了随机变量img取值相对于img的平均离差,故可以用样本均值的均方差img从平均意义上来衡量样本均值估计总体均值的抽样误差。也可理解为许多同容量样本参数与总体参数离差的平均情况。由于度量的是误差,故称img为样本均值的均方误。img越小,表明img的取值imgimg两侧徘徊的幅度小,因而由img估计img越有效,从平均意义上抽样误差越小。

为了说明衡量方法,首先应建立一个概念,即随机抽取同容量n的许多不同样本,样本均值将随抽取的样本的不同而不同,故从一般样本出发,样本均值也是随机变量,记为img的概率分布称为抽样分布。数理统计中可以证明,随机变量img的取值的平均值即为总体均值img。因此,img的离散特征参数均方差img反映了随机变量img取值相对于img的平均离差,故可以用样本均值的均方差img从平均意义上来衡量样本均值估计总体均值的抽样误差。也可理解为许多同容量样本参数与总体参数离差的平均情况。由于度量的是误差,故称img为样本均值的均方误。img越小,表明img的取值imgimg两侧徘徊的幅度小,因而由img估计img越有效,从平均意义上抽样误差越小。

同理,可用img分别表示样本变差系数Cv、偏态系数Cs的均方误。

样本参数的均方误与总体分布有关。当总体为皮尔逊Ⅲ型分布(在X3.5中介绍)时,根据数理统计方法可推导出采用矩法估计总体参数时样本参数的均方误公式为

式中 σ、Cvz、Csz——总体的均方差、变差系数和偏态系数;

n——样本容量

需要指出,一些教科书中,认为式(X3.17)中的参数为样本参数是错误的[2-3]

进一步指出,式(X3.17)是从许多同容量样本的平均意义上来衡量矩法估计总体参数的抽样误差,对于一个具体样本的抽样误差则可能小于这些误差,也可能大于这些误差,不是公式所能计算的。但由式(X3.17)可以得到以下两点结论:

(1)样本参数的均方误随样本容量n的增大而减小,即一般情况下,样本系列越长,抽样误差越小,样本对总体的代表性越好。因此,在后续工作任务中将要介绍加大样本容量、提高样本系列代表性的有关途径。

(2)在给定总体参数、样本容量的情况下,利用式(X3.17)计算各个总体参数的抽样误差得知,矩法估计总体参数,一般均值和变差系数的抽样误差较小,偏态系数的抽样误差太大,例如,即使样本容量n=100,当Cvz=0.1,Csz=2Cvz=0.2时,Csz的抽样误差σCs=0.252,用相对误差表示为126%。

综上所述,有鉴于矩法估计总体参数的抽样误差的情况以及式(X3.15)、式(X3.16)存在系统偏差,故频率计算中,通常不直接使用矩法估计总体参数,特别是Cs,一般不采用式(X3.16)计算,而需配合其他途径求得总体参数的估计值,当前我国广泛使用适线法,将在X3.6中介绍。

同理,可用img分别表示样本变差系数Cv、偏态系数Cs的均方误。

样本参数的均方误与总体分布有关。当总体为皮尔逊Ⅲ型分布(在X3.5中介绍)时,根据数理统计方法可推导出采用矩法估计总体参数时样本参数的均方误公式为

式中 σ、Cvz、Csz——总体的均方差、变差系数和偏态系数;

n——样本容量。

需要指出,一些教科书中,认为式(X3.17)中的参数为样本参数是错误的[2-3]

进一步指出,式(X3.17)是从许多同容量样本的平均意义上来衡量矩法估计总体参数的抽样误差,对于一个具体样本的抽样误差则可能小于这些误差,也可能大于这些误差,不是公式所能计算的。但由式(X3.17)可以得到以下两点结论:

(1)样本参数的均方误随样本容量n的增大而减小,即一般情况下,样本系列越长,抽样误差越小,样本对总体的代表性越好。因此,在后续工作任务中将要介绍加大样本容量、提高样本系列代表性的有关途径。

(2)在给定总体参数、样本容量的情况下,利用式(X3.17)计算各个总体参数的抽样误差得知,矩法估计总体参数,一般均值和变差系数的抽样误差较小,偏态系数的抽样误差太大,例如,即使样本容量n=100,当Cvz=0.1,Csz=2Cvz=0.2时,Csz的抽样误差σCs=0.252,用相对误差表示为126%。

综上所述,有鉴于矩法估计总体参数的抽样误差的情况以及式(X3.15)、式(X3.16)存在系统偏差,故频率计算中,通常不直接使用矩法估计总体参数,特别是Cs,一般不采用式(X3.16)计算,而需配合其他途径求得总体参数的估计值,当前我国广泛使用适线法,将在X3.6中介绍。