首页 理论教育生态数据分析与建模:常用统计学术语详解

生态数据分析与建模:常用统计学术语详解

【摘要】:常用希腊字母表示,例如用μ表示总体平均数,用σ表示总体标准差等。实际上,统计学关心的是总体参数的大小,其依据是统计量及其性质。为了便于处理实际问题,统计学中常用若干典型的分布模式来近似的描写实际资料,如正态分布、二项分布和泊松分布等,常称为统计模型。利用统计模型进行统计分析可以简化运算。

一、总体与样本

具有相同性质的个体组成的集合称为总体(population),它是指研究对象的全体,组成总体的基本单元称为个体,也就是其中的一个研究单位称为个体(indi⁃vidual);总体按总体单位的数目可分为有限总体和无限总体。包含有有限个个体的总体称为有限总体。包含有无限多个个体的总体叫无限总体。例如在生态统计理论研究上的服从正态分布的总体、服从t分布的总体,包含一切实数,属于无限总体。从总体中抽出的若干个个体所构成的集合称为样本(sample)。构成样本的每个个体称为样本单位,样本个体数目的大小叫样本容量或大小(sample size),样本容量常记为n。通常把n<30的样本叫小样本,n≥30的样本叫大样本。

二、变量与常量

变量,或变数,指相同性质的事物间表现差异性或差异特征的数据。按其性质可分为连续变量和非连续变量(也称离散变量),连续变量可以有任何小数出现;非连续变量只有整数出现。变量可以是定性的,也可以是定量的。

常量,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的,如总体平均数、标准差、变异系数等。

三、参数与统计数

参数(parameter),也称参量,是对一个总体特征的度量。常用希腊字母表示,例如用μ表示总体平均数,用σ表示总体标准差等。

统计数(staistic),也称统计量,是描述样本特征的数量。常用英文字母表示,例如用表示样本平均数,用S表示样本标准差等。

统计学中把总体的指标称为参数,根据样本变量值计算出来的指标称为统计量。实际上,统计学关心的是总体参数的大小,其依据是统计量及其性质。

同一总体的个体彼此之间的差异有一定的规律性。通常用变量取值的分布来全面反映这种规律性。为了便于处理实际问题,统计学中常用若干典型的分布模式来近似的描写实际资料,如正态分布、二项分布和泊松分布等,常称为统计模型。利用统计模型进行统计分析可以简化运算。

四、效应与互作

通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。

例如:小麦亩产原来400 kg,新品种亩产450 kg,则效应值为50 kg/亩;高血压病人原来180 mm汞柱,吃降压药后为130 mm汞柱,效应值为-50 mm汞柱;某人体重原来60 kg,经减肥后为55 kg,效应值为-5 kg。

互作(interaction),又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。(www.chuimin.cn)

例如:

田间施肥试验,各处理如下:

原因:氮肥和磷肥相互作用引起的正效应,效应表达如下:

氮肥(45)+磷肥(30)+氮肥×磷肥(15)=90(kg)。

五、误差与错误

随机误差,也叫抽样误差(sampling error)。这是由于试验中无法控制的内在和外在的偶然因素所造成的试验结果与真实结果之间的差异。一般来讲,由于试验条件、管理措施等尽管在试验中力求一致,但也不可能达到绝对一致,所以随机误差是偶然性的,在试验中,即使十分小心也是不可避免的。整个试验过程中涉及的随机波动因素越多,试验的环节愈多,时间愈长随机误差发展的可能性及波动程度便愈大。如果通过良好的试验设计、正确的试验操作,增加抽样或试验次数,随机误差可能减小,但不可能完全消灭。统计上的试验误差一般都指随机误差,随机误差越小,试验精确性越高。

系统误差,也叫片面误差(lopsided error),是由于试验处理以外的其他条件明显不一致所产生的带有倾向性的或定向性的偏差。主要由一些相对固定的因素引起,例如仪器调校的差异、各批次药品间的差异等。理论上,系统误差是可以通过实验条件及试验过程的仔细操作而控制的。实际上一些主要的系统性偏差较易控制,而有些细微偏差较难控制。一般研究工作在分析数据时将误差中的一些主要偏差排除后,剩下的归结为随机误差,因而估计出来的随机误差可能比预想的要大。系统误差影响试验的准确性,只要有认真负责的态度和细心的工作作风是完全可以尽量避免的。

错误(mistake),是指在试验过程中,由于人为作用引起的差错。如测量仪器不准,试剂配制不当,试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的,只要以认真负责的态度和细心的工作作风,在试验中是完全可以避免的。原则上,试验中是不允许出现错误的。

六、准确性与精确性

准确性(accuracy),也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。设某一试验指标或性状的真值为μ,观测值为x,若x与μ相差的绝对值|x-μ|越小,则观测值x的准确性越高,反之则低。

精确性(precision),也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。若观测值彼此接近,即任意两个观测值xi、xj相差的绝对值|xi-xj|越小,则观测值精确性越高,反之则低。

准确性不等于精确性。准确性是说明测定值对真值符合程度的大小,而精确性是说明多次测定值的变异程度大小。

调查或试验的准确性、精确性合称为正确性。