首页 理论教育生物统计实训:一元线性回归应注意问题

生物统计实训:一元线性回归应注意问题

【摘要】:回归分析和相关分析已广泛运用于动物科学类专业的科研工作中,但是却很容易被误用或对结果作出错误的解释。如果不以一定的生物科学依据为前提,把风马牛不相及的资料随意凑到一块作回归或相关分析,那将是根本性的错误。就是说,要考虑到回归系数、相关系数等这些统计数的适用范围。一个显著的线性相关系数或回归系数亦并不意味着x和y的关系必为线性,因为它并不排斥有能够更好地描述x和y关系的非线性方程的存在。

回归分析和相关分析已广泛运用于动物科学类专业的科研工作中,但是却很容易被误用或对结果作出错误的解释。为了正确地应用回归分析和相关分析这一类分析分法,必须注意以下几点:

(1)回归分析和相关分析毕竟是处理变量间关系的数学方法,在将这些方法应用于畜牧、水产、兽医科学研究时要考虑到动物本身的客观实际情况。例如,变量间是否存在相关以及在什么条件下会发生什么相关,求出的回归方程是否有实际意义,回归直线是否可以延伸,某性状作为自变量或依变量的确定等等,都必须由动物学科的专业知识来决定,并且还应回到本专业实践中去检验。如果不以一定的生物科学依据为前提,把风马牛不相及的资料随意凑到一块作回归或相关分析,那将是根本性的错误。

(2)由于回归和相关所表示的是变量间的统计关系,因此通过统计分析所求出的数量性指标或数学表达式,往往带有所产生的那个群体或样本的特异性而并不具有通用的性质。就是说,要考虑到回归系数、相关系数等这些统计数的适用范围。

(3)必须严格控制被研究的两个变量以外的各个变量的变动范围,使之尽可能为固定的常量。这是因为在动物科学类科学研究和实际生产中,各种因素有着复杂的相互联系和相互制约关系,一个因素的变化常常受到许多因素的影响。例如畜禽生产性能的高低,就受到品种、饲养管理、温度、湿度等因素的影响。这种情况下,选择两个变量进行回归、相关分析,如果其余变量都在变动,就不可能获得这两个变量的比较真实的关系。(www.chuimin.cn)

(4)为了提高回归和相关分析的准确性,两个样本的容量一般不应小于5,且使x变量的取值范围尽可能地大一些。

5.一个不显著的相关系数并不一定意味着x和y没有关系,而只能说明x和y没有显著的线性关系。一个显著的线性相关系数或回归系数亦并不意味着x和y的关系必为线性,因为它并不排斥有能够更好地描述x和y关系的非线性方程的存在。

6.一个显著的回归并不一定具有实践上的预测意义。如一个资料x、y两个变量间的相关系数r=0.50,在df=24时,r0.01(24)=0.496,r>r0.01(24),表明相关系数极显著。而r2=0.25,表明x变量或y变量的总变异能够通过y变量或x变量以线性回归的关系来估计的比重只占25%,其余75%的变异无法借助线性回归关系来估计。