首页 历史故事线性相关性分析方法简介

线性相关性分析方法简介

【摘要】:相关性分析可以分为线性相关分析、偏相关分析、距离分析等。对交通事故与相关要素之间相关性进行计算时,由于数据不符合正态分布,所以选择Kendall相关系数、Spearman相关系数分析计算,得到Kendall及Spearman相关系数分析结果见表4.3,依次表示事故伤亡等级、日夜、季节、假期、风速、温度、天气、酒精、车速、大型车辆之间的相关系数和显著性。表4.3Kendall及Spearman相关系数分析结果

相关性分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度(孙逸敏,2007)。相关性分析可以分为线性相关分析、偏相关分析、距离分析等。

说明两个样本量为n的变量(x,y)间关系密切程度的统计指标叫相关系数,用r表示。计算线性相关系数的基本公式如下:

有三种相关系数:Pearson相关系数、Spearman相关系数、Kendall相关系数。Pearson相关系数,是对定距连续变量数据进行计算;Spearman相关系数、Kendall相关系数,当分类变量的数据或变量值的分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量值求秩。

交通事故与相关要素之间相关性进行计算时,由于数据不符合正态分布,所以选择Kendall相关系数、Spearman相关系数分析计算,得到Kendall及Spearman相关系数分析结果见表4.3,依次表示事故伤亡等级、日夜、季节、假期、风速、温度、天气、酒精、车速、大型车辆之间的相关系数和显著性

结果显示,交通事故与日夜、假期、温度、酒精、车速、大型车辆的影响是显著相关的。

表4.3 Kendall及Spearman相关系数分析结果