首页 理论教育气象经济学:四步Logistic建模及样本测试结果

气象经济学:四步Logistic建模及样本测试结果

【摘要】:将上面得到的4个公因子作为变量,进行Logistic回归。同样,H4的显著性为0.204,也没有通过检验,说明在Logistic方程中的该气压因子变量与因变量之间没有显著关系。在模型拟合之前,高于交通事故发生众数值,p1和p2赋值为1,否则取0。根据所得到的logistic方程,以0.5为最佳判定点对原始数据进行回判判定,如果得到的p1和p2值大于0.5,判定交通事故发生,否则判定交通事故不发生。得到Logistic回归的判定结果见表4-13。

将上面得到的4个公因子作为变量,进行Logistic回归。这里选择全部纳入法(Enter)作为变量进入模型的方式,即将所有的自变量全部纳入回归(Ingo 2002)。最终得到如下结果(表4-12)。其中,B表示计算得到的回归系数估计值;SE表示回归系数的标准误差,反映的不是变量的实际误差,而是对变量列可靠性的估计,反映了数据的离散程度(宁敏东1994);Wald表示Wald检验值,该统计量是用来检验偏回归系数显著程度的,值越大表明该自变量的作用越显著;Sig表示显著性水平,给定显著性概率α=0.1,则1-α表示置信水平,表示以90%的可靠度保证真值落在某一区间;给定显著性概率α=0.05,则95%表示置信水平,表示以95%的可靠度保证真值落在某一区间。

通过表4-12可以看到,F1的显著性为0.443,没有通过检验,说明在Logistic方程中的该温度因子变量与因变量之间没有显著关系。同样,H4的显著性为0.204,也没有通过检验,说明在Logistic方程中的该气压因子变量与因变量之间没有显著关系。因此,在构建方程时舍弃这两个公因子。

表4-12 进入Logistic回归方程的变量

**表示通过5 %的显著性检验,*表示通过10 %的显著性检验。

从而得到预警模型为

即为

在以上公式中,p1以及p2表示由于春夏和秋冬半年的由于气象条件影响发生交通事故的概率,Fi(i=1,…,4)和H j(j=1,…,4)分别表示用来拟合模型的公因子得分。在模型拟合之前,高于交通事故发生众数值,p1和p2赋值为1,否则取0。根据所得到的logistic方程,以0.5为最佳判定点对原始数据进行回判判定,如果得到的p1和p2值大于0.5,判定交通事故发生,否则判定交通事故不发生。

选取2005年3月到2006年4月的交通事故发生起数作为测试样本,其中2005年4月—9月为春夏半年,共计183个样本,2005年10月—2006年的3月为秋冬半年,共计182个样本。得到Logistic回归的判定结果见表4-13。

表4-13 测试样本的分类表

表4-13中预测数表示按照测试样本高于众数赋值为1,低于众数赋值为0,按照模型所预测得出0和1值。可以看到,在春夏半年中,在96个低于事故发生平均水平的样本中,有2个被错判,判定正确率为97.96%;在48个高于事故发生平均水平的样本中,有37个被错判,判定正确率为56.47%,总体正确率达到78.69%。而在秋冬半年中,在99个低于事故发生平均水平的样本中,有4个被错判,判定正确率为96.12%;在50个高于事故发生平均水平的样本中,有29个被错判,判定正确率为63.29%,总体正确率达到81.87%。道路交通受很多因素影响,比如路况、车流量、车况、司机技术及状态等,交通事故的发生具有复杂的特性和随机性,本书考察的这些气象变量还不足以描述交通事故的本质特征,但该模型仍然显示出较好的预测正确率,其中,对秋冬半年的预测准确率要高于春夏半年。