首页 历史故事利用聚类和异常值分析法识别黑点

利用聚类和异常值分析法识别黑点

【摘要】:对纽约市交通事故进行空间热点分析时,选用聚类和异常值分析法对计算出的结果进行挖掘。H区域为西35大街和36大街在第五大道与第六大道中间的路段,从中午12时至下午5时,此区域为交通事故黑点路段。

纽约交通事故进行空间热点分析时,选用聚类和异常值分析法对计算出的结果进行挖掘。根据数据计算出每个样本的局部莫兰指数,从而鉴别出具有统计显著性的热点、冷点和空间异常值。

聚类和异常值算法通过计算局部莫兰指数、Z得分等,进而得到每个时空子路段具有统计显著性的聚类类型,包括以下四种:高值(HH)聚类、低值(LL)聚类、高值主要由低值围绕的异常值(HL)和低值主要由高值围绕的异常值(LH)(田鑫,2017),并据此绘制莫兰散点图,它主要描述某一空间单元的观测变量x与其空间滞后变量Wx(即该空间单元周围单元的观测变量值的加权平均值)之间的相关关系。

莫兰散点图分为四个象限,分别对应四种不同类型的局部空间关联模式:

①右上象限(H-H):观测值大于均值,其空间滞后也大于均值;②左下象限(L-L):观测值小于均值,其空间滞后也小于均值;③左上象限(L-H):观测值小于均值,但其空间滞后大于均值;④右下象限(H-L):观测值大于均值,但其空间滞后小于均值。

选取时空子路段的加权网络核密度估计值作为样本的属性值,计算每个时空子路段的聚类类型,并选取置信度为95%的统计显著性,聚类类型为高值(HH)聚类的时空子路段为研究区域内的交通事故发生的热点区域,如图4.2所示。底图为MN17区遥感影像,黄色边框为MN17区的边界,红色部分为置信度为95%的统计显著性的黑点时空子路段,将其分成A~I共9个区域,如黑色椭圆所示。识别出的黑点在不同时刻的分布情况,可以归纳出9个黑点区域的空间特征和变化规律,如图4.3所示。

A区域为百老汇大街与西55大街和西54大街交叉口路段,此区域内有许多银行、宾馆、餐厅等建筑,此区域从早上7时开始成为交通事故黑点区域,一直延续到上午10时,即此路段区域在早上7时至10时更容易发生严重的交通事故,需要加强防范。B区域为第六大道与西51大街和西57大街交叉口路段及其支路路段,此区域从凌晨1时到凌晨6时为交通事故黑点,且其变化规律是由中心沿南北方向向两端扩散。C区域为第五大道与东55大街和东58大街交叉口及其支路路段,此区域从中午12时开始成为交通事故黑点,黑点区域从12时至下午4时从中心向周围扩散,然后从下午4时至晚上8时从周围向中心收缩,最终收缩到第五大道与东56大街和东57大街交叉口。D区域为最大的黑点区域,为百老汇大街中部路段及其支路路段,黑点中心为时代广场,从凌晨0时至3时,以百老汇大街为中心线,两边呈对称分布,从4时至7时,支路的交通事故开始减少,交通事故主要集中在百老汇大街和百老汇大街右侧支路,从上午8时至下午1时,黑点区域重心转移至百老汇大街南侧路段,从下午2时至晚上12时,黑点区域沿百老汇大街向北侧扩散。E区域为东51大街与第五大道和公园大道交叉口路段,附近是纽约中央火车站,该黑点区域只在早上8时出现。F区域为第七大道与西29大街和西35大街交叉口路段,从凌晨0时至上午9时,该黑点区域逐渐缩小,然后又在晚上8时至11时重新成为交通事故黑点。G区域为西38大街和西39大街在第五大道与第六大道中间的路段,该黑点区域主要出现在早上8时、下午3时至晚上8时以及晚上10时至次日1时。H区域为西35大街和36大街在第五大道与第六大道中间的路段,从中午12时至下午5时,此区域为交通事故黑点路段。I区域为第五大道与32大街和34大街交叉口路段、西34大街东段和东32大街西段,此区域从早上8时开始成为黑点区域,一直持续到下午5时,期间下午3时黑点区域最大。

图4.2 交通事故黑点识别结果

图4.3 黑点路段时空分布情况

分析发现,MN17区的交通事故主要集中在百老汇大街中段与第七大道所形成的椭圆区域、第七大道与西29大街和西35大街交叉口及其邻近路段等黑色椭圆区域,为道路安全管理工作上应重点关注的区域路段。应该根据时间的不同对相应时间段内的交通事故黑点区域加强疏导和管理,有所侧重地调配警力资源,完善相应路段道路设施,从而减少黑点交通事故的发生及其造成的损失,最终消灭黑点。